❤️ Helfen Sie noch heute, unser LibreOffice Forum zu erhalten! ❤️
Unterstützen Sie das LibreOffice-Forum und helfen Sie uns, unser Ziel für 2025 zu erreichen!

🍀 Jeder Beitrag zählt – vielen Dank für Ihre Unterstützung!🍀
Mit Ihrer Spende sichern Sie den Fortbestand, den Ausbau und die laufenden Kosten dieses Forums. 🌱


❤️ DANKE >> << DANKE ❤️

>> Dank Ihrer Unterstützung -> Keine Werbung für alle registrierten LibreOffice-Forum User! <<
🤗 Als Dankeschön werden Sie im Forum als LO-SUPPORTER gekennzeichnet. 🤗

Absatzzeichen finden, vor denen kein Satzzeichen steht

WRITER hat alles, was Sie von einer modernen, voll ausgestatteten Textverarbeitung erwarten.
Antworten
Dr. Seltsam
Beiträge: 1
Registriert: So 24. Mär 2019, 16:15

Absatzzeichen finden, vor denen kein Satzzeichen steht

Beitrag von Dr. Seltsam » So 24. Mär 2019, 16:32

Bei der Nachbearbeitung eingescannter und OCR-gewandelter Bücher ist leider eine aufwändige manuelle Nachbearbeitung notwendig. Häufig gibt es ein Absatzteichen, obwohl der Text im nächsten Absatz weitergeht. Es wäre eine große Hilfe, wenn ich solche Fälle mit der Suchfunktion direkt finden könnte. Das müsste doch mit Regulären Ausdrücken irgendwie gehen. Vielleicht kann mir da jemand helfen?

Interessant wäre auch, Bindestriche vor einem Absatzzeichen auswerten zu können. Solche Fälle muss man sich gezielt ansehen ob es eine Silbentrennung ist, oder ob es danach groß weiter geht (=Doppelwort, wo der Bindestrich bleiben muss).

Benutzeravatar
miesepeter
* LO-Experte *
Beiträge: 2158
Registriert: So 19. Dez 2010, 18:16
Wohnort: Bayern

Re: Absatzzeichen finden, vor denen kein Satzzeichen steht

Beitrag von miesepeter » So 24. Mär 2019, 20:53

Dr. Seltsam hat geschrieben:
So 24. Mär 2019, 16:32
Häufig gibt es ein Absatzteichen, obwohl der Text im nächsten Absatz weitergeht. Es wäre eine große Hilfe, wenn ich solche Fälle mit der Suchfunktion direkt finden könnte. Das müsste doch mit Regulären Ausdrücken irgendwie gehen.
Es gibt natürlich beim Scannen mit OCR auch den Fall, dass nach einer Interpunktion ein Leerzeichen steht...

Hinweis: Mein Code bezieht sich auf den Einsatz von SUCHEN&ERSETZEN und AltSearch.oxt 1.4.2 (getestet mit LO 6.2.0.3).

Wie finde ich letzten Buchstaben/Leerzeichen vor einem Absatzendezeichen

Code: Alles auswählen

[a-z|A-Z| ]{1}$
oder
([a-z|A-Z| ]{1}$)
Ein Problem ist: Wie kann ich das Absatzendezeichen ersetzen (mit nichts oder mit Leerzeichen)?
Ich konnte nur mit AltSearch.oxt 1.4.2 einen Workaround finden.

SUCHEN

Code: Alles auswählen

([a-z|A-Z| ]{1}$)\p
ERSETZEN

Code: Alles auswählen

\0
oder
\0 
("gefundener Text" und nichts oder Leerzeichen: Dies ergab einen erzwungenen Zeilenwechsel; dieser könnte dann in einem weiteren Schritt ersetzt werden...)

Wie finde ich Punkt/Fragezeichen/Ausrufezeichen vor Absatzendezeichen?

Code: Alles auswählen

(\.|\?|\!)$
Wie finde ich einen Bindestrich oder Geviertstrich vor einem Absatzendezeichen?

Code: Alles auswählen

(-|–)$
Dr. Seltsam hat geschrieben:
So 24. Mär 2019, 16:32
Nachbearbeitung eingescannter und OCR-gewandelter Bücher
Ich täte mir die Arbeit nicht an. Für wenig Geld gibt's Programme wie Iris oder Finereader, die viel schneller und produktiver sind als die manuelle "Popelei".

Viel Erfolg.


An alle, die das LibreOffice-Forum gern nutzen und unterstützen wollen:


Bitte helfen Sie uns mit 7 Euro pro Monat.
Durch Ihren Beitrag tragen Sie dazu bei, unsere laufenden Kosten für die kommenden Monate zu decken.
Unkompliziert per Kreditkarte oder PayPal.
Als ein kleines Dankeschön werden Sie im LO-Forum als SUPPORTER gekennzeichnet.



Antworten