Seite 1 von 1

Suchen und ersetzen: Absatzumbruch entfernen

Verfasst: Do 10. Dez 2020, 22:10
von Mau
Liebe ExpertInnen,

ich habe eine mehrere hundert Seiten starke PDF per OCR in ODT umgewandelt.
Leider sind dabei eine ganze Reihe Zeilenumbrüche mit Silbentrennstrich in Absatzumbrüche mit Trennstrich umgewandelt worden.
Und wieder taucht dieses Problem auf, dass man zwar den Trennstrich mit dem Absatzumbruch - Reguläre Ausdrücke muss natürlich aktiviert sein - mit -$ findet, dann aber, wenn man Ersetzen leer lässt, nur der Trennstrich wegfällt, aber nicht der Umbruch.
Gibt's dafür immer noch keine Lösung?

Gruß,
Mau

Re: Suchen und ersetzen: Absatzumbruch entfernen

Verfasst: Fr 11. Dez 2020, 05:37
von miesepeter
Mau hat geschrieben:
Do 10. Dez 2020, 22:10
Gibt's dafür immer noch keine Lösung?
Meine Empfehlung ist das "Schweizer Messer für SUCHEN&ERSETZEN", AltSearch.oxt. Die Extension ist meist (!) zuverlässig, eine gewissenhafte Nachprüfung der Ergebnisse schadet in keinem Fall. ;-) - Ciao

Re: Suchen und ersetzen: Absatzumbruch entfernen

Verfasst: Fr 11. Dez 2020, 09:41
von Mau
Lieber miesepeter,

AltSearch ist wirklich ein gutes Tool. Aber bei meinem Problem versagt es auch.

Gruß,
Mau

Re: Suchen und ersetzen: Absatzumbruch entfernen

Verfasst: Fr 11. Dez 2020, 10:07
von miesepeter
Kannst du genauer erklären, worin die Probleme bestehen? Evtl. Testdatei hochladen? - Ciao

Re: Suchen und ersetzen: Absatzumbruch entfernen

Verfasst: Fr 11. Dez 2020, 11:54
von miesepeter
Mau hat geschrieben:
Do 10. Dez 2020, 22:10
-$ findet, dann aber, wenn man Ersetzen leer lässt, nur der Trennstrich wegfällt, aber nicht der Umbruch.
Das Dollarzeichen zeigt dir in diesem Fall nur an, dass sich der Trennstrich am Absatzende befindet.

Man sollte auch wissen, dass der Trennungsstrich maskiert werden muss, da er - ähnlich dem Dollarzeichen - zusätzlich eine andere Funktion innerhalb der RegEx erfüllt (Beispiel: [1-9]).

Im Altsearch.oxt beträgt somit die richtige Syntax für SUCHEN: ... und ersetzen evtl. [nichts]. Ich probierte das an einem kleinen Text aus (mehrere Absätze mit Trennungszeichen direkt vor dem Absatzendezeichen) und AltSearch.oxt beseitigte alle und es wurde daraus Fließtext.
Mau hat geschrieben:
Do 10. Dez 2020, 22:10
AltSearch ist wirklich ein gutes Tool. Aber bei meinem Problem versagt es auch.
Hältst du diese Behauptung jetzt noch aufrecht? :mrgreen:

Ciao und viel Erfolg beim weiteren Basteln!

Re: Suchen und ersetzen: Absatzumbruch entfernen

Verfasst: Fr 11. Dez 2020, 12:19
von Mau
Gerne.

Bitte sehr:
koca ren Scan 001-076.odt
(102.52 KiB) 124-mal heruntergeladen

Beispiel Z. 71/72: Nicht nur der Trennstrich hinter Al müsste entfernt werden, sondern auch der folgende Absatzumbruch, so dass der Anfang von Z. 72 auf Z. 71 heraufgezogen wird und das Wort Almanya entsteht.
Weitere Stellen findest du in ZZ. 215/216 und 590/591.

Gruß,
Mau

Re: Suchen und ersetzen: Absatzumbruch entfernen

Verfasst: Fr 11. Dez 2020, 14:40
von Mau
Lieber miesepeter,
miesepeter hat geschrieben:
Fr 11. Dez 2020, 11:54
Mau hat geschrieben:
Do 10. Dez 2020, 22:10
AltSearch ist wirklich ein gutes Tool. Aber bei meinem Problem versagt es auch.
Hältst du diese Behauptung jetzt noch aufrecht? :mrgreen:
Neeee! :oops:
Hier hat das Tool tatsächlich ein Plus verdient. Mit dem programminternen Suchen und Ersetzen funktioniert dein Code nicht. Seltsam.

Gruß,
Mau