Hallo Hans
Hans hat geschrieben:
Das ist eine komfortable Lösung, du hast das auf meine Testdatei zugeschnitten, könnte es sein dass diese Lösung bei einer anderen Datei nicht geht?
Ich hatte in meiner Antwort 7 Punkte aufgezählt. Dieses die Such- und Ersetzungsfunktionen die das jetzige Programm beherrscht und das in jeder Writer-Datei funktioniert. Voraussetzung dafür ist allerdings, das Dein OCR-Programm nicht plötzlich mit anderen Zeichen z.B. für das Pilcrow (Absatzmarke ¶ ) arbeitet. Das Pilcrow im Makro entspricht dem Unicode-Zeichencode = U+00B6. Es ist ein hexadezimaler Code; Der dezimale Code lautet = 0182
Test unter Windows:
Halte die [ALT]-Taste gedrückt und tippe in die Zehnertastatur 0182
Thema Unicode
Weiteres siehe Datei "Anleitung zur Makrverwaltung..."
Hans hat geschrieben:
Ein Problem ist mit Makro kenne ich mich überhaupt nicht aus, ich weiss nur da steht ein Programmchen dahinter. Mich da hineinarbeiten schaffe ich einfach nicht, ich kenne das, da entstehen nur Fragezeichen in mir und dann verzweifle ich fast.
Mit der Programmierung musst Du Dich nicht auskennen. Dieses habe ich für Dich erledigt. Es kann allerdings vorkommen, dass bei bestimmten Texten andere Bedingungen gelten.
Andere Satzzeichen oder andere Kodierung. Dann müsste das Makro erweitert werden.
Ich hätte die Codes ggf. etwas komplexer schreiben können, dieses würde den Code aber unübersichtlicher machen. Aus diesem Grund habe ich für jede Such- und Ersetzungsfunktion eine separate Rubrik programmiert und mit Beschreibungen/ Kommentare umrissen.
Die Rubriken beginnen immer mit diesem Kommentar:
Code: Alles auswählen
REM .........................................................…
gefolgt von der Beschreibung was in dieser Rubrik geschieht.
Daraus folgt, wenn Du in Zukunft ein Problem hast, stelle erneut ein Frage hier im Forum und lade den Code und eine Beispieldatei mit dem problematischem Text hoch. Wenn ich nicht da bin, dann findest Du sicherlich jemanden, der Dir den Code anpasst.
Hans hat geschrieben:Kann ich dieses Makro generell verwenden, wie kriege ich das getrennt-Makro und Text?
Siehe diese Datei:
Hans hat geschrieben:Mit "Suchen und Ersetzten" wollte ich das ja auch schon machen, bin aber daran gescheitert dass ich nicht die richtigen Zeichen, Symbole oder was auch immer eingetragen habe.
Ist im Prinzip schon recht mächtig, allerdings ist es erforderlich sich mit dem
Thema RegEx (regular Expressions) auseinander zusetzen.
Dies bezüglich bin ich aber auch eher ein Anfänger. Gleich wenn ich für mich schon ein paar nette Erfolge erzielt habe.
In Deinem Fall ist es ja nicht damit getan, mal eben nach einer Absatzmarke zu suchen, Du hast ein mehrfaches Problem, wie ich es schon unter Punkt 1-7 in meiner letzten Antwort beschrieben habe.
Dieses kann man u.U., vor allem wenn man sich sehr gut mit RegEx auskennt, nicht zwingend in einem Durchgang erledigt, aber zumindest stark kürzen. Nur wie?
Deshalb meine Makrolösung. Diese verwendet auch einfache RegEx-Funktionen, aber nicht für jeden Fall Deines Problems. Es ist eine simple Mischung aus RegEx-Funktionen und einfachem „Suchen und Ersetzen“. Dafür hat die LO-API eigene aufrufbare Objekte namens „SearchDescriptor“ und „ReplaceDescriptor“.
Hans hat geschrieben:Ein Rätsel ist mir ja auch wieso die Lösung mit der "Autokorrektur" nicht mehr geht bzw. zwischendurch hats wieder mal funktioniert.
Leere Absätze können hiermit gefunden werden, aber was ist mit
erzwungenen Zeilenumbrüchen?
Habe bei der Autokorrektur keine Option dazu gefunden!
Es kann auch an der verwendeten Schriftart liegen, der gültigen Zeichenkodierung (Unicode, ANSI-Standard, usw.).
Was liefert Dein OCR-Programm an LO.
Ggf. ist ein Umweg über einen Texteditor ein Weg. Z.B. beherrscht auch Notepad++ die RegEx-Funktionen und man kann den Text über das Menü Kodierung in anderen Zeichencodes umkodieren. Mit einem Makro ist dies jedoch überflüssig.
Nun, es gibt viele Wege nach Pekanbaru…
Wenn Du noch Problem hast, bin ich hier und nicht in Sumatra.
Gruß
David