🙏 Bitte helfen Sie uns das LibreOffice Forum zu erhalten. 🙏
Ihre Spende wird für die Deckung der laufenden Kosten sowie den Erhalt und Ausbau 🌱 des LibreOffice Forums verwendet.
🍀 Wir hoffen auf Ihre Unterstützung - vielen Dank!🍀
>> Dank Ihrer Unterstützung -> Keine Werbung für alle registrierten LibreOffice-Forum User! <<
🤗 Als Dankeschön werden Sie im Forum als LO-SUPPORTER gekennzeichnet. 🤗
"Manueller Spaltenumbruch" überall löschen
"Manueller Spaltenumbruch" überall löschen
Ich habe in einem Dokumenttyp jeweils mehrere Dutzend "Manuelle Spaltenumbrüche".
(Die werden bei Anzeige von nicht-druckbaren Zeichen als "Manueller Spaltenumbruch"
mit einer Linie angezeigt).
Da die Spaltenumbrüche nach einer Formatierung meist an der falschen Stelle sind,
möchte ich sie allesamt entfernen.
Suchen und Ersetzen etc.? ( \n o.ä. geht nicht).
Speichern als RTF und löschen von \column geht leider auch nicht,
da meine Dokumente im RTF ziemlich krank dargestellt werden.
Weiß jemand einen Weg?
(Die werden bei Anzeige von nicht-druckbaren Zeichen als "Manueller Spaltenumbruch"
mit einer Linie angezeigt).
Da die Spaltenumbrüche nach einer Formatierung meist an der falschen Stelle sind,
möchte ich sie allesamt entfernen.
Suchen und Ersetzen etc.? ( \n o.ä. geht nicht).
Speichern als RTF und löschen von \column geht leider auch nicht,
da meine Dokumente im RTF ziemlich krank dargestellt werden.
Weiß jemand einen Weg?
- miesepeter
- * LO-Experte *
- Beiträge: 2135
- Registriert: So 19. Dez 2010, 18:16
- Wohnort: Bayern
Re: "Manueller Spaltenumbruch" überall löschen
Danke für den Hinweis.
Ich hab's probiert, aber bei meinem Dokument ersetzt er alles, aber nicht das, was er soll
(siehe Beschreibung oben).
Ich füge das mal als Anhang bei.
Die "Manuelle Spaltenumbrüche" sieht man, wenn man nicht-druckbare Zeichen anzeigen lässt:
Jeweils am Anfang der Spalten.
Ich hab's probiert, aber bei meinem Dokument ersetzt er alles, aber nicht das, was er soll
(siehe Beschreibung oben).
Ich füge das mal als Anhang bei.
Die "Manuelle Spaltenumbrüche" sieht man, wenn man nicht-druckbare Zeichen anzeigen lässt:
Jeweils am Anfang der Spalten.
- Dateianhänge
-
- radio-today_adobe2.docx
- (86.01 KiB) 80-mal heruntergeladen
- miesepeter
- * LO-Experte *
- Beiträge: 2135
- Registriert: So 19. Dez 2010, 18:16
- Wohnort: Bayern
Re: "Manueller Spaltenumbruch" überall löschen
Hallo,
das könnte daran liegen, dass das Schriftstück aus Word-Format und evtl. vorheriger sonstiger Bearbeitung (war es ein PDF-Dokument?) zu komplex für AltSearch.oxt war. (AltSearch.oxt wird leider seit einigen Jahren nicht mehr weiterentwickelt.)
Wenn deine Zielstellung ist, die 13 Spaltenwechsel zu eliminieren, so kannst du das ja auch händisch veranlassen; sollte deine Datei länger sein (davon gehe ich aus), dann ist möglicherweise der Export nach HTML ein nützlicher Workaround, ein Wiedereinlesen als odt-Datei wäre dann einspaltig (wäre das für dich eine brauchbare Zielstellung?).
Auch das wäre kein Zuckerlecken, siehe auch deine Bemerkung über den RTF-Export.
Möglicherweise wäre ein schrittweiser OCR- oder Kopier-Vorgang bezogen auf dein Originaldokument die arbeitsintensivere, jedoch erfolgreichere Vorgehensweise.
Da der Dateiname auch Adobe beinhaltet, wäre es von Vorteil, dein bisheriges Vorgehen ausführlicher zu beschreiben; vielleicht lassen sich dann noch entsprechende Ansatzpunkte finden.
Ciao
das könnte daran liegen, dass das Schriftstück aus Word-Format und evtl. vorheriger sonstiger Bearbeitung (war es ein PDF-Dokument?) zu komplex für AltSearch.oxt war. (AltSearch.oxt wird leider seit einigen Jahren nicht mehr weiterentwickelt.)
Wenn deine Zielstellung ist, die 13 Spaltenwechsel zu eliminieren, so kannst du das ja auch händisch veranlassen; sollte deine Datei länger sein (davon gehe ich aus), dann ist möglicherweise der Export nach HTML ein nützlicher Workaround, ein Wiedereinlesen als odt-Datei wäre dann einspaltig (wäre das für dich eine brauchbare Zielstellung?).
Auch das wäre kein Zuckerlecken, siehe auch deine Bemerkung über den RTF-Export.
Möglicherweise wäre ein schrittweiser OCR- oder Kopier-Vorgang bezogen auf dein Originaldokument die arbeitsintensivere, jedoch erfolgreichere Vorgehensweise.
Da der Dateiname auch Adobe beinhaltet, wäre es von Vorteil, dein bisheriges Vorgehen ausführlicher zu beschreiben; vielleicht lassen sich dann noch entsprechende Ansatzpunkte finden.
Ciao
Re: "Manueller Spaltenumbruch" überall löschen
Das Ursprungsformat ist PDF, bei dem einige textuelle Änderungen vorgenommen werden sollen.
Mit Konvertern (nach docx oder odt) können die Änderungen dann gemacht werden
- bis auf die zu löschenden "Manuellen Spaltenumbrüche".
Das hochgeladene Dokument war nur ein Dummy, bei dem der Effekt auch auftritt;
typischerweise sind die die Dokumente viel größer. Da entfällt das manuelle Löschen.
Eine Zwischenkonvertierung zu RTF oder HTML führt leider auch nicht zum Erfolg.
Eigentlich scheint es mir aber schon eine Art Bug zu sein, wenn LO Writer die
"Manuellen Spaltenumbrüche" darstellt und kennzeichnet,
man sie aber nicht suchen/ ersetzen kann. Na-ja...
Mit Konvertern (nach docx oder odt) können die Änderungen dann gemacht werden
- bis auf die zu löschenden "Manuellen Spaltenumbrüche".
Das hochgeladene Dokument war nur ein Dummy, bei dem der Effekt auch auftritt;
typischerweise sind die die Dokumente viel größer. Da entfällt das manuelle Löschen.
Eine Zwischenkonvertierung zu RTF oder HTML führt leider auch nicht zum Erfolg.
Eigentlich scheint es mir aber schon eine Art Bug zu sein, wenn LO Writer die
"Manuellen Spaltenumbrüche" darstellt und kennzeichnet,
man sie aber nicht suchen/ ersetzen kann. Na-ja...
- miesepeter
- * LO-Experte *
- Beiträge: 2135
- Registriert: So 19. Dez 2010, 18:16
- Wohnort: Bayern
Re: "Manueller Spaltenumbruch" überall löschen
Welche Konverter benutzt du? Vermutlich müsstest du auf professionelle OCR-Software umsteigen, um bessere Ergebnisse zu erzielen. Das kostet aber ordentlich.
Da hast du wohl recht. Die Frage ist halt, ob allein die Darstellung schon eine Art Fehlinterpretation des Dokuments ist. Ich habe mal die CONTENT.XML angesehen: Ein wildes Durcheinander von "Tags", wie es sonst nur in unprofessionell erstellten Schriftstücken mit massiver harter Formatierung zu sehen ist.
- Ciao
Re: "Manueller Spaltenumbruch" überall löschen
Ich habe den online-Konverter von Adobe verwendet - der sollte es am saubersten können, dachte ich.
Aber: Er kann kein ODT erzeugen; und ist in der kostenlosen Version u.a. in der Größe beschränkt.
Konvertierungstools die ODT erzeugen, kommen mit den mir vorliegenden PDFs nicht gut zurecht.
Was das "wilde Durcheinander" in CONTENT.XML angeht, so wird das also tatsächlich von meinen
PDFs herrühren (auf die ich keinen Einfluss habe). In diesem Fall wundert mich das nicht.
Du hast OCR erwähnt.
Na-ja; im Prinzip eine Idee.
Aber das wäre ja ein wahnsinniger Aufwand (und das, obwohl der Text doch schon vorliegt).
Dann kann ich ja gleich eine "KI" verwenden, um für meine Tasse Tee eine Badewanne zu kochen.
Aber all' das ändert ja nichts an der Tatsache, dass LO-Writer "Manuelle Spaltenumbrüche"
nicht "Suchen und Ersetzen" kann. Von AltSearch (von 2007!) kann man das ja kaum erwarten.
Sackgassen everywhere.
Aber: Er kann kein ODT erzeugen; und ist in der kostenlosen Version u.a. in der Größe beschränkt.
Konvertierungstools die ODT erzeugen, kommen mit den mir vorliegenden PDFs nicht gut zurecht.
Was das "wilde Durcheinander" in CONTENT.XML angeht, so wird das also tatsächlich von meinen
PDFs herrühren (auf die ich keinen Einfluss habe). In diesem Fall wundert mich das nicht.
Du hast OCR erwähnt.
Na-ja; im Prinzip eine Idee.
Aber das wäre ja ein wahnsinniger Aufwand (und das, obwohl der Text doch schon vorliegt).
Dann kann ich ja gleich eine "KI" verwenden, um für meine Tasse Tee eine Badewanne zu kochen.
Aber all' das ändert ja nichts an der Tatsache, dass LO-Writer "Manuelle Spaltenumbrüche"
nicht "Suchen und Ersetzen" kann. Von AltSearch (von 2007!) kann man das ja kaum erwarten.
Sackgassen everywhere.
Re: "Manueller Spaltenumbruch" überall löschen
Hallo,
Ansonsten kannst du natürlich auch ein kleines Makro über den Text laufen lassen und alle Spaltenumbrüche entfern:
Abgespeichert unter "Meine Makros und Dialoge" (nicht im Dokument selbst) stünde es für alle Dokumente zur Verfügung und wäre mein Mittel der Wahl, wenn ich das Problem häufiger hätte.
Das käme auf einen Versuch an.Von AltSearch (von 2007!) kann man das ja kaum erwarten.
Ansonsten kannst du natürlich auch ein kleines Makro über den Text laufen lassen und alle Spaltenumbrüche entfern:
Code: Alles auswählen
Sub Main
odoc=ThisComponent
otxt=odoc.Text
oEnum=otxt.createEnumeration
Do while oEnum.hasMoreElements
oAbs=oEnum.nextElement
If oAbs.BreakType=1 or oAbs.BreakType=2 Then
oAbs.BreakType=0
oAbs.PageDescName=""
end if
Loop
End Sub
Gruß,
mikele
mikele
Re: "Manueller Spaltenumbruch" überall löschen
@mikele:
Versuch mit AltSearch habe ich schon (erfolglos) unternommen (s.o.).
ABER:
Dein netterweise erstelltes Makro funktioniert!!!
(Das ginge definitiv über meine Kenntnisse).
Allerdings ist mein DOCX (wegen des ursprünglichen PDFs) so "verwurschtelt",
mit all' seinen hard-codierten Dingen, dass die Löschung der "Manuellen Spaltenumbrüche"
keine wesentliche Wirkung auf die Darstellung hat (kein "Aufrücken").
Schon erschreckend, wie sehr eine "eigenwillige" Formatierung die Weiterverarbeitung
des Inhalts eines Dokuments behindern kann.
Vielleicht läuft das in so einem Fall tatsächlich auf eine komplette Neuinterpretation
der Darstellung hinaus (d.h. OCR + KI)...?
Nichtsdestotrotz:
Ganz herzlichen Dank!
Versuch mit AltSearch habe ich schon (erfolglos) unternommen (s.o.).
ABER:
Dein netterweise erstelltes Makro funktioniert!!!

(Das ginge definitiv über meine Kenntnisse).
Allerdings ist mein DOCX (wegen des ursprünglichen PDFs) so "verwurschtelt",
mit all' seinen hard-codierten Dingen, dass die Löschung der "Manuellen Spaltenumbrüche"
keine wesentliche Wirkung auf die Darstellung hat (kein "Aufrücken").
Schon erschreckend, wie sehr eine "eigenwillige" Formatierung die Weiterverarbeitung
des Inhalts eines Dokuments behindern kann.
Vielleicht läuft das in so einem Fall tatsächlich auf eine komplette Neuinterpretation
der Darstellung hinaus (d.h. OCR + KI)...?
Nichtsdestotrotz:
Ganz herzlichen Dank!

Re: "Manueller Spaltenumbruch" überall löschen
Hallo,
ich bin mir nicht sicher, ob es nicht einfacher wäre, den Text pur in en neues Dokument zu kopieren und dann die gewünschten Formatierungen durchzuführen.
Um ein wenig Struktur in das Dokument zu bringen würde ich ansonsten mit folgendem Makro erst einmal einiges Entfernen (vor allem die Seitenumbrüche mit den neuen Seitenvorlagen):
Danach kann die Seite sauber formatiert werden (z. B. dreispaltig) und als .ods gespeichert werden. Für den ein oder anderen Absatz bleibt noch ein bisschen manuelles Nacharbeiten.
ich bin mir nicht sicher, ob es nicht einfacher wäre, den Text pur in en neues Dokument zu kopieren und dann die gewünschten Formatierungen durchzuführen.
Um ein wenig Struktur in das Dokument zu bringen würde ich ansonsten mit folgendem Makro erst einmal einiges Entfernen (vor allem die Seitenumbrüche mit den neuen Seitenvorlagen):
Code: Alles auswählen
Sub spaltenumbruch
odoc=ThisComponent
otxt=odoc.Text
'Entfernen aller Bereiche
for i= oDoc.textsections.count-1 to 0 Step -1
oTxt.removeTextContent(oDoc.textsections.getByIndex(i))
next
'Entfernen aller harten Spalten- und Seitenumbrüche
oEnum=otxt.createEnumeration
Do while oEnum.hasMoreElements
oAbs=oEnum.nextElement
If oAbs.BreakType<>0 or oAbs.PageDescName<>"" Then
oAbs.BreakType=0
oAbs.PageDescName=""
end if
loop
'Entfernen aller Linien etc.
odp=odoc.Drawpage
for i=odp.count-1 to 0 step -1
odraw=odp.getbyindex(i)
if left(odraw.name,4)="Form" or left(odraw.name,4)="Grap" then
oTxt.removeTextContent(odraw)
end if
next
End Sub
Gruß,
mikele
mikele
An alle, die das LibreOffice-Forum gern nutzen und unterstützen wollen:
Bitte helfen Sie uns mit 7 Euro pro Monat.
Durch Ihren Beitrag tragen Sie dazu bei, unsere laufenden Kosten für die kommenden Monate zu decken.
Unkompliziert per Kreditkarte oder PayPal.
Als ein kleines Dankeschön werden Sie im LO-Forum als SUPPORTER gekennzeichnet.