Seite 1 von 1
Text im PDF wird überzeichnet
Verfasst: Mi 16. Mär 2022, 15:54
von chs
Hallo Forum!
Jedesmal wenn ich ein PDF öffne, wird die Textkontur grafisch ''übermalt'' und nachgezeichnet. Ich fand bis jetzt keinen Weg dies auszustellen, sogar nach stundenlangem Durchforsten der Funktionen - Ihr könnt mir sicher behilflich sein.
Das Problem in Bild anbei.
Vielen Dank im Voraus!
Re: Text im PDF wird überzeichnet
Verfasst: Mi 16. Mär 2022, 16:32
von miesepeter
Hallo,
vermutlich hast du bei
www.pdf24.org oder einem ähnlichen Programm oder
Portal OCR (Texterkennung) über ein Bild laufen lassen. Wird das dann so gewonnene PDF-Dokument (heruntergeladen und) geöffnet, so enthält es 2 "Schichten" (Ebenen/Layer), nämlich das Bild und eine Textschicht. Diese "Schichten" entsprechen nicht den in Draw gegebenen Ebenen, sondern stellen lediglich Unterschiede in der
Anordnung dar. Damit wird in Draw die Reihenfolge von "Schichten" bezeichnet, in denen die einzelnen Objekte liegen (man kann sie nach vorn/hinten platzieren).
Die von OCR erkannten Texte liegen über der Bildschicht. Die Bildschicht wird man für gewöhnlich löschen und dann mit den Texten weiterarbeiten. Da die Textschicht (= eine Vielzahl von Textzeilen oder Textboxen) transparent ist, sieht man das Bild darunter, einschließlich der (violetten) Markierungen.
Wenn das Ergebnis der Texterkennung gelungen ist, kannst du mehrere Textzeilen markieren und dann (rechte Maustaste) konsolidieren (zusammenführen in eine Textbox; ab ca. LibreOffice 7.x). Wenn dann der konsolidierte Text in den Writer kopiert wird, dann erspart man sich die Ersetzung einzelner Zeilen- oder Absatzschaltungen, um einen normalen Mengentext zu erhalten...
chs hat geschrieben: ↑Mi 16. Mär 2022, 15:54
Jedesmal wenn ich ein PDF öffne, wird die Textkontur grafisch ''übermalt'' und nachgezeichnet
Da scheinst du bisher noch mit sehr wenigen PDF-Dateien gearbeitet zu haben...
Ciao
Re: Text im PDF wird überzeichnet
Verfasst: Mi 16. Mär 2022, 16:37
von chs
Hallo,
danke für die Antwort. Ich habe kein externes OCR über meine PDF's laufen lassen - diese werden aber alle so angezeigt. Meine Frage ist nun, wie ich das wegbekomme.
Vielen Dank für weitere Hilfe.
Re: Text im PDF wird überzeichnet
Verfasst: Mi 16. Mär 2022, 16:38
von miesepeter
chs hat geschrieben: ↑Mi 16. Mär 2022, 16:37
diese werden aber
alle so angezeigt.
Dann lade ein Beispiel hoch. Als Forenmitglied kannst du das.