Seite 1 von 3

Probleme beim konvertieren von .csv zu .txt-basiertem Format

Verfasst: Mi 14. Aug 2013, 11:12
von Held_der_Arbeit
Hallo,

Ich rechne im moment mit einer Software die ihre Daten in einem Textbasierten Format (also ohne ohne irgendwelche Zeilentrenner) einliest.
Allerdings lassen sich diese Files (aufgrund großer Datenmengen) nur schlecht per Hand editieren, weshalb vom Entwickler das editieren in Excel/Calc empfohlen wird. Danach solle man es einfach als .csv abspeichern und die Dateiendung manuell wieder dem ursprünglichen Format anpassen.

Das Problem ist nun, dass Calc beim speichern für jede Zelle ein Komma einfügt. Das rück-konvertierte, aber nun von Kommas überschwemmte File kann das Programm dann nicht mehr lesen.

Gibt es für solche Probleme ein Workaround? z.B. einen Weg die Zeilentrennung nach dem editieren, aber vor dem Speichern wieder aufzuheben?

Gruß
Jan

Re: Probleme beim konvertieren von .csv zu .txt-basiertem Fo

Verfasst: Mi 14. Aug 2013, 13:12
von pmoegenb
Hallo Jan,
Held_der_Arbeit hat geschrieben:Das Problem ist nun, dass Calc beim speichern für jede Zelle ein Komma einfügt. Das rück-konvertierte, aber nun von Kommas überschwemmte File kann das Programm dann nicht mehr lesen.

Gibt es für solche Probleme ein Workaround? z.B. einen Weg die Zeilentrennung nach dem editieren, aber vor dem Speichern wieder aufzuheben?
Was jetzt Feld- oder Zeilentrennung ?

Wenn Du beim speichern die Option Filtereinstellungen bearbeiten aktivierst, bekommst Du folgenden Bildschirm:
2013-08-14 13_35_03-Textexport.gif
2013-08-14 13_35_03-Textexport.gif (13.78 KiB) 6749 mal betrachtet
Andere Möglichkeiten kenne ich nicht.

Re: Probleme beim konvertieren von .csv zu .txt-basiertem Fo

Verfasst: Mi 14. Aug 2013, 14:06
von oleander
Held_der_Arbeit hat geschrieben: weshalb vom Entwickler das editieren in Excel/Calc empfohlen wird. Danach solle man es einfach als .csv abspeichern und die Dateiendung manuell wieder dem ursprünglichen Format anpassen.
Wenn der Entwickler schon so etwas empfiehlt, müßte er eigentlich auch den genauen Weg wissen.

Ansonsten: Um welche Art von Daten handelt es sich?
- einen "normal lesbaren" Text
- alphanumerische Prozessdaten
- feste oder variable Feldlängen
- feste oder variable Satzlängen
Von wem werden diese Daten erstellt?
Hat die Software, die die Daten einliest, irgendwelche Einstellmöglichkeiten?
Was muß editiert werden?
Musterfile?

Re: Probleme beim konvertieren von .csv zu .txt-basiertem Fo

Verfasst: Mi 14. Aug 2013, 14:36
von Held_der_Arbeit
oleander hat geschrieben:
Held_der_Arbeit hat geschrieben: weshalb vom Entwickler das editieren in Excel/Calc empfohlen wird. Danach solle man es einfach als .csv abspeichern und die Dateiendung manuell wieder dem ursprünglichen Format anpassen.
Wenn der Entwickler schon so etwas empfiehlt, müßte er eigentlich auch den genauen Weg wissen.
Mag sein, aber er beschreibt ihn nicht weiter. Generell ist der Support eher dürftig ;)

Ich hab mal zwei Beispielfiles (vor und nach dem speichern in calc) angehängt. Leider als doc, da das Forum weder das originale dateiformat, noch .txt zulässt. Ich hoffe es hilft trotzdem weiter. Laut Entwickler ist das ganze "im Grunde ein .csv file" und es liest sich, wenn man die Datei in .csv umbenennt und Kommas als Feldtrenner (sorry für die Verwirrung) angibt auch gut.
Nur wenn man es dann nach editieren im .csv wieder als .mt file speichert (wie vom Entwickler empfohlen), kann das Programm nicht mehr damit rechnen. Ds wäre nicht das erste Mal das das ganze nicht so funktioniert wie beschrieben..

Schaut man sich die Datei mit dem Editor vor- und nach dem .csv Eingriff an so stellt man fest, dass sie nach dem speichern von Kommas überschwemmt ist, die vorher nicht da waren. Ich gehe stark davon aus das die es sind, die Fehler im Drittprogramm auslösen.
Die Frage ist daher ob und wie ich den Spaß so in Calc speichern kann, dass die Feldtrenner nicht mit in das Dokument geschrieben werden.

Re: Probleme beim konvertieren von .csv zu .txt-basiertem Fo

Verfasst: Mi 14. Aug 2013, 14:51
von swolf
Hallo,
das Forum weder das originale dateiformat, noch ...zulässt.
das stimmt nicht. Hier gibt es viele Anhänge im .ods-Format, Beispiel:
http://www.libreoffice-forum.de/viewtop ... =6&t=12322

Re: Probleme beim konvertieren von .csv zu .txt-basiertem Fo

Verfasst: Mi 14. Aug 2013, 15:04
von pmoegenb
Hallo,

die unbearbeitete Datei entspricht nicht den Konventionen einer .csv-Datei oder anders ausgedrückt, kommt Schrott rein, kommt Schrott wieder raus. So fehlt z. B. am Ende einer Zeile ein Zeilenumbruch (CRLF). Deshalb bekommst Du beim Speichern auch soviel Kommas.

Der Entwickler muss Dir da schon etwas besseres Anbieten.

Zum Hochladen einer Datei geht im Zweifelsfall immer eine .zip-Datei.

Re: Probleme beim konvertieren von .csv zu .txt-basiertem Fo

Verfasst: Mi 14. Aug 2013, 20:11
von oleander
Hallo Jan,

es wäre schon wichtig, vom Entwickler den Satzaufbau dokumentiert zu bekommen.

Ich dachte zuerst, bei Spalte R sei Schluß, kam dann aber darauf, daß die .doc-Datei (diese erst in calc importieren, dann als .ods-Tabellendokument speichern und mit diesem arbeiten) in verschiedenen Zeilen (z. B. Zeile 161) Daten bis in die Spalte ALJ Daten enthält.
Unbenannt.JPG
Unbenannt.JPG (209.77 KiB) 6721 mal betrachtet
Das bedeutet, daß calc richtig exportiert hat, die vielen Kommas stellen eben die vielen unbelegten Felder dar.

Löscht man diese Daten, kommen am Schluß auch keine weiteren Kommas vor.

Die Frage, ob diese weiteren Daten von einem Bearbeitungsfehler stammen oder doch in irgendeine Spalte hineingehören, kann ich natürlich nicht beantworten - dazu müßte man den Satzaufbau haben.

Re: Probleme beim konvertieren von .csv zu .txt-basiertem Fo

Verfasst: Do 15. Aug 2013, 07:36
von Held_der_Arbeit
oleander hat geschrieben:Hallo Jan,

es wäre schon wichtig, vom Entwickler den Satzaufbau dokumentiert zu bekommen.
Wie sähe so etwas aus? Es gibt von ihm leider nur diesen (englischen) Eintrag in seinem Support Forum. Da ist auch ein Beispiel-File dabei, dass allerdings im .xls format kommt und beim umbenennen in .mt noch wildere fehler produziert als meine Files. Wir haben es übrigens auch schon auf einem anderen Rechner mit Excel statt Calc und einer Reihe möglicher Formate versucht, was das Problem nicht behoben hat.
Ich dachte zuerst, bei Spalte R sei Schluß, kam dann aber darauf, daß die .doc-Datei (diese erst in calc importieren, dann als .ods-Tabellendokument speichern und mit diesem arbeiten) in verschiedenen Zeilen (z. B. Zeile 161) Daten bis in die Spalte ALJ Daten enthält.
Unbenannt.JPG
Das bedeutet, daß calc richtig exportiert hat, die vielen Kommas stellen eben die vielen unbelegten Felder dar.

Löscht man diese Daten, kommen am Schluß auch keine weiteren Kommas vor.

Die Frage, ob diese weiteren Daten von einem Bearbeitungsfehler stammen oder doch in irgendeine Spalte hineingehören, kann ich natürlich nicht beantworten - dazu müßte man den Satzaufbau haben.
Das Programm misst Mausbewegungen, diese Daten sind einzelne Koordinatenpunkte und ergeben insgesamt eine Bewegungslinie auf mehreren Koordinaten.
Die sind leider das Herzstück der Berechnung, löschen ist also nicht drin ;)

Gibt es vielleicht eine Möglichkeit Calc beizubringen die unbelegten Felder NICHT durch Kommas aufzufüllen?
pmoegenb hat geschrieben:Hallo,

die unbearbeitete Datei entspricht nicht den Konventionen einer .csv-Datei oder anders ausgedrückt, kommt Schrott rein, kommt Schrott wieder raus. So fehlt z. B. am Ende einer Zeile ein Zeilenumbruch (CRLF). Deshalb bekommst Du beim Speichern auch soviel Kommas.
Interessant. Inwiefern genau könnte das der Grund sein? Ließe sich der falsche Zeilenumbruch manuell beheben?

Re: Probleme beim konvertieren von .csv zu .txt-basiertem Fo

Verfasst: Do 15. Aug 2013, 11:29
von pmoegenb
Hallo,
Held_der_Arbeit hat geschrieben:Interessant. Inwiefern genau könnte das der Grund sein? Ließe sich der falsche Zeilenumbruch manuell beheben?
ich verwende zum Bearbeiten von .txt- oder .csv-Dateien das Produkt Notepade++.

Re: Probleme beim konvertieren von .csv zu .txt-basiertem Fo

Verfasst: Do 15. Aug 2013, 16:30
von oleander
Held_der_Arbeit hat geschrieben: Interessant. Inwiefern genau könnte das der Grund sein? Ließe sich der falsche Zeilenumbruch manuell beheben?
Daran liegt es nicht. Sowohl die Datei "unbearbeitet.doc" als auch die Exporte von calc enthalten die erforderlichen Zeichen für den Zeilenumbruch: 0D und 0A (hex) bzw. 13 und 10 (ASCII), also Cursorrücklauf und Zeilenvorschub. Allerdings werden diese von normalen Editoren nicht extra dargestellt.

Verwirrend an der csv-Datei ist, daß header und feldanzahl nicht übereinstimmen.

Ohne eine funktionierende mt-Datei vorliegen zu haben werden wir hier nicht weiterkommen.