Sprachausgabe von Texten mit mehrfachen Sprachen im Text
Verfasst: Mo 24. Feb 2025, 15:00
Hallo LO-Forum
Ich habe ein Dokument mit deutschen und französischen Text- Segmenten:
Beispiel:
Wenn eine Handlung gerade abgeschlossen wurde, verwendet man auch
venir de faire quelque chose habe gerade etwas getan.
z.B.:
Tu viens de manger Du hast gerade gegessen
Ziel ist, das Dokument mit unterschiedlichen Sprachelementen durchgehend vorlesen zu lassen.
Die Erweiterung text-to-speech 0.8.92 ( read_text_2025.01.12_00.11.oxt ) ist installiert.
Die französischen Texte sind im Dokument blau markiert.
Über Format, Zeichen habe ich zur besseren Lesbarkeit die französische Sprache diesen blauen Textbereichen zugeordnet.
Markiere ich nun einen „blauen“ Bereich und rufe auf über
Extras, Plug-ins, Markierten Text vorlesen,
so bekomme ich ein Menü, wo ich die Ausgabe mit Hilfe von wscript.exe starten kann.
Die Sprachausgabe erfolgt dann in der französischen Sprache, wie gewünscht.
Auch die Ausgabe über translate.google.de funktioniert, dauert aber etwas und es muss dort die Ausgabe der Sprache extra gestartet werden. Hier ist die Aussprache aber viel „menschlicher“.
Markiere ich nun einen gemischten Bereich, also Elemente in deutscher und französischer Sprache,
rufe dann die Sprachausgabe auf, dann wird nur in der deutschen Sprache vorgelesen und dabei wird der französische Text nicht in Französisch vorgelesen sondern er ist unverständlich.
Das Problem scheint zu sein, dass bei der Nutzung von
"(TTS_WSCRIPT_VBS)" /language:"(SELECTION_LANGUAGE_COUNTRY_CODE)" "(TMP)"
und bei
https://translate.google.de/?&langpair= ... O_WEBTEXT)
für den ausgewählten Text nur ein LANGUAGE_COUNTRY_CODE für die Umsetzung gesetzt wird! Es wird also dann nicht mehr ein Wechsel des COUNTRY_CODE Parameters berücksichtigt.
Das bedeutet wohl, dass die automatische Sprachausgabe abhängig vom COUNTRY_CODE des Textes aufgeteilt werden sollte. Das geht wohl nur über ein Scripting / Makro.
Möglicherweise wäre die jeweilige Ausgabe in eine mp3- Datei sinnvoll, wobei diese mp3-Datei dann an eine Master-mp3-Datei schrittweise angehängt wird. So würde eine fließende Sprachausgabe entstehen, die dann abgespielt werden kann.
Für die Programmierung steht bei mir die APSO 1.4.2 und Python 3.10 zur Verfügung.
Für den Umgang und die Nutzung der LO- Library mit ihren Klassen, Methoden und Funktionen habe ich keine Erfahrung. Das wird mein Lernprozess, fangen wir einfach an.
Wie programmiere ich das?
Aufgabe 1:
Ich habe einen ausgewählten Text mit schwarz (deutsch) und blau (französisch) gekennzeichneten Elementen (Textfarbe).
Wie ordne ich diesen „blauen Elementen“ die französische Sprache (FR) über ein Script zu?
Was müsste ich ändern, wenn gelb für Englisch dazukommen würde?
Aufgabe 2:
Ich habe einen ausgewählten Text mit Sprachzuordnungen in Deutsch und Französisch in den einzelnen Text- Elementen.
Wie trenne ich die Textbereiche je nach der Sprachzuordnung?
Speicherung: Sequenz, Sprache, Text
Aufgabe 3:
Sequentielle Übergabe der Daten an https://translate.google.de aber mit Sprachkennzeichen, also ohne Spracherkennung und mit direkter Ausgabe der Sprache, also ohne Dialog.
( Aufgabe 4: Aufnahme der Ausgabe mit Audacity, um Pausen oder andere Änderungen zu bearbeiten )
Für eine hilfreiche Unterstützung bin ich dankbar ( als Anfänger )
MfG
UFI
Ich habe ein Dokument mit deutschen und französischen Text- Segmenten:
Beispiel:
Wenn eine Handlung gerade abgeschlossen wurde, verwendet man auch
venir de faire quelque chose habe gerade etwas getan.
z.B.:
Tu viens de manger Du hast gerade gegessen
Ziel ist, das Dokument mit unterschiedlichen Sprachelementen durchgehend vorlesen zu lassen.
Die Erweiterung text-to-speech 0.8.92 ( read_text_2025.01.12_00.11.oxt ) ist installiert.
Die französischen Texte sind im Dokument blau markiert.
Über Format, Zeichen habe ich zur besseren Lesbarkeit die französische Sprache diesen blauen Textbereichen zugeordnet.
Markiere ich nun einen „blauen“ Bereich und rufe auf über
Extras, Plug-ins, Markierten Text vorlesen,
so bekomme ich ein Menü, wo ich die Ausgabe mit Hilfe von wscript.exe starten kann.
Die Sprachausgabe erfolgt dann in der französischen Sprache, wie gewünscht.
Auch die Ausgabe über translate.google.de funktioniert, dauert aber etwas und es muss dort die Ausgabe der Sprache extra gestartet werden. Hier ist die Aussprache aber viel „menschlicher“.
Markiere ich nun einen gemischten Bereich, also Elemente in deutscher und französischer Sprache,
rufe dann die Sprachausgabe auf, dann wird nur in der deutschen Sprache vorgelesen und dabei wird der französische Text nicht in Französisch vorgelesen sondern er ist unverständlich.
Das Problem scheint zu sein, dass bei der Nutzung von
"(TTS_WSCRIPT_VBS)" /language:"(SELECTION_LANGUAGE_COUNTRY_CODE)" "(TMP)"
und bei
https://translate.google.de/?&langpair= ... O_WEBTEXT)
für den ausgewählten Text nur ein LANGUAGE_COUNTRY_CODE für die Umsetzung gesetzt wird! Es wird also dann nicht mehr ein Wechsel des COUNTRY_CODE Parameters berücksichtigt.
Das bedeutet wohl, dass die automatische Sprachausgabe abhängig vom COUNTRY_CODE des Textes aufgeteilt werden sollte. Das geht wohl nur über ein Scripting / Makro.
Möglicherweise wäre die jeweilige Ausgabe in eine mp3- Datei sinnvoll, wobei diese mp3-Datei dann an eine Master-mp3-Datei schrittweise angehängt wird. So würde eine fließende Sprachausgabe entstehen, die dann abgespielt werden kann.
Für die Programmierung steht bei mir die APSO 1.4.2 und Python 3.10 zur Verfügung.
Für den Umgang und die Nutzung der LO- Library mit ihren Klassen, Methoden und Funktionen habe ich keine Erfahrung. Das wird mein Lernprozess, fangen wir einfach an.
Wie programmiere ich das?
Aufgabe 1:
Ich habe einen ausgewählten Text mit schwarz (deutsch) und blau (französisch) gekennzeichneten Elementen (Textfarbe).
Wie ordne ich diesen „blauen Elementen“ die französische Sprache (FR) über ein Script zu?
Was müsste ich ändern, wenn gelb für Englisch dazukommen würde?
Aufgabe 2:
Ich habe einen ausgewählten Text mit Sprachzuordnungen in Deutsch und Französisch in den einzelnen Text- Elementen.
Wie trenne ich die Textbereiche je nach der Sprachzuordnung?
Speicherung: Sequenz, Sprache, Text
Aufgabe 3:
Sequentielle Übergabe der Daten an https://translate.google.de aber mit Sprachkennzeichen, also ohne Spracherkennung und mit direkter Ausgabe der Sprache, also ohne Dialog.
( Aufgabe 4: Aufnahme der Ausgabe mit Audacity, um Pausen oder andere Änderungen zu bearbeiten )
Für eine hilfreiche Unterstützung bin ich dankbar ( als Anfänger )
MfG
UFI