Deutsche Sprachdateien

512 views
Skip to first unread message

Julian Pawlowski

unread,
Feb 18, 2013, 1:36:04 PM2/18/13
to gs5-...@googlegroups.com
Hallo zusammen,

ich habe in den letzten Tagen an (vorübergehenden) deutschen Sprachdateien gebastelt, die auf Text-To-Speech basieren und frei verteilt werden können, ohne dass man dafür etwas bezahlen muss (kostenflichtige gibt es ja durchaus im Netz zu erwerben).

Gleich die Frage vorweg: Wem brennt es auch so sehr unter den Fingernägeln deutsche Sprachdateien zu haben und ist bereit zu helfen ?
(wer sie nur probehalber installieren will muss leider bis zum Ende lesen :-p)


Dank der österreichischen Kollegen habe ich eine recht gute Textbasis (http://freeswitch.xpirio.com/ - mit großem Dank!), so dass es jetzt hauptsächlich um 2 Dinge geht:

1. Die Sprachdateien durchhören und die Texte abrunden (Österreichisch in Hochdeutsch, Einzahl/Mehrzahl, einfache Korrekturen der Aussprache (z.B. wird ein 1. geschrieben steht nicht "erste" gesprochen, sondern "eins Punkt" o.ä.))
2. Verbesserung der Aussprache im Detail.

Der 1. Punkt ist etwas Fleißarbeit, aber für jeden machbar. Änderungen der Texte können sofort per Pull-Request hier hinzugefügt werden: https://github.com/jpawlowski/freeswitch-sounds-de

Beim 2. Punkt bedarf es etwas mehr:
Für die Sprachsynthese benutze ich MARY TTS (http://mary.dfki.de/, Online-Demo gibts da auch). Wenn man sich die englischen Beispiele wie z.B. "Spike" anhört dann hört man, dass die Beispiele phonetisch angepasst sind, so dass die Aussprache extrem natürlich klingt.

Genau diese phonetische Anpassung sollte auch bei den deutschen Sprachen eine starke Verbesserung bringen. Dafür gibt es das MaryXML Format, worin man den Text entsprechend formatieren kann. Ich habe versucht mir das in aller Kürze anzueignen um festzustellen, dass es sehr aufwändig ist. Gibt es hier jemanden, der damit spielen kann und möchte? MARY TTL hat auch eine Mailingliste, in der man zur Not auch in Deutsch schreiben kann (http://www.dfki.de/mailman/listinfo/mary-users), da es in Deutschland entwickelt wurde.

Bevor ich jetzt noch mehr schreibe: BITTE MELDET EUCH, WENN IHR SPASS DARAN HÄTTET HIER MITZUHELFEN ! Genaueres kann man dann in diesem Thread immer noch schreiben.

Achso für die Ungeduldigen: Deutsche Sprachdateien lassen sich im aktuellen Development-Build als Add-On über die Konsole installieren (siehe "gs-addon list", ggf. vorher ein "gs-update" oder "gse-update" machen).


Gruß
Julian

Julian Pawlowski

unread,
Feb 19, 2013, 6:57:33 AM2/19/13
to gs5-...@googlegroups.com
Hallo


On Monday, February 18, 2013 7:36:04 PM UTC+1, Julian Pawlowski wrote:
ich habe in den letzten Tagen an (vorübergehenden) deutschen Sprachdateien gebastelt, die auf Text-To-Speech basieren und frei verteilt werden können, ohne dass man dafür etwas bezahlen muss (kostenflichtige gibt es ja durchaus im Netz zu erwerben).

Zwischenzeitlich muss ich mein Posting etwas relativieren.
Denn:

Ich habe es geschafft sowohl Google Translate als auch Bing Translate anzuzapfen, so dass deren Text-to-Speech Funktion jetzt zwei weitere deutsche Stimmen bereitstellen, die sich wirklich sehr gut anhören.
Man kann bei Google oder Bing auch gar keine Einstellungen vornehmen, dieser Punkt fällt damit also weg. Sollte sich nichts anderes ergeben (Thema Lizenz), dann werden die MARY TTS Stimmen wohl wieder verschwinden und die Google und Bing Stimmen bleiben verfügbar. Die Google Stimme ist sogar bereits im heutigen Nightly Build per Default aktiviert, die von Bing finde ich aber auch sehr gut. Schwere Entscheidung :-)

Was nun noch bleibt ist die Texte zu optimieren! Wer hilft mit?


Gruß
Julian 

Oliver Timm

unread,
Feb 19, 2013, 7:08:53 AM2/19/13
to gs5-...@googlegroups.com
Hallo Julian,
 
was muss genau gemacht werden?
Wie viel ist es? ( wie viele Texte )
 
Gruß
Oliver

Julian Pawlowski

unread,
Feb 19, 2013, 7:19:41 AM2/19/13
to gs5-...@googlegroups.com
Hallo Oliver,


On Tuesday, February 19, 2013 1:08:53 PM UTC+1, Oliver Timm wrote:
was muss genau gemacht werden?
Wie viel ist es? ( wie viele Texte )

Sieh selbst :-)

Alle Textdateien im Ordner "input" müssen durchgesehen werden. Diejenigen, die mit einem Text "Leere Datei... #TODO" versehen sind fehlen momentan gänzlich (das sind einige Hundert, die spielen aber eine untergeordnete Rolle für den Alltagsbetrieb). Die Ordner ivr, directory und zrtp sind aber erstmal nicht ganz so wichtig. Wichtig sind vor allem voicemail und conference, aber die allgemeinen wie ascii, digits etc. sind natürlich auch wichtig.

Außerdem sollten natürlich alle generierten Dateien durchgehört werden, um ggf. bei komischer Aussprache durch das Setzen von Satzzeichen o.ä. zu versuchen eine Verbesserung zu erhalten. Man kann dazu natürlich Google Translate bzw. Bing Translate im Web verwenden und sich den Text dort vorlesen lassen, statt alle Dateien generieren zu müssen (ist bei Bing nicht ganz so einfach, weil man einen API Zugang haben muss, der auch oft mal zickt). Dann sieht man welche Änderungen am Text eine Verbesserung bringen.

Ich denke jetzt wo man sich auf die Textinhalte konzentrieren kann, ist es gar nicht mehr soooo schwierig das zu stemmen.

Gruß
Julian

Oliver Timm

unread,
Feb 19, 2013, 7:32:31 AM2/19/13
to gs5-...@googlegroups.com
Hallo Julian,
 
das heißt ich schaue mir alles bei Voicemail nochmal an, kopiere den Text zu Google, lasse es erzeugen/vorlesen, wenn ich damit zufrieden bin, kopiere ich den geänderten Text zurück. Dort wo etwas fehlt höre ich mir das Original an, übersetze den Text, etc.
 
Zu wann muss das fertig?
 
Gruß
Oliver

Julian Pawlowski

unread,
Feb 19, 2013, 7:38:05 AM2/19/13
to gs5-...@googlegroups.com
On Tuesday, February 19, 2013 1:32:31 PM UTC+1, Oliver Timm wrote:
das heißt ich schaue mir alles bei Voicemail nochmal an, kopiere den Text zu Google, lasse es erzeugen/vorlesen, wenn ich damit zufrieden bin, kopiere ich den geänderten Text zurück. Dort wo etwas fehlt höre ich mir das Original an, übersetze den Text, etc.

Ganz genau. Allerdings dürfen die Texte nicht zu lang sein, ich habe einige schon gekürzt. Also besser kurz und knapp halten, ist ja auch für die Menschen am Hörer angenehmer nicht dauernd mit dem Fuss zu wippen :-)
  
Zu wann muss das fertig?

Wenn das als möglichst fertige Version noch mit in die 5.1 hinein soll, dann wohl eher bald.
Aber man kann das natürlich auch bei einer bestehenden Installation noch per Hand ganz einfach aktualisieren (wenn man will).

Die ganzen Dateien mit fehlenden Texten haben sicherlich etwas mehr Zeit, die vorhanden Texte zu prüfen wäre zunächst der Fokus.


Gruß
Julian

Oliver Timm

unread,
Feb 19, 2013, 7:45:14 AM2/19/13
to gs5-...@googlegroups.com

Am Dienstag, 19. Februar 2013 13:38:05 UTC+1 schrieb Julian Pawlowski:
On Tuesday, February 19, 2013 1:32:31 PM UTC+1, Oliver Timm wrote:
das heißt ich schaue mir alles bei Voicemail nochmal an, kopiere den Text zu Google, lasse es erzeugen/vorlesen, wenn ich damit zufrieden bin, kopiere ich den geänderten Text zurück. Dort wo etwas fehlt höre ich mir das Original an, übersetze den Text, etc.

Ganz genau. Allerdings dürfen die Texte nicht zu lang sein, ich habe einige schon gekürzt. Also besser kurz und knapp halten, ist ja auch für die Menschen am Hörer angenehmer nicht dauernd mit dem Fuss zu wippen :-)
  
Ich wippe gern mal.
 
Zu wann muss das fertig?

Wenn das als möglichst fertige Version noch mit in die 5.1 hinein soll, dann wohl eher bald.
Aber man kann das natürlich auch bei einer bestehenden Installation noch per Hand ganz einfach aktualisieren (wenn man will).

Die ganzen Dateien mit fehlenden Texten haben sicherlich etwas mehr Zeit, die vorhanden Texte zu prüfen wäre zunächst der Fokus.

Ich würde das dann am liebsten Nachts machen :) wenn das Telefon nicht mehr klingelt und würde mit dem Ordner mit weniger Dateien beginnen, also wohl Conference.
Keine Deadline wie z.B. Sonntag?

Gruß
Julian
 
Gruß
Oliver
 

Julian Pawlowski

unread,
Feb 19, 2013, 7:55:16 AM2/19/13
to gs5-...@googlegroups.com
On Tuesday, February 19, 2013 1:45:14 PM UTC+1, Oliver Timm wrote:
Ich wippe gern mal.

Es hat auch technische Gründe :-)
Google und Microsoft erlauben keine allzu langen Texte und bei längeren Texten geraten die Stimmen auch eher ins Wanken.

Keine Deadline wie z.B. Sonntag?

Ja, Sonntag klingt gut.


Gruß
Julian 

Oliver Timm

unread,
Feb 19, 2013, 8:40:53 AM2/19/13
to gs5-...@googlegroups.com
Conference ist fertig durchgehört, leider kann man nicht all zu viel mit Google anstellen. Immerhin konnte ich eine Sache verbessern!
 
Gruß
Oliver

Julian Pawlowski

unread,
Feb 19, 2013, 9:21:50 AM2/19/13
to gs5-...@googlegroups.com
On Tuesday, February 19, 2013 2:40:53 PM UTC+1, Oliver Timm wrote:
Conference ist fertig durchgehört, leider kann man nicht all zu viel mit Google anstellen. Immerhin konnte ich eine Sache verbessern!

Prima, dann einfach einen Pull-Request schicken.

Es war übrigens so gedacht sich die fertigen Sprachdateien abzuhören (entweder von einem aktuellen Dev-Image oder als Download von repo.profhost.eu/static/freeswitch) und nur bei Bedarf den Text zu Google/Bing zu kopieren. Sonst dauert es ja viel zu lange das Ergebnis mal schnell durchzusehen ;-)


Gruß
Julian

Oliver Timm

unread,
Feb 19, 2013, 11:41:35 AM2/19/13
to gs5-...@googlegroups.com

Am Dienstag, 19. Februar 2013 15:21:50 UTC+1 schrieb Julian Pawlowski:
On Tuesday, February 19, 2013 2:40:53 PM UTC+1, Oliver Timm wrote:
Conference ist fertig durchgehört, leider kann man nicht all zu viel mit Google anstellen. Immerhin konnte ich eine Sache verbessern!

Prima, dann einfach einen Pull-Request schicken.
 
Windowsdau ;) habe über den Browser in die Datei getippt, falsch? ;) 

Es war übrigens so gedacht sich die fertigen Sprachdateien abzuhören (entweder von einem aktuellen Dev-Image oder als Download von repo.profhost.eu/static/freeswitch) und nur bei Bedarf den Text zu Google/Bing zu kopieren. Sonst dauert es ja viel zu lange das Ergebnis mal schnell durchzusehen ;-)

Gut, habe jetzt auch die Voicemail durchgehört, 4 wären evtl. zu ändern, aber vorher müssten wir noch klären, wie ich dann den Text ändere ;) 

Gruß
Julian
 
Gruß
Oliver 

Julian Pawlowski

unread,
Feb 19, 2013, 6:57:21 PM2/19/13
to gs5-...@googlegroups.com
On Tuesday, February 19, 2013 5:41:35 PM UTC+1, Oliver Timm wrote:
Prima, dann einfach einen Pull-Request schicken.
 
Windowsdau ;) habe über den Browser in die Datei getippt, falsch? ;)

Jaein. Damit hast du einen Clone des Repositories angelegt, was unter deinem Github Account geführt wird. Die Änderungen fließen aber nicht automatisch zurück.

Es war übrigens so gedacht sich die fertigen Sprachdateien abzuhören (entweder von einem aktuellen Dev-Image oder als Download von repo.profhost.eu/static/freeswitch) und nur bei Bedarf den Text zu Google/Bing zu kopieren. Sonst dauert es ja viel zu lange das Ergebnis mal schnell durchzusehen ;-)

Gut, habe jetzt auch die Voicemail durchgehört, 4 wären evtl. zu ändern, aber vorher müssten wir noch klären, wie ich dann den Text ändere ;)

Ich habe von Textseite her auch ziemlich viel überarbeitet, es fehlen nur noch wenige IVR Dateien mit fehlenden Texten. Schick mal deine Änderungen soweit du sie hast, dann vergleiche ich die.


Gruß
Julian

Oliver Timm

unread,
Feb 25, 2013, 5:12:57 PM2/25/13
to gs5-...@googlegroups.com

:::ascii:::
200 - habe aber auch keine alternative.


:::digits:::
80 - ist ein knackser drin, aber bei Google auch. Wenn man aber "acht zig" schreibt, ist es ok.


:::directory:::
dir-enter_person_first_or_last - bitte geben sie die ersten buchstaben des for oder nachnamens ein ( vor gegen for tauschen )
dir-no_matching_results - die suche war ergebnis los ( ergebnislos auseinander geschrieben )


:::phonetic-ascii:::
99 - cesar
101 - keine idee
200 - ährrgeer


:::voicemail:::
vm-last - letz te
vm-password_is_not_secure - Eine pin wie eins eins eins eins oder eins zwei drei vier ist nicht sicher.
vm-send_message_now - um diesee nachricht jetzt zu senden

Julian Pawlowski

unread,
Feb 26, 2013, 4:01:28 AM2/26/13
to gs5-...@googlegroups.com
Danke, Oliver! Habe ich gerade in den develop Branch übernommen. Wird dann beim nächsten Generieren berücksichtigt :-)
(muss grad etwas sparsam mit der API umgehen, man wird so schnell geblockt... :-/)
Reply all
Reply to author
Forward
0 new messages