Spracheingabe/Diktiersoftware

2 Aufrufe
Direkt zur ersten ungelesenen Nachricht

Marcel A. W. Spitau

ungelesen,
25.08.2006, 06:51:1425.08.06
an
Hallo Leute,

vor vielen, vielen Monden (also echt lange.. 8 oder 9 Jahre ), hatte ich auf
meinem Rechner ein Programm installiert (dessen Namen mir nicht einfallen
will) mit dem ich meinem Computer Sachen diktieren konnte. Das Ganze
spielte sich auf eine win95 oder win98 Rechner ab. (Das weiß ich nicht mehr
sooo genau.)

Nun bin ich seit langer Zeit auf ein professionellereres Betriebssystem
umgestiegen und frage mich (weil ich im Moment VIELE Texte schreibe und des
10-Fingersystems nur ansatzweise mächtig bin), ob es für GNU/Linux auch ein
Werkzeug gibt, mit dem man dem Rechner Sachen diktieren kann, die er dann
in geschriebene Worte wandelt.

Ich würde mich freuen, von Euch zu hören.

Bis dann
Marcel

Rainer Koenig

ungelesen,
25.08.2006, 07:58:4625.08.06
an
"Marcel A. W. Spitau" <mar...@spitau.de> writes:

> Nun bin ich seit langer Zeit auf ein professionellereres Betriebssystem
> umgestiegen und frage mich (weil ich im Moment VIELE Texte schreibe und des
> 10-Fingersystems nur ansatzweise mächtig bin), ob es für GNU/Linux auch ein
> Werkzeug gibt, mit dem man dem Rechner Sachen diktieren kann, die er dann
> in geschriebene Worte wandelt.

$ apt-cache search speech | grep reco
libsphinx2-dev - speech recognition library - development kit
libsphinx2g0 - speech recognition library
sphinx2-bin - speech recognition utilities
sphinx2-hmm-6k - speech recognition library - default acoustic model

Description: speech recognition utilities
Sphinx 2 is a real-time, speaker-independent speech recognition system.
.
This package contains examples and utilities that use Sphinx. It also
includes a sample language model that is capable of recognizing simple
commands like "go forward ten meters" and other commands one might use to
tell a robot where to move.

Ich fürchte, das reicht nicht für den Anwendungsfall den Du hast.

Aber vielleicht passt auch eine der Apps unter
http://www.tldp.org/HOWTO/Speech-Recognition-HOWTO/software.html

Gruß
Rainer
--
* Der obenstehende Newsbeitrag spiegelt eine persönliche Meinung *
* des Authors wieder, basierend auf dessen Wissen und Erfahrung. *
* Diese Meinung wird nicht notwendigerweise vom Arbeitgeber des *
* Verfassers dieser Nachricht geteilt. Irrtum vorbehalten :-) *

Rainer Hattenhauer

ungelesen,
25.08.2006, 08:23:5925.08.06
an
Hallo,

> Nun bin ich seit langer Zeit auf ein professionellereres Betriebssystem
> umgestiegen und frage mich (weil ich im Moment VIELE Texte schreibe und des
> 10-Fingersystems nur ansatzweise mächtig bin), ob es für GNU/Linux auch ein
> Werkzeug gibt, mit dem man dem Rechner Sachen diktieren kann, die er dann
> in geschriebene Worte wandelt.

Nicht wirklich für produktive Zwecke, jedenfalls nicht nativ aus dem
GNU/Linux Softwarepool.

Mein "dirty workaround" (für den mich die Linux-Puristen jetzt natürlich
steinigen werden):

- VMware + irgendeine aktuelle Windows-Version (z.B. XP pro)
- Sprachsoftware: z.B. Dragon Naturally Speaking oder IBM Via Voice (ich
verwende letztere, da man dort auch schon in der günstigen Version
Sprachprofile übertragen kann)
- ein USB Headset: dieses lässt sich ganz hervorragend mit einer
aktuellen vmware (5.5) nutzen, da dort der USB-Port durchgeschleift
wird. Derartige Headsets funktionieren mit den erstellten Sprachprofilen
auch systemunabhängig.

Mit den o.g. Ausstattung konnte ich sogar unter Windows aufgenommene
Sprachprofile nutzen. Immerhin sparst du dir so den Dualboot zu Windows.

Gruß
Rainer

Henning Paul

ungelesen,
25.08.2006, 10:43:3525.08.06
an
Rainer Hattenhauer schrieb:

> - ein USB Headset: dieses lässt sich ganz hervorragend mit einer
> aktuellen vmware (5.5) nutzen, da dort der USB-Port durchgeschleift
> wird.

Auch bei 4.5 wird er durchgeschleift.

Gruß
Henning
--
henning paul home: http://www.geocities.com/hennichodernich
PM: henni...@gmx.de , ICQ: 111044613

Rainer Hattenhauer

ungelesen,
25.08.2006, 13:52:2825.08.06
an
Hallo,

> Auch bei 4.5 wird er durchgeschleift.
>

o.k., ich konnte es definitiv nur für 5.5 sagen, da ich es selbst damit
getestet habe. Mir war so, als hätten die Vmware Leute die USB
Unterstützung erst seit 5.5 großartig proklamiert.

Gruß
Rainer

Die Nachricht wurde gelöscht

Marcel A. W. Spitau

ungelesen,
26.08.2006, 06:05:4526.08.06
an
Hallo Rainer, hallo Leute,

Rainer Hattenhauer wrote:
>> Nun bin ich seit langer Zeit auf ein professionellereres Betriebssystem
>> umgestiegen und frage mich (weil ich im Moment VIELE Texte schreibe und
>> des 10-Fingersystems nur ansatzweise mächtig bin), ob es für GNU/Linux
>> auch ein Werkzeug gibt, mit dem man dem Rechner Sachen diktieren kann,
>> die er dann in geschriebene Worte wandelt.
>
> Nicht wirklich für produktive Zwecke, jedenfalls nicht nativ aus dem
> GNU/Linux Softwarepool.

Schade.


> Mein "dirty workaround" (für den mich die Linux-Puristen jetzt natürlich
> steinigen werden):

> [Beschreibung des Workaround]

Mhm naja, steinigen werde ich Dich da nicht, aber es ist halt nicht das was
ich suche. Ich möchte nicht jedes mal, wenn ich meinem Rechner etwas
diktiert habe per Copy and paste (geht das überhaupt bei vmware?) einfügen.
Was ich gerne hätte, wäre ein Tool, was in der Taskleiste mitläuft und auf
einen Befehl (Tastendruck oder "Zauberwort") anspringt und dass dann das
Gesprochene dort niederschreibt, wo sich gerade mein Cursor befindet.

Eigentlich schade, dass es soetwas nicht gibt, ich meine das wäre doch ein
Schritt in die Usability-Richtung, die man sich wünscht (also ich
jedenfalls ;) ).

Vielen Dank für Deinen Rat mit der vmware, aber ich denke, da werde ich mal
noch ein bisschen tippen üben ;)

Bis dann
Marcel


Marcel A. W. Spitau

ungelesen,
26.08.2006, 06:09:0326.08.06
an
Hallo Rainer, hallo Leute,

Rainer Koenig wrote:
> $ apt-cache search speech | grep reco
> libsphinx2-dev - speech recognition library - development kit
> libsphinx2g0 - speech recognition library
> sphinx2-bin - speech recognition utilities
> sphinx2-hmm-6k - speech recognition library - default acoustic model
>
> Description: speech recognition utilities
> Sphinx 2 is a real-time, speaker-independent speech recognition system.
> .
> This package contains examples and utilities that use Sphinx. It also
> includes a sample language model that is capable of recognizing simple
> commands like "go forward ten meters" and other commands one might use to
> tell a robot where to move.
>
> Ich fürchte, das reicht nicht für den Anwendungsfall den Du hast.

Das fürchte ich auch ;)

> Aber vielleicht passt auch eine der Apps unter
> http://www.tldp.org/HOWTO/Speech-Recognition-HOWTO/software.html

Vielen Dank für diese Liste, aber die Hälfte der Seiten ist tot und vom Rest
sind die Hälfte nach 2001 nicht mehr aktualisiert worden :-)

Komisch komisch, dass es augenscheinlich keine "Markt", bzw. keine
Bedürfnisse zu decken gibt.

Bis dann
Marcel

D. Roland Boehme

ungelesen,
26.08.2006, 08:15:5326.08.06
an
Hi Marcel!

Marcel A. W. Spitau schrieb:

> Vielen Dank für Deinen Rat mit der vmware, aber ich denke, da werde ich mal
> noch ein bisschen tippen üben ;)

Dafür,zumindest, gibt es ja was :-)

KTouch

Und im Ernst, ich fänd es auch nicht schlecht, eine Diktiersoftware zu
haben, weshalb ich diesen Diskussionsfaden mit Spannung verfolgt habe.
Andererseits, ich tippe recht schnell, das ist dann oft praktischer als
dem Compi "sprechen beizubringen".

Viel Erfolg!

Roland

Marcel A. W. Spitau

ungelesen,
26.08.2006, 08:32:5126.08.06
an
Hallo Roland,

D. Roland Boehme wrote:
> Marcel A. W. Spitau schrieb:
>
>> Vielen Dank für Deinen Rat mit der vmware, aber ich denke, da werde ich
>> mal noch ein bisschen tippen üben ;)
>
> Dafür,zumindest, gibt es ja was :-)
>
> KTouch

He, he daher auch meine nicht ganz ausgereifte Technik im 10-Fingersystem :)



> Und im Ernst, ich fänd es auch nicht schlecht, eine Diktiersoftware zu
> haben, weshalb ich diesen Diskussionsfaden mit Spannung verfolgt habe.
> Andererseits, ich tippe recht schnell, das ist dann oft praktischer als
> dem Compi "sprechen beizubringen".

Klar, dass ist prinzipiell richtig, aber ich denke wir leben im 21.
Jahrhundert und nun könnte es mal langsam in die Richtung gehen, dass sich
die Maschine dem Menschen anpasst und nicht ich mich der Maschine. Die
Kapazitäten und die Geschwindigkeit der Rechenoperationen sollten doch
soweit sein, dass nur noch eine kleine Einarbeitungsphase vorhanden sein
müsste, bis mich der Rechner "versteht". Bei meinen damaligen Test mit der
beschriebenen Software ging es auch "relativ" zügig bis der Rechner mich
verstanden hat.

Bis dann
Marcel

Dominique Görsch

ungelesen,
26.08.2006, 08:58:3026.08.06
an
Marcel A. W. Spitau schrieb:
> Klar, dass ist prinzipiell richtig, aber ich denke wir leben im 21.
> Jahrhundert und nun könnte es mal langsam in die Richtung gehen, dass sich
> die Maschine dem Menschen anpasst und nicht ich mich der Maschine. Die
> Kapazitäten und die Geschwindigkeit der Rechenoperationen sollten doch
> soweit sein, dass nur noch eine kleine Einarbeitungsphase vorhanden sein
> müsste, bis mich der Rechner "versteht". Bei meinen damaligen Test mit der
> beschriebenen Software ging es auch "relativ" zügig bis der Rechner mich
> verstanden hat.

Also ich habe vor etwa 10 Jahren unter Windows mit IBMs "Via Voice" und
"Voice Type Pro" von Logox (oder so ähnlich) rumgespielt. Um da an
halbwegs brauchbare Ergebnisse zu kommen, musste man einen sehr
umfangreichen Wortschatz trainieren. Das grenzte schon fast an das
Vorlesen und Korrigieren der Bibel und selbst dann war eine
Sprechgeschwindigkeit zu erreichen die deutlich under der
Tippgeschwindigkeit der meisten Computeranwender liegt.

Das Problem ist einfach die komplexität der gesprochenen Sprache, nicht
umsonst fällt es Synthesen auch schwer Sprache natürlich klingend zu
erzeugen. Wobei das erzeugen noch deutlich einfacher sein sollte, weil
da muss man sich nicht auf das Erkennen von zig Dialekten, Tonarten,
Sprechgeschwindigkeiten und -gewohnheiten einstellen.

Den Computer mit natürlich gesprochener Sprache zu steuern ist seit
langem anscheinend ein Traum und man rückt diesem immer näher, aber im
großen und ganzen sind es immernoch kurze Schlüsselwörter die
befehlsartig gesprochen werden.

Gruß
Dominique Görsch

Timo Freyer

ungelesen,
26.08.2006, 11:35:4526.08.06
an
Dominique Görsch <ma...@dgoersch.info> schrieb:

> Den Computer mit natürlich gesprochener Sprache zu steuern ist seit
> langem anscheinend ein Traum und man rückt diesem immer näher, aber im
> großen und ganzen sind es immernoch kurze Schlüsselwörter die

Etwas OT, aber soviel dazu.

http://www.youtube.com/watch?v=tLa3Wac4O2A


--
AMD Athlon XP 2400+ | 768 MB Ram | Kubuntu 6.06 | Opera 9.01 Build 400

[E-Mail Adresse ROT13 Verschlüsselt http://www.rot13.de]

Marcel A. W. Spitau

ungelesen,
26.08.2006, 11:55:4426.08.06
an
Timo Freyer wrote:
> Etwas OT, aber soviel dazu.
>
> http://www.youtube.com/watch?v=tLa3Wac4O2A

LOL hatte ich auch schon entdeckt:
http://mawspitau.blogspot.com

Aber so soll das in meiner Vorstellung NICHT funktionieren...

Marcel

Rainer Hattenhauer

ungelesen,
27.08.2006, 04:18:3127.08.06
an
Hallo Dominique,

muss doch noch mal kurz einhaken.

> Also ich habe vor etwa 10 Jahren unter Windows mit IBMs "Via Voice" und
> "Voice Type Pro" von Logox (oder so ähnlich) rumgespielt. Um da an
> halbwegs brauchbare Ergebnisse zu kommen, musste man einen sehr
> umfangreichen Wortschatz trainieren. Das grenzte schon fast an das
> Vorlesen und Korrigieren der Bibel und selbst dann war eine
> Sprechgeschwindigkeit zu erreichen die deutlich under der
> Tippgeschwindigkeit der meisten Computeranwender liegt.

Seit den letzten 10 Jahren hat sich sehr viel getan. Die aktuelle
Spracherkennungssoftware hat eine exzellente Erkennungsrate schon nach
einem relativ kurzen Training (bei mir ca. 1/2 Stunde).

Ich schreibe beispielsweise Gutachten, also Texte mit
ähnlichen/wiederkehrenden Passagen in Windeseile (als Programmierer der
alten Schule ist mir übrigens das Zehnfingersystem stets fremd gewesen,
war wohl auch zu faul, es zu lernen). Was man (bzw. ich) quasi vergessen
kann: Irgendwelche kreativen Texte (Bücher etc.) schreiben, bei denen
die Sätze im Kopf ständig verworfen und neu formuliert werden müssen.
Wer in der Lage ist, komplette Sätze schon im Kopf vorzustrukturieren,
diese quasi druckreif in den PC bringt, der ist auch hier im Vorteil.

Gruß
Rainer

Klaus von der Heyde

ungelesen,
28.08.2006, 03:09:5328.08.06
an
Dominique Görsch wrote:

> Also ich habe vor etwa 10 Jahren unter Windows mit IBMs "Via Voice" und
> "Voice Type Pro" von Logox (oder so ähnlich) rumgespielt. Um da an
> halbwegs brauchbare Ergebnisse zu kommen, musste man einen sehr
> umfangreichen Wortschatz trainieren. Das grenzte schon fast an das
> Vorlesen und Korrigieren der Bibel und selbst dann war eine
> Sprechgeschwindigkeit zu erreichen die deutlich under der
> Tippgeschwindigkeit der meisten Computeranwender liegt.

Das habe ich damals auch mal ausprobiert, weil es ja bei OS/2 Warp 4
mitgeliefert wurde ... und gleich wieder gelassen, weil es einfach zu
umständlich war.

> Den Computer mit natürlich gesprochener Sprache zu steuern ist seit
> langem anscheinend ein Traum und man rückt diesem immer näher, aber im
> großen und ganzen sind es immernoch kurze Schlüsselwörter die
> befehlsartig gesprochen werden.

Heutzutage sind die PCs aber viele 10000 mal leistunsfähiger als
damals, so dass man jetzt die Möglichkeit hat, auch kompliziertere
Verfahren zur Spracherkennung in Echtzeit einzusetzen.

Klaus

Allen antworten
Dem Autor antworten
Weiterleiten
0 neue Nachrichten