Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

synteza mowy w linuxie

12 views
Skip to first unread message

TC

unread,
Apr 14, 2009, 4:57:17 AM4/14/09
to
Witam grupowiczów,

szukam czegoś do syntezy mowy, znalazłem festival. Może jest coś lepszego?
Nic mogę nic wygooglać, a festival jakoś zbyt mechanicznie gada.

Proszę o wskazanie odpowiedniej drogi :)

TC


Dr Dex

unread,
Apr 14, 2009, 5:19:29 AM4/14/09
to
TC wrote:

> Witam grupowiczów,
>
> szukam czegoś do syntezy mowy, znalazłem festival. Może jest coś lepszego?
> Nic mogę nic wygooglać, a festival jakoś zbyt mechanicznie gada.

ivonka dziala pod linuxem calkiej niezle. Oczywiscie za ivonke musisz
zaplacic...

--
"Everything should be made as simple as possible,
but not simpler" - A. Einstein

R.M.

unread,
Apr 14, 2009, 5:20:14 AM4/14/09
to

WebSmok

unread,
Apr 14, 2009, 5:51:33 AM4/14/09
to

Użytkownik "TC" <no_...@o2.pl> napisał w wiadomości
news:gs1jmm$e2g$1...@nemesis.news.neostrada.pl...
Jest taki screnreader "Orca" używany przez niewidomych
prawdopodobnie jest on powiązany z jakimiś syntezatorami...
WebSmok


ethanak

unread,
Apr 14, 2009, 6:39:54 AM4/14/09
to
Dnia Tue, 14 Apr 2009 10:57:17 +0200, TC napisał(a):

> Witam grupowiczów,
>
> szukam czego¶ do syntezy mowy, znalaz³em festival. Mo¿e jest co¶
> lepszego? Nic mogê nic wygooglaæ, a festival jako¶ zbyt mechanicznie
> gada.

Milena? http://milena.polip.com/

ethanak
--
mailto=window.atob('ZXRoYW5ha0Bwb2xpcC5jb20=');
http://milena.polip.com/ - Nie bede czekac na Ivo :)

andy

unread,
Apr 14, 2009, 6:52:09 AM4/14/09
to
WebSmok pisze:

Gentoo wypisuje takie zależności:
> ~ # emerge -av orca
>
> These are the packages that would be merged, in order:
>
> Calculating dependencies... done!
> [ebuild N ] gnome-extra/at-spi-1.24.1 USE="X -debug -doc" 0 kB
> [ebuild N ] app-accessibility/espeak-1.40.02 USE="-portaudio -pulseaudio" 0 kB
> [ebuild N ] app-accessibility/gnome-speech-0.4.25 USE="espeak -debug -festival -freetts" 0 kB
> [ebuild N ] app-accessibility/gnome-mag-0.15.5 USE="X -debug" 484 kB
> [ebuild N ] app-accessibility/orca-2.24.4 USE="-debug" 0 kB
>
> Total: 5 packages (5 new), Size of downloads: 484 kB
>
po dodaniu flag:
portaudio, pulseaudio, espeak, festival ...
wygląda to tak:
> # emerge -av orca
>
> These are the packages that would be merged, in order:
>
> Calculating dependencies... done!
> [ebuild N ] dev-libs/libatomic_ops-1.2-r1 180 kB
> [ebuild N ] dev-util/unifdef-1.20 65 kB
> [ebuild N ] gnome-extra/at-spi-1.24.1 USE="X -debug -doc" 0 kB
> [ebuild N ] app-accessibility/speech-tools-1.2.96_beta USE="X esd -nas" 1,246 kB
> [ebuild N ] media-libs/portaudio-19_pre20071207 USE="alsa cxx oss -debug -jack" 1,088 kB
> [ebuild N ] media-libs/speex-1.2_rc1 USE="ogg sse" 1,037 kB
> [ebuild N ] net-wireless/bluez-utils-3.36 USE="alsa cups gstreamer usb -debug -examples -old-daemons -test-programs" 932 kB
> [ebuild N ] app-accessibility/gnome-mag-0.15.5 USE="X -debug" 484 kB
> [ebuild N ] app-accessibility/festival-1.96_beta-r1 USE="alsa -mbrola" 15,893 kB
> [ebuild N ] media-sound/pulseaudio-0.9.14 USE="X alsa bluetooth dbus glib gnome hal oss tcpd -asyncns -avahi -caps -jack -libsamplerate -lirc (-policykit)" 1,273 kB
> [ebuild N ] app-accessibility/espeak-1.40.02 USE="portaudio pulseaudio" 0 kB
> [ebuild N ] app-accessibility/gnome-speech-0.4.25 USE="espeak festival -debug -freetts" 0 kB
> [ebuild N ] app-accessibility/orca-2.24.4 USE="-debug" 0 kB
>
> Total: 13 packages (13 new), Size of downloads: 22,193 kB
>
> Would you like to merge these packages? [Yes/No]

andy

andy

unread,
Apr 14, 2009, 9:23:20 AM4/14/09
to
andy pisze:

> WebSmok pisze:
>> Użytkownik "TC" <no_...@o2.pl> napisał w wiadomości
>> news:gs1jmm$e2g$1...@nemesis.news.neostrada.pl...
>>> Witam grupowiczów,
>>>
>>> szukam czegoś do syntezy mowy, znalazłem festival. Może jest coś lepszego?
>>> Nic mogę nic wygooglać, a festival jakoś zbyt mechanicznie gada.
>>>
>>> Proszę o wskazanie odpowiedniej drogi :)
>>>
>>> TC
>> Jest taki screnreader "Orca" używany przez niewidomych
>> prawdopodobnie jest on powiązany z jakimiś syntezatorami...
>> WebSmok
>>
>>
>
No i zrobione, orca gada ale z angielskim akcentem.
To samo jest na konsoli:
~ $ echo "My name is Andrew" | festival --tts
Jednsk lepsze są te płatne, spolszczone programy.

> andy

ethanak

unread,
Apr 14, 2009, 12:11:37 PM4/14/09
to
Dnia Tue, 14 Apr 2009 15:23:20 +0200, andy napisał(a):

> [...]


> No i zrobione, orca gada ale z angielskim akcentem.


Naprawdę musisz udowadniac wszystkim że jesteś idiotą?

ethanak
PS. Przepraszam, KF mi wyekspirował...
--
mailto=window.atob('ZXRoYW5ha0Bwb2xpcC5jb20=');
http://milena.polip.com/ - nie czekam na Ivo!

andy

unread,
Apr 15, 2009, 3:17:07 AM4/15/09
to
ethanak pisze:

> Dnia Tue, 14 Apr 2009 15:23:20 +0200, andy napisał(a):
>
>> [...]
>> No i zrobione, orca gada ale z angielskim akcentem.
>
>
> Naprawdę musisz udowadniac wszystkim że jesteś idiotą?
>
> ethanak
> PS. Przepraszam, KF mi wyekspirował...

Nie wiem kto jest większym idiotą.
> http://milena.polip.com/ - nie czekam na Ivo! <===
Ivona jest już gotowa i nie trzeba już na nią czekać :-)
Po co pisać jeszcze raz podobny program skoro to już jest i działa dobrze.
Każdy średno zaawansowany linuksiarz może sobie zaistalować w ciągu 1
godziny programy aby poeksperymentować z TTS.
Pokazałem, że to nie jest trudne i nie trzeba wyważać otwartych drzwi.

Michał Górny

unread,
Apr 15, 2009, 11:47:49 AM4/15/09
to
On Wed, 15 Apr 2009 09:17:07 +0200, andy <and...@gazeta.pl> wrote:

> Po co pisać jeszcze raz podobny program skoro to już jest i działa
> dobrze.
> Każdy średno zaawansowany linuksiarz może sobie zaistalować w ciągu 1
> godziny programy aby poeksperymentować z TTS.
> Pokazałem, że to nie jest trudne i nie trzeba wyważać otwartych drzwi.

Niewykluczone, że ja tu jestem większym idiotą, ale Ivona czasem nie jest płatna? Więc może po to, żeby właśnie nie płacić?

--
Z poważaniem,
Michał Górny

<http://mailnull.com/w?au=f6744c6f5e097cc9816a562802f331c2>
<xmpp:mgo...@jabster.pl>

ethanak

unread,
Apr 16, 2009, 2:50:30 AM4/16/09
to
Dnia Wed, 15 Apr 2009 17:47:49 +0200, Michał Górny napisał(a):

> On Wed, 15 Apr 2009 09:17:07 +0200, andy <and...@gazeta.pl> wrote:
>
>> Po co pisać jeszcze raz podobny program skoro to już jest i działa
>> dobrze.
>> Każdy średno zaawansowany linuksiarz może sobie zaistalować w ciągu 1
>> godziny programy aby poeksperymentować z TTS. Pokazałem, że to nie jest
>> trudne i nie trzeba wyważać otwartych drzwi.
>
> Niewykluczone, że ja tu jestem większym idiotą, ale Ivona czasem nie
> jest płatna? Więc może po to, żeby właśnie nie płacić?

Jest to tylko jeden z powodów. Z Ivoną również eksperymentowałem (moduł
do speech-dispatchera, ivona-tools, booksplit) - tyle że od roku jakoś
nie mogę się doczekać obiecanej wersji Desktop.

Poza tym ograniczenia licencyjne "domowej" Ivony (Desktop, Expressivo)
nie pozwalają na publikację wygenerowanej mowy nawet w celach
niekomercyjnych - w wielu przypadkach dyskwalifikuje to Ivonę.

Bardzo ważne jest również to, że Ivona stanowi zamknięty system szumnie
nazwany TTS (w rzeczywistości to tylko syntezator) i uzytkownik nie ma
wpływu na wiele parametrów wymowy, że nie wspomnę już o bardziej
zaawansowanych technikach wymowy wyrazów obcych (oparcie słownika na
wyrażeniach regularnych nie jest najszczęśliwszym pomysłem). W przypadku
Mileny użytkownik ma dostęp do wszystkich parametrów, od słowników
począwszy, poprzez dodatkowe reguły translacji aż po obwiednie intonacji.
Jedynym ograniczeniem jest tu Mbrola użyta jako silnik wymowy, a ściślej
nie tyle sama Mbrola, co fatalna jakość jedynego dostępnego polskiego
głosu.

Przykładowo - w bardzo prosty sposób można zmusić Milenę do przesadnego
akcentowania bardzo przydatnego przy wysokim poziomie tła czy też niskiej
jakości toru odtwarzania (np. kodeki gsm). W wielu przypadkach mowa
generowana przez Milenę po przejściu przez telefon jest bardziej czytelna
niż ta sama treść wygenerowana przez Ivonę, nawet gdy szybkość wymowy
Mileny jest większa niż Ivony.

A najważniejsze (czego kolega andy - który nota bene znalazł się tam
gdzie jego miejsce, czyli na dnie KF-a - nie raczył zauważyć) Milena to
_pełny_ system TTS, czyli taki, który potrafi w miarę prawidłowo
przeczytać nieobrobiony tekst (np. książkę, newsa itp). Spróbuj zresztą
porównać odczytywane przez Ivonę artykuły na Onecie z tymi samymi
artykułami przepuszczonymi bez żadnej obróbki wstępnej (poza ew.
milenizerem jako konwerterem na ISO-2) przez Milenę.

I z własnego doświadczenia: po setkach godzin słuchania książek
przetwarzanych przez Ivonę i również setkach (a może i więcej) słuchania
Mileny nie wyobrażam sobie teraz powrotu do Ivony - chyba że Ivo Software
naprawdę postara się zrobic syntezator który prawidłowo akcentuje grupy
wyrazów (np. "nie" przed czasownikiem czy zbitki jednosylabowych wyrazów
na końcu frazy), który nie będzie wymagał jakichś potężnych słowników po
to aby w wyrazie rozpoczynającym się na "cab" czytać "k". Taki, w którym
"naturalność" wymowy nie ograniczy się do brzmienia głosu czy
artystycznej wymowy pojedynczych słów, ale będzie naturalnie czytał
zdanie w języku polskim. Bo na razie oba głosy Ivony maja potężne
problemy z odróżnieniem "mnie na nie stać" i "mnie ma nie stać" :)

No i jeszcze drobiazg...

Milenę ogranicza jedynie dostępność Mbroli na daną platformę sprzętową.
Po drobnych modyfikacjach może byc skompilowana na wszystko na co się da
skompilować program w C/C++. Moje ciche marzenie to taki przenośny
czytnik książek, z regulacją tempa, artykulacji, możliwością korekty na
bieżąco słownika i w ogóle tego typu bajerami - może jak się trochę czasu
znajdzie to się na ten temat rzucę :)

ethanak
--
mailto=window.atob('ZXRoYW5ha0Bwb2xpcC5jb20=');

andy

unread,
Apr 16, 2009, 2:53:11 AM4/16/09
to
Michał Górny pisze:

> Niewykluczone, że ja tu jestem większym idiotą, ale Ivona czasem nie jest płatna? Więc może po to, żeby właśnie nie płacić?
>

Nie nazywałbym idiotą osoby, która chce zapłacić za dobry soft jeśli to
jest potrzebne do jego pracy.
To chyba dobrze, że wreszcie powstają profesjonalne programy na linuksa
i są osoby, które potrafią zarobić na tym.

Stachu 'Dozzie' K.

unread,
Apr 16, 2009, 3:02:03 AM4/16/09
to
On 16.04.2009, andy wrote:
> Michał Górny pisze:
>
>> Niewykluczone, że ja tu jestem większym idiotą, ale Ivona czasem nie jest płatna? Więc może po to, żeby właśnie nie płacić?
>>
>
> Nie nazywałbym idiotą osoby, która chce zapłacić za dobry soft jeśli to
> jest potrzebne do jego pracy.

A co z osobą, która chce zapłacić za soft kiepski, gdy na rynku jest
darmowy lepszy? <gs6kfm$5cl$1...@news.onet.pl>
Jakoś opinię ethanaka, zwłaszcza tak popartą argumentami, cenię sobie
wyżej niż mgliste określenie "dobry soft" niejakiego andy'ego, który się
nie raz i nie dwa popisał ogromem wiedzy technicznej.

> To chyba dobrze, że wreszcie powstają profesjonalne programy na linuksa
> i są osoby, które potrafią zarobić na tym.

--
Stanislaw Klekot

andy

unread,
Apr 16, 2009, 3:19:02 AM4/16/09
to
ethanak pisze:
/.../

> A najważniejsze (czego kolega andy - który nota bene znalazł się tam
> gdzie jego miejsce, czyli na dnie KF-a - nie raczył zauważyć) Milena to
> _pełny_ system TTS, czyli taki, który potrafi w miarę prawidłowo
> przeczytać nieobrobiony tekst (np. książkę, newsa itp). Spróbuj zresztą
> porównać odczytywane przez Ivonę artykuły na Onecie z tymi samymi
> artykułami przepuszczonymi bez żadnej obróbki wstępnej (poza ew.
> milenizerem jako konwerterem na ISO-2) przez Milenę.
>
/.../
> ethanak

Ja Twojego KF-a mam w d...
Nie mniej jednak dzięki za te informacje dotyczące TTS.
Kogoś to zapewne zaciekawi.
Mnie nie bo ja tylko zajmuję się budowqniem systemów desktopowych a tts
to była tylko mała przerwa podczas aktualizacji systemu (ponad 500
pakietów do rekompilacji).

Powodzenia,
andy

0 new messages