szukam czegoś do syntezy mowy, znalazłem festival. Może jest coś lepszego?
Nic mogę nic wygooglać, a festival jakoś zbyt mechanicznie gada.
Proszę o wskazanie odpowiedniej drogi :)
TC
> Witam grupowiczów,
>
> szukam czegoś do syntezy mowy, znalazłem festival. Może jest coś lepszego?
> Nic mogę nic wygooglać, a festival jakoś zbyt mechanicznie gada.
ivonka dziala pod linuxem calkiej niezle. Oczywiscie za ivonke musisz
zaplacic...
--
"Everything should be made as simple as possible,
but not simpler" - A. Einstein
> Witam grupowiczów,
>
> szukam czego¶ do syntezy mowy, znalaz³em festival. Mo¿e jest co¶
> lepszego? Nic mogê nic wygooglaæ, a festival jako¶ zbyt mechanicznie
> gada.
Milena? http://milena.polip.com/
ethanak
--
mailto=window.atob('ZXRoYW5ha0Bwb2xpcC5jb20=');
http://milena.polip.com/ - Nie bede czekac na Ivo :)
Gentoo wypisuje takie zależności:
> ~ # emerge -av orca
>
> These are the packages that would be merged, in order:
>
> Calculating dependencies... done!
> [ebuild N ] gnome-extra/at-spi-1.24.1 USE="X -debug -doc" 0 kB
> [ebuild N ] app-accessibility/espeak-1.40.02 USE="-portaudio -pulseaudio" 0 kB
> [ebuild N ] app-accessibility/gnome-speech-0.4.25 USE="espeak -debug -festival -freetts" 0 kB
> [ebuild N ] app-accessibility/gnome-mag-0.15.5 USE="X -debug" 484 kB
> [ebuild N ] app-accessibility/orca-2.24.4 USE="-debug" 0 kB
>
> Total: 5 packages (5 new), Size of downloads: 484 kB
>
po dodaniu flag:
portaudio, pulseaudio, espeak, festival ...
wygląda to tak:
> # emerge -av orca
>
> These are the packages that would be merged, in order:
>
> Calculating dependencies... done!
> [ebuild N ] dev-libs/libatomic_ops-1.2-r1 180 kB
> [ebuild N ] dev-util/unifdef-1.20 65 kB
> [ebuild N ] gnome-extra/at-spi-1.24.1 USE="X -debug -doc" 0 kB
> [ebuild N ] app-accessibility/speech-tools-1.2.96_beta USE="X esd -nas" 1,246 kB
> [ebuild N ] media-libs/portaudio-19_pre20071207 USE="alsa cxx oss -debug -jack" 1,088 kB
> [ebuild N ] media-libs/speex-1.2_rc1 USE="ogg sse" 1,037 kB
> [ebuild N ] net-wireless/bluez-utils-3.36 USE="alsa cups gstreamer usb -debug -examples -old-daemons -test-programs" 932 kB
> [ebuild N ] app-accessibility/gnome-mag-0.15.5 USE="X -debug" 484 kB
> [ebuild N ] app-accessibility/festival-1.96_beta-r1 USE="alsa -mbrola" 15,893 kB
> [ebuild N ] media-sound/pulseaudio-0.9.14 USE="X alsa bluetooth dbus glib gnome hal oss tcpd -asyncns -avahi -caps -jack -libsamplerate -lirc (-policykit)" 1,273 kB
> [ebuild N ] app-accessibility/espeak-1.40.02 USE="portaudio pulseaudio" 0 kB
> [ebuild N ] app-accessibility/gnome-speech-0.4.25 USE="espeak festival -debug -freetts" 0 kB
> [ebuild N ] app-accessibility/orca-2.24.4 USE="-debug" 0 kB
>
> Total: 13 packages (13 new), Size of downloads: 22,193 kB
>
> Would you like to merge these packages? [Yes/No]
andy
> andy
> [...]
> No i zrobione, orca gada ale z angielskim akcentem.
Naprawdę musisz udowadniac wszystkim że jesteś idiotą?
ethanak
PS. Przepraszam, KF mi wyekspirował...
--
mailto=window.atob('ZXRoYW5ha0Bwb2xpcC5jb20=');
http://milena.polip.com/ - nie czekam na Ivo!
Nie wiem kto jest większym idiotą.
> http://milena.polip.com/ - nie czekam na Ivo! <===
Ivona jest już gotowa i nie trzeba już na nią czekać :-)
Po co pisać jeszcze raz podobny program skoro to już jest i działa dobrze.
Każdy średno zaawansowany linuksiarz może sobie zaistalować w ciągu 1
godziny programy aby poeksperymentować z TTS.
Pokazałem, że to nie jest trudne i nie trzeba wyważać otwartych drzwi.
> Po co pisać jeszcze raz podobny program skoro to już jest i działa
> dobrze.
> Każdy średno zaawansowany linuksiarz może sobie zaistalować w ciągu 1
> godziny programy aby poeksperymentować z TTS.
> Pokazałem, że to nie jest trudne i nie trzeba wyważać otwartych drzwi.
Niewykluczone, że ja tu jestem większym idiotą, ale Ivona czasem nie jest płatna? Więc może po to, żeby właśnie nie płacić?
--
Z poważaniem,
Michał Górny
<http://mailnull.com/w?au=f6744c6f5e097cc9816a562802f331c2>
<xmpp:mgo...@jabster.pl>
> On Wed, 15 Apr 2009 09:17:07 +0200, andy <and...@gazeta.pl> wrote:
>
>> Po co pisać jeszcze raz podobny program skoro to już jest i działa
>> dobrze.
>> Każdy średno zaawansowany linuksiarz może sobie zaistalować w ciągu 1
>> godziny programy aby poeksperymentować z TTS. Pokazałem, że to nie jest
>> trudne i nie trzeba wyważać otwartych drzwi.
>
> Niewykluczone, że ja tu jestem większym idiotą, ale Ivona czasem nie
> jest płatna? Więc może po to, żeby właśnie nie płacić?
Jest to tylko jeden z powodów. Z Ivoną również eksperymentowałem (moduł
do speech-dispatchera, ivona-tools, booksplit) - tyle że od roku jakoś
nie mogę się doczekać obiecanej wersji Desktop.
Poza tym ograniczenia licencyjne "domowej" Ivony (Desktop, Expressivo)
nie pozwalają na publikację wygenerowanej mowy nawet w celach
niekomercyjnych - w wielu przypadkach dyskwalifikuje to Ivonę.
Bardzo ważne jest również to, że Ivona stanowi zamknięty system szumnie
nazwany TTS (w rzeczywistości to tylko syntezator) i uzytkownik nie ma
wpływu na wiele parametrów wymowy, że nie wspomnę już o bardziej
zaawansowanych technikach wymowy wyrazów obcych (oparcie słownika na
wyrażeniach regularnych nie jest najszczęśliwszym pomysłem). W przypadku
Mileny użytkownik ma dostęp do wszystkich parametrów, od słowników
począwszy, poprzez dodatkowe reguły translacji aż po obwiednie intonacji.
Jedynym ograniczeniem jest tu Mbrola użyta jako silnik wymowy, a ściślej
nie tyle sama Mbrola, co fatalna jakość jedynego dostępnego polskiego
głosu.
Przykładowo - w bardzo prosty sposób można zmusić Milenę do przesadnego
akcentowania bardzo przydatnego przy wysokim poziomie tła czy też niskiej
jakości toru odtwarzania (np. kodeki gsm). W wielu przypadkach mowa
generowana przez Milenę po przejściu przez telefon jest bardziej czytelna
niż ta sama treść wygenerowana przez Ivonę, nawet gdy szybkość wymowy
Mileny jest większa niż Ivony.
A najważniejsze (czego kolega andy - który nota bene znalazł się tam
gdzie jego miejsce, czyli na dnie KF-a - nie raczył zauważyć) Milena to
_pełny_ system TTS, czyli taki, który potrafi w miarę prawidłowo
przeczytać nieobrobiony tekst (np. książkę, newsa itp). Spróbuj zresztą
porównać odczytywane przez Ivonę artykuły na Onecie z tymi samymi
artykułami przepuszczonymi bez żadnej obróbki wstępnej (poza ew.
milenizerem jako konwerterem na ISO-2) przez Milenę.
I z własnego doświadczenia: po setkach godzin słuchania książek
przetwarzanych przez Ivonę i również setkach (a może i więcej) słuchania
Mileny nie wyobrażam sobie teraz powrotu do Ivony - chyba że Ivo Software
naprawdę postara się zrobic syntezator który prawidłowo akcentuje grupy
wyrazów (np. "nie" przed czasownikiem czy zbitki jednosylabowych wyrazów
na końcu frazy), który nie będzie wymagał jakichś potężnych słowników po
to aby w wyrazie rozpoczynającym się na "cab" czytać "k". Taki, w którym
"naturalność" wymowy nie ograniczy się do brzmienia głosu czy
artystycznej wymowy pojedynczych słów, ale będzie naturalnie czytał
zdanie w języku polskim. Bo na razie oba głosy Ivony maja potężne
problemy z odróżnieniem "mnie na nie stać" i "mnie ma nie stać" :)
No i jeszcze drobiazg...
Milenę ogranicza jedynie dostępność Mbroli na daną platformę sprzętową.
Po drobnych modyfikacjach może byc skompilowana na wszystko na co się da
skompilować program w C/C++. Moje ciche marzenie to taki przenośny
czytnik książek, z regulacją tempa, artykulacji, możliwością korekty na
bieżąco słownika i w ogóle tego typu bajerami - może jak się trochę czasu
znajdzie to się na ten temat rzucę :)
ethanak
--
mailto=window.atob('ZXRoYW5ha0Bwb2xpcC5jb20=');
> Niewykluczone, że ja tu jestem większym idiotą, ale Ivona czasem nie jest płatna? Więc może po to, żeby właśnie nie płacić?
>
Nie nazywałbym idiotą osoby, która chce zapłacić za dobry soft jeśli to
jest potrzebne do jego pracy.
To chyba dobrze, że wreszcie powstają profesjonalne programy na linuksa
i są osoby, które potrafią zarobić na tym.
A co z osobą, która chce zapłacić za soft kiepski, gdy na rynku jest
darmowy lepszy? <gs6kfm$5cl$1...@news.onet.pl>
Jakoś opinię ethanaka, zwłaszcza tak popartą argumentami, cenię sobie
wyżej niż mgliste określenie "dobry soft" niejakiego andy'ego, który się
nie raz i nie dwa popisał ogromem wiedzy technicznej.
> To chyba dobrze, że wreszcie powstają profesjonalne programy na linuksa
> i są osoby, które potrafią zarobić na tym.
--
Stanislaw Klekot
Ja Twojego KF-a mam w d...
Nie mniej jednak dzięki za te informacje dotyczące TTS.
Kogoś to zapewne zaciekawi.
Mnie nie bo ja tylko zajmuję się budowqniem systemów desktopowych a tts
to była tylko mała przerwa podczas aktualizacji systemu (ponad 500
pakietów do rekompilacji).
Powodzenia,
andy