Știe cineva de vreun proiect românesc public de "natural eSpeak" pe limba română?

181 views
Skip to first unread message

Constantin Teodorescu

unread,
Sep 22, 2017, 9:16:21 AM9/22/17
to TIC-Lobby Group
Avusei nevoie acum ceva timp de așa ceva, să găvărească un soft dintr-o tabletă niște mesaje primite ca text, în română, cu voce naturală pentru niște persoane cu handicap de vedere!
Tot câutând eu (e adevărat, nu foarte mult) am găsit niște jumătăți de încercări, nici una foarte bine dusă până la capăt, dar din câte îmi aduc eu aminte, parcă era menționat undeva că era finanțat de la buget, pe cercetare.
Dacă îmi aduc eu bine aminte, parcă era o echipă de pe la Cluj.

Întrebare: știe cineva de vreun astfel de proiect FINANȚAT DIN SURSE PUBLICE, care să fi dat și ceva rezultate și care să poată fi luat, cu tot cu surse, și folosit în continuare?

Sau e păstrat subiectul mai în penumbră, să poată fi finanțat periodic, spre marea bucurie a unora care nu duc niciodată munca până la capăt?
Sau rezultate există, dar sunt folosite de niște firme pentru produse comerciale (cum ar fi Carmen din Ivona) ?

Mulțam fain pentru atenție,
Teo
P.S. Am testat oareșce produse atunci da' toate sunau ca Stephen Hawking! ;-)

Octavian Rasnita

unread,
Sep 22, 2017, 11:10:06 AM9/22/17
to tic-...@googlegroups.com
Salut Teo,
 
Singurele sinteze vocale naturale suficient de bune pentru a fi luate in considerare sunt comerciale.
Sunt vocile Carmen, Simona, si vocea Ioana care are si o varianta masculina Mihai care foloseste acelasi motor.
Mai este si vocea Ancutza creata de firma Baum, dar suna foarte rau. Nu stiu pe nimeni care sa o foloseasca. Face mai degraba parte din categoria sintezelor robotice.
 
Ioana este sinteza implicita pentru iPhone incepand cu iOS 7. Inainte se folosea vocea Simona.
Cred ca exista varianta de Carmen pentru Android.
 
Cu sintezele vocale e o loterie. Exista foarte putine motoare de sinteze vocale de calitate in toata lumea. Chiar daca exista bune intentii, este posibil sa se depuna eforturi foarte mari dar in final vocea sa iasa prost.
In afara de cazul firmei Baum pe care o suspectez de bune intentii, in restul cazurilor nu as baga mana ca a fost vorba despre altceva decat de obtinerea unor fonduri.
 
Daca cineva chiar ar vrea sa faca o sinteza vocala naturala de calitate buna, cred ca cel mai bine ar fi sa faca un research si sa vada (cu urechile) care sunt sintezele straine de calitate buna, si sa incerce sa colaboreze cu producatorul ei, sa foloseasca acelasi motor folosind reguli pentru limba romana.
In caz contrar, adica daca se incearca dezvoltarea de la zero, exista o mica sansa sa se creeze o sinteza extraordinara, dar si un risc mult mai mare de a crea ceva inutilizabil.
 
De auzit am auzit si eu de un proiect al unora din Cluj, si de un alt proiect al celor de la ICI, dar nu stiu mai mult decat atat si nici nu cunosc alti orbi care sa fi avut legatura cu acele proiecte si care sa poata da mai multe detalii.
 
--Octavian
--
--
YOU OWN YOUR OWN WORDS
Aţi primit acest mesaj pentru că sunteţi abonat la "TIC-Lobby Group".
Pentru a posta în acest grup, trimiteţi e-mail la tic-...@googlegroups.com
Pentru a vă dezabona de la acest grup, trimiteţi un e-mail la tic-lobby-...@googlegroups.com
Pentru mai multe opţiuni, vizitaţi acest grup la http://groups.google.com/group/tic-lobby?hl=ro
---
Ați primit acest mesaj deoarece sunteți abonat(ă) la grupul „TIC-Lobby Group” din Grupuri Google.
Pentru a vă dezabona de la acest grup și pentru a nu mai primi e-mailuri de la acesta, trimiteți un e-mail la adresa tic-lobby+...@googlegroups.com.
Pentru mai multe opțiuni, accesați https://groups.google.com/d/optout.

Paul Fogarassy

unread,
Sep 22, 2017, 11:36:25 AM9/22/17
to tic-...@googlegroups.com

O voce naturală folosește algoritmul „unit selection” (long story). Speech enginul pentru așa ceva este scump și nu e dezvoltat din surse publice. La fel, unitățile vocale sunt reprezintă rezultatul a multe zeci-sute de ore de înregistrare urmate de post-procesare manuală sau semi-automată (și costă mult). Într-adevăr, singurii care au primit fonduri publice pentru dezvoltarea unei voci românești naturale sunt cei de la o firmă din Cluj (nu mai știu cine, că au trecut mulți ani de atunci), cu rezultate foarte bune.

 

Faptul că un rezultat este realizat (în mod obligatoriu daor parțial, cam 40-50%) din fonduri publice, nu îl face automat proprietate publică și nici neapărat open source. Dimpotrivă, finanțarea cercetării industriale din fonduri publice are ca scop realizarea unui produs comercial, al cărui drept de proprietate intelectuală aparține unuia sau mai multor membrii din consorțiu. Cam acesta este (din câte știu) statutul „vocii de la Cluj”, despre care demult nu am mai auzit.

 

Singura voce românească gratuită (de puțin timp) este Ancutza, realizată de firma Baum Engineering. Dezvoltarea nu s-a făcut din fonduri publice. Din păcate, aceasta a fost realizată demult și nu este (deci) o voce naturală, ci este o voce realizată prin algoritmul de concatenare a difonilor. Avantajul este că folosește foarte puține resurse, putând fi folosită cam pe orice dispozitiv care mai are încă întregi condensatorii de pe placa de bază; dezavantajul este că nefiind voce naturală are un timbru robotic.

 

Deși Ancutza este gratuită, acest lucru este valabil doar pentru persoane fizice. Ancutza nu poate fi folosită pentru aplicații comerciale etc. Totuși, poate fi descărcată „la liber”, fie SAPI5 pentru Windows, fie compilată pentru Linux (nu mai știu care distribuții).

 

Până când găsiți o voce care să fie și naturală, și gratuită, puteți folosi această voce (fără surse). Dacă nu aveți o soluție mai bună și doriți să o includeți în vreo aplicație comercială, vă rog să mă căutați și discutăm amănuntele.

 

Cu stimă,

Dr.ing. Paul FOGARASSY

Director BAUM Engineering

tel. +40 729 099 260

www.baum.ro


From: tic-...@googlegroups.com [mailto:tic-...@googlegroups.com] On Behalf Of Constantin Teodorescu
Sent: Friday, September 22, 2017 4:16 PM
To: TIC-Lobby Group
Subject: TIC-Lobby: Știe cineva de vreun proiect românesc public de "natural eSpeak" pe limba română?

 

Avusei nevoie acum ceva timp de așa ceva, să găvărească un soft dintr-o tabletă niște mesaje primite ca text, în română, cu voce naturală pentru niște persoane cu handicap de vedere!

--

--
YOU OWN YOUR OWN WORDS
Aţi primit acest mesaj pentru că sunteţi abonat la "TIC-Lobby Group".
Pentru a posta în acest grup, trimiteţi e-mail la tic-...@googlegroups.com
Pentru a vă dezabona de la acest grup, trimiteţi un e-mail la tic-lobby-...@googlegroups.com
Pentru mai multe opţiuni, vizitaţi acest grup la http://groups.google.com/group/tic-lobby?hl=ro
---
Ați primit acest mesaj deoarece sunteți abonat(ă) la grupul „TIC-Lobby Group” din Grupuri Google.
Pentru a vă dezabona de la acest grup și pentru a nu mai primi e-mailuri de la acesta, trimiteți un e-mail la adresa tic-lobby+...@googlegroups.com.
Pentru mai multe opțiuni, accesați https://groups.google.com/d/optout.

 

Virus-free. www.avg.com

Constantin Teodorescu

unread,
Sep 23, 2017, 3:23:00 AM9/23/17
to TIC-Lobby Group
On Friday, September 22, 2017 at 6:36:25 PM UTC+3, Paul Fogarassy wrote:

Singura voce românească gratuită (de puțin timp) este Ancutza, realizată de firma Baum Engineering. Dezvoltarea nu s-a făcut din fonduri publice. Din păcate, aceasta a fost realizată demult și nu este (deci) o voce naturală, ci este o voce realizată prin algoritmul de concatenare a difonilor. Avantajul este că folosește foarte puține resurse, putând fi folosită cam pe orice dispozitiv care mai are încă întregi condensatorii de pe placa de bază; dezavantajul este că nefiind voce naturală are un timbru robotic.


Știam de Ancutza, nu sună rău, pentru o avertizare automată de pericol, o confirmare verbală sau o ghidare prin meniu merge.

Nu mă interesa pentru aplicații comerciale, printre picături mai scriu mici progrămele pe Linux/Android cu care încerc să le fac viața mai ușoară alor mei, taică-miu apropiindu-se de 90 de ani.
Ocazie cu care constat cât de neprietenoase sunt toate divaisurile și aplicațiile moderne pentru persoane care văd și aud cu greutate. 
Pe tema asta am scris în ITTrends un articol: https://ittrends.ro/2017/03/no-software-for-old-man/

Am testat și în Linux espeak, nici el nu e strălucit.

Am mai găsit acum la căutări:
  • Phobos : http://www.phobos.ro/demos/tts/index.html bazat pe mbrola ( http://tcts.fpms.ac.be/synthesis/mbrola.html ).
  • ROMANIAN ANONYMOUS SPEECH CORPUS (RASC) RASC este un portal destinat colectării unui corpus de voce pentru limba română, cu scopul de a pune la dispoziţia comunităţii de cercetare și open-source a unor resurse absolut necesare pentru dezvoltarea unor sisteme de recunoaștere a vorbirii continue. Toate resursele colectate aici împreună cu modelele acustice antrenate pe acest corpus vor fi făcute publice sub licenţă GPL.
  • Romanian TTS http://romaniantts.com/  This online demo of Romanian text-to-speech systems is a result of two different projects:
    • 1) The PRODOC Project, funded by the European Social Fund, under grant agreement POSDRU/6/1.5/S/5 which offered a 6 month research scholarship to Adriana Stan at The Centre for Speech Technology Research, University of Edinburgh, UK, under the supervision of prof. Simon KING, dr. Junichi Yamagishi and dr. Matthew Aylett. During this visit the first version of the Romanian TTS system was developed, and it was based on the RSS Database and Cereproc's front-end framework.
    • 2) The SWARA Project, funded by the Romanian Ministry of Education under grant agreement PN-II-PT-PCCA-2013-4 No 6/2014, which aims at providing a portable, fast and easy to use assistive speech synthesis system for laryngectomized patients, enabling them to interact in an almost natural manner with other social participants by using a customised voice. SWARA is a collaborative project between The Technical University of Cluj-Napoca, SC FORTECH SRL, Iuliu Haţieganu University of Medicine and Pharmacy Cluj-Napoca and Babeş-Bolyai University, Cluj-Napoca. Two of the major results of this project are the SWARA Corpus and the SWARA Front-end processor for Romanian. 
Cred că acel SWARA este proiectul din Cluj de care citisem.

Acum referitor la cercetările finanțate din surse publice, părerea mea este că se aruncă atâția bani pe tâmpenii în România încât merită să finanțezi cu de 10 ori suma pentru niște cercetători serioși, CU CONDIȚIA CA PRODUSUL FINAL SĂ FIE DE CALITATE ȘI APOI SCOS ÎN OPEN SOURCE! Finanțarea parțială, ca apoi produsul să nu fie disponibil mai apoi doar unei firme comerciale în care cercetătorii sunt cooptați și plătiți pare ca un ajutor de stat dat unor companii. Adică dat pe ochi frumoși, pile și relații de partid.
Deci SWARA a fost cu fonduri de la Ministerul Educației, n-am stat să sap mult să văd ce scrie în acel "grant agreement PN-II-PT-PCCA-2013-4 No 6/2014".

Am ceva experiență cu promovarea de open-source și recunosc deja privirea dușmănoasă a unora din firme cărora le "strici ploile" că vii cu soluții pentru care ei cer mulți bani și des.
Dacă face cineva un inventar câte aplicații de "document management" s-au vândut în țara asta în administrație și câte sunt folosite de fapt o să aibă o surpriză! :-)

Teo




Constantinescu Nicolaie

unread,
Sep 23, 2017, 6:19:48 AM9/23/17
to tic-...@googlegroups.com
Acum câteva săptămâni, am contribuit cu vocea proprie la proiectul dezvoltat de Mozilla. Aruncă, Teo, o privire și aici: https://hacks.mozilla.org/2016/01/firefox-and-the-web-speech-api/
Sunt și eu interesat de poveste. Poate în timp, se vor găsi resursele entru a dezvolta ceva.

--
--
YOU OWN YOUR OWN WORDS
Aţi primit acest mesaj pentru că sunteţi abonat la "TIC-Lobby Group".
Pentru a posta în acest grup, trimiteţi e-mail la tic-...@googlegroups.com
Pentru a vă dezabona de la acest grup, trimiteţi un e-mail la tic-lobby-unsubscribe@googlegroups.com

Pentru mai multe opţiuni, vizitaţi acest grup la http://groups.google.com/group/tic-lobby?hl=ro
---
Ați primit acest mesaj deoarece sunteți abonat(ă) la grupul „TIC-Lobby Group” din Grupuri Google.
Pentru a vă dezabona de la acest grup și pentru a nu mai primi e-mailuri de la acesta, trimiteți un e-mail la adresa tic-lobby+unsubscribe@googlegroups.com.

Pentru mai multe opțiuni, accesați https://groups.google.com/d/optout.



--
Constantinescu Nicolaie
Information Architect
http://www.kosson.ro
Acces Deschis România
http://www.acces-deschis.ro
digital curator for Nostrum Monumentum
http://memoria.kosson.ro
You find me here: https://www.facebook.com/kosson
And the professional side: https://www.facebook.com/groups/kosson/
On LinkedIn: https://ro.linkedin.com/in/kosson

Constantin Teodorescu

unread,
Sep 23, 2017, 7:18:30 AM9/23/17
to TIC-Lobby Group
On Saturday, September 23, 2017 at 1:19:48 PM UTC+3, Constantinescu Nicolaie wrote:
Acum câteva săptămâni, am contribuit cu vocea proprie la proiectul dezvoltat de Mozilla. Aruncă, Teo, o privire și aici: https://hacks.mozilla.org/2016/01/firefox-and-the-web-speech-api/
Sunt și eu interesat de poveste. Poate în timp, se vor găsi resursele entru a dezvolta ceva.

M-am uitat și-am testat și facilitățile de sinteză de voce din browser de aici: https://github.com/mdn/web-speech-api
O fi proiectul celor de la Mozilla, da' nu merge pe Firefox, în schimb pe Google Chrome mi-a tras o engleză, o spaniolă și-o italiană de stă mâțu-n coadă! :-)
Sună foarte bine, aștept cu interes și româna.

Teo
 

Cristian Secară

unread,
Sep 24, 2017, 8:37:15 AM9/24/17
to tic-...@googlegroups.com
În data de Fri, 22 Sep 2017 06:16:21 -0700 (PDT), Constantin Teodorescu
a scris:

> Avusei nevoie acum ceva timp de așa ceva, să găvărească un soft
> dintr-o tabletă niște mesaje primite ca text, în română, cu voce
> naturală pentru niște persoane cu handicap de vedere!
> Tot câutând eu (e adevărat, nu foarte mult) am găsit niște jumătăți
> de încercări, nici una foarte bine dusă până la capăt, dar din câte
> îmi aduc eu aminte, parcă era menționat undeva că era finanțat de la
> buget, pe cercetare.
> Dacă îmi aduc eu bine aminte, parcă era o echipă de pe la Cluj.

Există o tentativă la Institutul pentru Cercetări în Inteligență
Artificială "Mihai Drăgănescu", doar că eu n-am reușit să sintetizez
nimic (îmi dă eroare – am încercat cu FF, Vivaldi (bazat pe Chrome) și
IE11):
http://rslp.racai.ro/index.php?page=tts

Din câte știu, robotul telefonic de la acel institut este pe bază de
sinteză vocală, nu știu prin ce metodă, dar pare că vorbește bine (se
poate testa sunând la numărul din pagina de contact).

Cristi

--
Cristian Secară
http://www.secărică.ro

Stefan Moisei

unread,
Oct 2, 2017, 4:11:01 AM10/2/17
to tic-...@googlegroups.com
eSpeak mai are cateva variante prin care suna mai bine. Prin mbrola, vocea in limba romana e facuta la Universitatea Politehnica din Timisoara si cu variantele Klatt. Cea mai buna varianta Klatt e disponibila doar pe Windows, din pacate.
Alte variante pentru Linux nu stiu.
Eu am reusit sa testez sinteza de la Racai, merg doar vvocile parametrice straight si doar cu textul implicit scris in campul de editare. Multe proiecte universitare au fost (Romvox, PRODOC, SWARA), dar nici unul nu a furnizat surse complete. Partea buna la PRODOC si SWARA e ca macar au pus la dispozitie inregistrarile vocale plus fisierele de aliniere ale vocilor cu textul, ceea ce ar putea face mai usoara dezvoltarea altor voci bazate pe ele.
O alta varianta comerciala vine de la firma iQuest, testabila la numarul 0264207975. Am auzit zvonuri ca ar fi fost interesati de utilizarea vocii de catre nevazatori, dar nu s-a concretizat nimic.
Sent: Saturday, September 23, 2017 10:23 AM
Subject: Re: TIC-Lobby: Știe cineva de vreun proiect românesc public de "natural eSpeak" pe limba română?
 
--
--
YOU OWN YOUR OWN WORDS
Aţi primit acest mesaj pentru că sunteţi abonat la "TIC-Lobby Group".
Pentru a posta în acest grup, trimiteţi e-mail la tic-...@googlegroups.com
Pentru a vă dezabona de la acest grup, trimiteţi un e-mail la tic-lobby-...@googlegroups.com
Pentru mai multe opţiuni, vizitaţi acest grup la http://groups.google.com/group/tic-lobby?hl=ro
---
Ați primit acest mesaj deoarece sunteți abonat(ă) la grupul „TIC-Lobby Group” din Grupuri Google.
Pentru a vă dezabona de la acest grup și pentru a nu mai primi e-mailuri de la acesta, trimiteți un e-mail la adresa tic-lobby+...@googlegroups.com.
Pentru mai multe opțiuni, accesați https://groups.google.com/d/optout.

Virus-free. www.avast.com
Reply all
Reply to author
Forward
0 new messages