Diacritice în bazele de date ?

942 views
Skip to first unread message

Mihai Croitoru

unread,
Apr 9, 2008, 7:11:25 AM4/9/08
to Diacritice
A apărut o carte de telefon online cu numere din RDS, RT, UPC şi
mobile.

Situl e frumos, cu diacritice, dar dacă vrei să cauţi nume scrise cu
diacritice nu obţii nici un rezultat. Am adăugat un comentariu despre
asta pe blogul lor, dar răspunsul primit nu e deloc încurajator pentru
cei care vor să scrie cu diacritice pe internetul românesc. E vreo
metodă pentru adăugarea automată de diacritice la cuvintele/numele din
bazele de date ?

http://www.totalfirme.ro/blog/2008/04/08/cartea-de-telefoane-si-firme-si-coduri-postale-scoase-temporar-din-google/

Ionuţ Păduraru

unread,
Apr 9, 2008, 9:02:48 AM4/9/08
to diacr...@googlegroups.com
O posibilitate ar fi folosirea unei liste de nume proprii ce conţine deja diacritice. Cea de la  http://www.archeus.ro/lingvistica/NumeProprii mai are şi scăpări, dar majoritatea sunt cu diacritice. E un punct de plecare.

Ionuţ.

Mihai Croitoru

unread,
Apr 9, 2008, 9:41:42 AM4/9/08
to Diacritice
On 9 Apr, 16:02, "Ionuţ Păduraru" <ionut.c.padur...@gmail.com> wrote:
> O posibilitate ar fi folosirea unei liste de nume proprii ce conţine deja
> diacritice. Cea de la  http://www.archeus.ro/lingvistica/NumeProprii

E o idee, într-adevăr. Dar se vede că administratorilor de sistem nu
le surîde prea mult ideea introducerii diacriticelor, aşa că mai
degrabă păstrează bazele de date fără diacritice şi scot diacriticele
de la căutări. Iar dacă totuşi bagă diacritice, o să se găsească
utilizatori care să zică că nu e bine, pentru că ei scriu fără
diacritice (majoritatea la momentul de faţă) şi nu obţin nici un
rezultat (invers de ce mi s-a întîmplat mie). Ar trebui un program cam
cum are Google, care reuşeşte să ofere rezultate bune indiferent dacă
cuvîntul introdus este cu sau fără diacritice.

Am verificat şi la Cartea Albastră (RDS) şi Pagini Albe (RT). E
aceeaşi situaţie. Căutările cu diacritice nu generează rezultate.

http://www.cartealbastra.ro/

http://www.paginialbe.ro/

Alexandru Szasz

unread,
Apr 9, 2008, 9:59:48 AM4/9/08
to diacr...@googlegroups.com
2008/4/9 Mihai Croitoru <miha...@gmail.com>:

Administratorii sunt prost informaţi. O coloană într-un tabel mysql cu
colaţia utf8_general_ci populată cu diacritice generează aceleaşi
rezultate şi dacă se caută cu diacritice şi dacă se caută fără. O să
revin cu un mic script care rezolvă baza de date, o să-l prezint şi
adminstratorului de acolo pentru a-l aplica dacă doreşte.

Mai sunt unii programatori care codează diacriticele în entităţi, una
dintre cele mai dese dovezi de lene sau prostie, astfel că se trimite
la mysql o prostie de gen „barc&#243;".

--
Alexandru Szasz

Mihai Croitoru

unread,
Apr 9, 2008, 11:06:43 AM4/9/08
to Diacritice
On 9 Apr, 16:59, "Alexandru Szasz" <alex...@gmail.com> wrote:
> Administratorii sunt prost informaţi.
> Mai sunt unii programatori care codează diacriticele în entităţi, una
> dintre cele mai dese dovezi de lene sau prostie, astfel că se trimite
> la mysql o prostie de gen "barc&#243;".

Dacă n-ai avea atîtea pe cap, o pagină pusă undeva cu scriptul şi cu
nişte exemple ar putea rezolva nelămuririle multora. Degeaba vorbim
noi de diacritice dacă profesioniştii IT + web de la noi sînt
reticenţi în privinţa lor. Adică unii din ei au ajuns frîne în calea
normalizării situaţiei în ce priveşte diacriticele.

Cotidianul şi-a schimbat situl recent şi a cerut păreri de la
vizitatori. Fiecare al patrulea sau al cincilea comentariu conţinea o
referire la introducerea diacriticelor (adică lumea cerea să fie
introduse). Cu toate astea mă îndoiesc că administratorul le va băga,
pînă acum nu s-a întîmplat nimic şi nici n-a promis nimeni de acolo că
o va face...

Cristian Secară

unread,
Apr 9, 2008, 2:07:26 PM4/9/08
to diacr...@googlegroups.com
On Wed, 9 Apr 2008 06:41:42 -0700 (PDT), Mihai Croitoru wrote:

> Ar trebui un program cam cum are Google, care reuşeşte să ofere
> rezultate bune indiferent dacă cuvîntul introdus este cu sau fără
> diacritice.

dexonline.ro merge bine indiferent de diacritice și indiferent de
virgulă sau sedilă.

Cristi

--
Cristian Secară
http://www.secarica.ro/

Cristian Secară

unread,
Apr 9, 2008, 2:13:01 PM4/9/08
to diacr...@googlegroups.com
On Wed, 9 Apr 2008 16:59:48 +0300, Alexandru Szasz wrote:

> Mai sunt unii programatori care codează diacriticele în entităţi, una
> dintre cele mai dese dovezi de lene sau prostie, astfel că se trimite
> la mysql o prostie de gen „barc&#243;".

De obicei asta se întâmplă dacă pagina care conține formularul în care
se introduce textul are codarea declarată pe 8 biți în loc de Unicode.
Caracterele care nu cad în respectiva codare sunt reprezentate ca
entități din alea (browserul face asta la momentul trimiterii).

Mihai Croitoru

unread,
Apr 9, 2008, 3:03:18 PM4/9/08
to Diacritice
On 9 Apr, 21:07, Cristian Secară <or...@secarica.ro> wrote:
> dexonline.ro merge bine indiferent de diacritice și indiferent de
> virgulă sau sedilă.

Exemplul e bun şi foarte cunoscut, dar sînt destui responsabili cu
situri foarte cunoscute la care nu se obţin rezultate la căutările cu
diacritice. Cine caută un cuvînt banal ca "Bucureşti" (ş cu sedilă) nu
obţine nimic pe Siturile Adevărul, Cotidianul şi Ziua. Nici pe
Trilulilu nu merge să cauţi cu diacritice (fără diacritice merge).

Alexandru Szasz

unread,
Apr 9, 2008, 3:23:44 PM4/9/08
to diacr...@googlegroups.com
2008/4/9 Mihai Croitoru <miha...@gmail.com>:

Am scris un articol pe diacritice.ro despre subiectul ăsta:
http://www.diacritice.ro/node/32
Sper să fie cuiva de folos.

O să încerc să atac într-o zi şi problema căutării într-un alt articol.

--
Alexandru Szasz

Lucian Constantin

unread,
Apr 9, 2008, 8:00:35 PM4/9/08
to Diacritice
> E vreo
> metodă pentru adăugarea automată de diacritice la cuvintele/numele din
> bazele de date ?

O rezolvi pentru prenume cu o listă de referinţă, pentru numele de
famile nici vorbă, mai ales când ai o întreagă carte de telefon. Doar
aşa, dacă iei fiecare nume şi-l verifici manual.

Lucian
--
http://rospell.sourceforge.net

Mihai Croitoru

unread,
Apr 10, 2008, 12:09:57 AM4/10/08
to Diacritice
On 9 Apr, 22:23, "Alexandru Szasz" <alex...@gmail.com> wrote:
> Am scris un articol pe diacritice.ro despre subiectul ăsta:http://www.diacritice.ro/node/32
> Sper să fie cuiva de folos.

E bine, dar ai acolo undeva cuvîntul "lucră". Cred că "lucrează" ar fi
mai potrivit, de "lucră" n-a auzit multă lume dinafara Transilvaniei.

La un exemplu ai "Razvan Margaritescu" ca nume şi ca prenume
"Secarica". Poate ai vrut să faci o chestie cu poreclă şi ai renunţat,
dar Secarica a rămas acolo.


> O să încerc să atac într-o zi şi problema căutării într-un alt articol.

Aici e marea problemă. Nici portalurile nu stau prea bine la asta. Pe
situl de statistici SATI.ro cele mai vizitate portaluri sînt în ordine
Roportal.ro, Acasa.ro şi Rol.ro.

Roportal e din Timişoara dar dacă vrei să cauţi chiar "Timişoara"
softul elimină "ş"-ul şi-ţi spune că n-au fost găsite rezultate pentru
"Timioara". Adică diacriticele nu numai că nu sînt suportate, ele sînt
chiar eliminate, ca şi cum n-ar trebui să apară în cuvinte.

Acasa.ro şi Rol.ro sînt din Bucureşti şi suportă căutarea cu
diacritice, însă ele nu sînt afişate ca lumea (BucureĹźti, BucureĹ ti)
în paginile cu rezultate.

Nici ziarele Libertatea.ro sau Cancan.ro nu suportă căutările cu
diacritice.

Mihai Croitoru

unread,
Apr 10, 2008, 12:38:27 AM4/10/08
to Diacritice
On 10 Apr, 03:00, Lucian Constantin <struct_bylight...@yahoo.com>
wrote:
> O rezolvi pentru prenume cu o listă de referinţă, pentru numele de
> famile nici vorbă, mai ales când ai o întreagă carte de telefon. Doar
> aşa, dacă iei fiecare nume şi-l verifici manual.

Probabil că nu merge cu adăugarea automată de diacritice la numele de
familie. Sînt şi nume de familie de genul "Creanga" şi "Creangă" sau
"Stanca" şi "Stâncă", unde ambele variante sînt posibile, deci nu pot
fi adăugate automat diacritice în baza de date.

Soluţia pare a fi cea adoptată de Dexonline.ro, omul să poată căuta cu/
fără diacritice şi rezultatele afişate să fie aceleaşi.

Cristian Secară

unread,
Apr 10, 2008, 1:10:49 AM4/10/08
to diacr...@googlegroups.com
On Wed, 9 Apr 2008 21:07:26 +0300, Cristian Secară wrote:

> > Ar trebui un program cam cum are Google, care reuşeşte să ofere
> > rezultate bune indiferent dacă cuvîntul introdus este cu sau fără
> > diacritice.
> dexonline.ro merge bine indiferent de diacritice și indiferent de
> virgulă sau sedilă.

De fapt dexonline.ro e singurul pe care îl știu să meargă corect.
Google NU merge corect, pentru că nu știe să facă echivalarea între ș
și ț cu virgule și nimic altceva și nu știu cui ar trebui să reclam
asta.
Am făcut mai demult o pagină de test pentru asta care (încă) îmi
dovedește acest lucru
http://www.secarica.ro/html/test_motor_de_cautare.html

sorin.paliga

unread,
Apr 10, 2008, 1:33:05 AM4/10/08
to Diacritice

>
> dexonline.ro merge bine indiferent de diacritice și indiferent de
> virgulă sau sedilă.
>
> Cristi

Evident, numai că dexonline.ro e făcut de oameni serioși care gîndesc
de la A la Z, nu de diletanți cu pretenții de specialiști.

Alexandru Szasz

unread,
Apr 10, 2008, 1:36:11 AM4/10/08
to diacr...@googlegroups.com
2008/4/10 sorin.paliga <sorin....@gmail.com>:

Nu e o ştiinţă, e ceva la îndemână. Dacă faci o baza de date cu setul
de caractere UTF-8 primeşti în schimb funcţionalitatea asta legată de
căutarea cu diacritice.

--
Alexandru Szasz

Alexandru Szasz

unread,
Apr 10, 2008, 1:45:51 AM4/10/08
to diacr...@googlegroups.com
2008/4/10 Mihai Croitoru <miha...@gmail.com>:

>
> On 9 Apr, 22:23, "Alexandru Szasz" <alex...@gmail.com> wrote:
> > Am scris un articol pe diacritice.ro despre subiectul ăsta:http://www.diacritice.ro/node/32
> > Sper să fie cuiva de folos.
>
> E bine, dar ai acolo undeva cuvîntul "lucră". Cred că "lucrează" ar fi
> mai potrivit, de "lucră" n-a auzit multă lume dinafara Transilvaniei.

Mulţumesc, am corectat.

2008/4/10 Mihai Croitoru <miha...@gmail.com>:


>
> On 10 Apr, 03:00, Lucian Constantin <struct_bylight...@yahoo.com>
> wrote:
>
> > O rezolvi pentru prenume cu o listă de referinţă, pentru numele de
> > famile nici vorbă, mai ales când ai o întreagă carte de telefon. Doar
> > aşa, dacă iei fiecare nume şi-l verifici manual.
>
> Probabil că nu merge cu adăugarea automată de diacritice la numele de
> familie. Sînt şi nume de familie de genul "Creanga" şi "Creangă" sau
> "Stanca" şi "Stâncă", unde ambele variante sînt posibile, deci nu pot
> fi adăugate automat diacritice în baza de date.

Totuşi nu există numele Margaritescu, există un procent pe care-l poţi rezolva.

>
> Soluţia pare a fi cea adoptată de Dexonline.ro, omul să poată căuta cu/
> fără diacritice şi rezultatele afişate să fie aceleaşi.
>

Trebuie doar ca programatorii de ocazie români să înţeleagă că limba
română nu încape în ISO-8859-1, nici în ISO-8859-2, de fapt orice
pagină în ISO e o mare tâmpenie pentru că nu poţi afişa decât limbile
din acel ISO la un moment dat pe când cu UTF-8 ai posibilitatea să
afişezi mai multe limbi în acelaşi timp.

Faptul că nu se poate căuta cu diacritice ţine de proasta pregătire a
programatorilor care fac saiturile alea. Chiar nu e o ştiinţă, nu
trebuie decât să lucrezi cu setul de caractere UTF-8, nicio bucată de
cod în plus ca să lucrezi cu diacritice.

Eu la Narro mai am o bucăţică de cod într-un plugin care la salvare în
baza de date converteşte sedilele la virgule pentru a fi eu mulţumit
când mă uit în baza de date şi pentru a avea consistenţă. La afişare
tot printr-un plugin permit utilizatorului să aleagă dacă vrea să vadă
cu sedile sau cu virgule. Asta s-ar putea face automat în felul ăsta:
virgule pentru orice diferit de Windows XP, sedile pentru Windows XP.
Dar asta e ceva mai complex, măcar de ar fi sedile decât nimic.

--
Alexandru Szasz

Mihai Croitoru

unread,
Apr 10, 2008, 1:50:38 AM4/10/08
to Diacritice
On 10 Apr, 08:10, Cristian Secară <or...@secarica.ro> wrote:
> De fapt dexonline.ro e singurul pe care îl știu să meargă corect.
> Google NU merge corect, pentru că nu știe să facă echivalarea între ș
> și ț cu virgule și nimic altceva și nu știu cui ar trebui să reclam
> asta.

Nu știam de asta, rezultă că nici Google nu e perfect cînd vine vorba
de diacriticele românești. Într-adevăr, "bucurești" are vreo 50.000 de
rezultate, iar "bucureşti" vreo 4 milioane. La fel în cazul lui
"ţară" (20.000) faţă de "țară" (1,5 milioane). Ăsta ar fi încă un
argument în sprijinul căutării fără diacritice şi mai general
împotriva folosirii diacriticelor pe internet. E destul de neplăcută
situaţia, cine are Vista e în pom dacă foloseşte căutări cu diacritice
pe Google. Aşa că lumea e determinată să caute fără diacritice, iar
cei care au situri văd că de pe Google le vin numai căutări fără
diacritice. De aici ei trag concluzia că e bine să-şi păstreze
siturile scrise fără diacritice, pentru că aşa au mai mulţi
vizitatori. E un cerc vicios unde şi Google are o parte din vină.

Pentru reacţii la adresa eficienţei motorului Google se pot folosi
blogurile, cel oficial sau ale unor angajaţi (inclusiv unii români) :

http://googleblog.blogspot.com/ - oficial

http://www.mattcutts.com/blog/

http://blog.persistent.info/ - Sorin Parpariţă

http://www.radupopovici.com/ - Radu Popovici

Deci lucrurile sînt mai complicate decît apar la prima vedere, există
o parte nevăzută a aisbergului diacriticelor, cea din bazele de date
de la situri obişnuite sau de la megasituri de genul Google.

Cristian Secară

unread,
Apr 10, 2008, 2:12:53 AM4/10/08
to diacr...@googlegroups.com
On Wed, 9 Apr 2008 22:50:38 -0700 (PDT), Mihai Croitoru wrote:

> E destul de neplăcută situaţia, cine are Vista e în pom dacă
> foloseşte căutări cu diacritice pe Google.

E și mai complicat. IE 7 are ca motor de căutare implicit pe
www.live.com. Se poate schimba, dar e cam alambicat.
Iar live.com suferă de aceeași problemă, în plus din ce testasem eu
mai demult nu recunoaște ghilimelele românești dacă vreau să caut
expresii complete.

Cristian Secară

unread,
Apr 10, 2008, 2:19:51 AM4/10/08
to diacr...@googlegroups.com
On Thu, 10 Apr 2008 08:45:51 +0300, Alexandru Szasz wrote:

> Faptul că nu se poate căuta cu diacritice ţine de proasta pregătire a
> programatorilor care fac saiturile alea. Chiar nu e o ştiinţă, nu
> trebuie decât să lucrezi cu setul de caractere UTF-8, nicio bucată de
> cod în plus ca să lucrezi cu diacritice.

Hm. Probabil că mai e ceva la nivel de bază de date (ceva de declarat pe
acolo), pentru că, de exemplu, forumul meu phpBB l-am trecut la utf-8
acum mai mulți ani folosind o metodă cam empirică ce-i drept. Ca forum
merge perfect, în schimb căutarea nu. Adică nu în sensul discuției de
aici.

Mihai Croitoru

unread,
Apr 10, 2008, 2:36:41 AM4/10/08
to Diacritice
On 10 Apr, 09:12, Cristian Secară <or...@secarica.ro> wrote:
> E și mai complicat. IE 7 are ca motor de căutare implicit pewww.live.com. Se poate schimba, dar e cam alambicat.
> Iar live.com suferă de aceeași problemă, în plus din ce testasem eu
> mai demult nu recunoaște ghilimelele românești dacă vreau să caut
> expresii complete.

Toate motoarele de căutare mari (Google, Yahoo şi Live) au probleme
cînd e vorba de căutarea cu diacritice. Folosirea lui Ș sau Ț (cu
virgulă) reduce drastic numărul de rezultate obținute, care e în
general de 10-100 de ori mai mic decît dacă se folosesc Ş şi Ţ (cu
sedilă). Dar chiar şi acesta din urmă e de 5-10 ori mai mic decît dacă
nu se folosesc deloc diacritice.

Căutare cu Google (rezultate) :

"bucuresti" - 33 de milioane

"bucureşti" - 4 milioane

"bucurești" - 50.000

Există un singur motor de căutare care nu are diferențe mari între
rezultatele obţinute cu diacriticele cu sedilă, cu virgulă sau fără.
Din păcate nu este atît de bun precum Google sau Yahoo.

Căutare cu Exalead (rezultate) :

"bucuresti" - 2,3 milioane

"bucureşti" - 2,1 milioane

"bucurești" - 2,2 milioane

http://www.exalead.com/

Alexandru Szasz

unread,
Apr 10, 2008, 3:32:15 AM4/10/08
to diacr...@googlegroups.com
2008/4/10 Mihai Croitoru <miha...@gmail.com>:

>
> On 10 Apr, 08:10, Cristian Secară <or...@secarica.ro> wrote:
> > De fapt dexonline.ro e singurul pe care îl știu să meargă corect.
> > Google NU merge corect, pentru că nu știe să facă echivalarea între ș
> > și ț cu virgule și nimic altceva și nu știu cui ar trebui să reclam
> > asta.
>
> Nu știam de asta, rezultă că nici Google nu e perfect cînd vine vorba
> de diacriticele românești. Într-adevăr, "bucurești" are vreo 50.000 de
> rezultate, iar "bucureşti" vreo 4 milioane. La fel în cazul lui
> "ţară" (20.000) faţă de "țară" (1,5 milioane). Ăsta ar fi încă un
> argument în sprijinul căutării fără diacritice şi mai general
> împotriva folosirii diacriticelor pe internet. E destul de neplăcută
> situaţia, cine are Vista e în pom dacă foloseşte căutări cu diacritice
> pe Google. Aşa că lumea e determinată să caute fără diacritice, iar
> cei care au situri văd că de pe Google le vin numai căutări fără
> diacritice. De aici ei trag concluzia că e bine să-şi păstreze
> siturile scrise fără diacritice, pentru că aşa au mai mulţi
> vizitatori. E un cerc vicios unde şi Google are o parte din vină.

Sunt două litere diferite, nu putem cere Google să facă o asemenea
imensă excepție.
Soluția e să dispară toată metodele de a scrie cu diacritice cu sedile
pe sistemele de operare care pot vedea virgulele. Adică să nu se poată
scrie cu sedile decât în Windows XP. Apoi lobby la toate saiturile
să-și convertească articolele. Acum nu putem cere asta fiindcă
procentul de utilizatori XP e încă mare.

--
Alexandru Szasz

Alexandru Szasz

unread,
Apr 10, 2008, 3:35:55 AM4/10/08
to diacr...@googlegroups.com
2008/4/10 Cristian Secară <or...@secarica.ro>:

Configurarea bazei de date înseamnă și configurarea serverului. Ori
pui serverul să lucreze cu nume utf8 ori apelezi după fiecare apel
mysql_select_db interogarea mysql_query('SET NAMES UTF8'). Asta-ți
lipsea ție cu phpBB.

Dacă vrei, trimite-mi baza de date exportată într-un fișier sql, o
analizez, îți trimit baza de date convertită corect la utf8 și scriu
și un articol pe tema asta pentru ceilalți.

Nu mai folosesc phpBB de mult, n-am eu un forum pe care să încerc.

--
Alexandru Szasz

Alexandru Szasz

unread,
Apr 10, 2008, 3:38:06 AM4/10/08
to diacr...@googlegroups.com
2008/4/10 Mihai Croitoru <miha...@gmail.com>:

>
> On 10 Apr, 09:12, Cristian Secară <or...@secarica.ro> wrote:
> > E și mai complicat. IE 7 are ca motor de căutare implicit pewww.live.com. Se poate schimba, dar e cam alambicat.
>
> > Iar live.com suferă de aceeași problemă, în plus din ce testasem eu
> > mai demult nu recunoaște ghilimelele românești dacă vreau să caut
> > expresii complete.
>
> Toate motoarele de căutare mari (Google, Yahoo şi Live) au probleme
> cînd e vorba de căutarea cu diacritice. Folosirea lui Ș sau Ț (cu
> virgulă) reduce drastic numărul de rezultate obținute, care e în
> general de 10-100 de ori mai mic decît dacă se folosesc Ş şi Ţ (cu
> sedilă). Dar chiar şi acesta din urmă e de 5-10 ori mai mic decît dacă
> nu se folosesc deloc diacritice.
>
> Căutare cu Google (rezultate) :
>
> "bucuresti" - 33 de milioane
>
> "bucureşti" - 4 milioane
>
> "bucurești" - 50.000
>

Apropo, au fost o serie de nemulțumiri din cauza faptului că Google
afișa aceleași rezultate și la căutarea cu diacritice și la căutarea
fără (așa cum am vrea noi) și a modificat lucrurile astfel încât să nu
se mai facă normalizarea diacriticelor, de aceea pentru fiecare
diacritică ai alte rezultate. Așa mi se pare și normal. Să sufere cine
nu știe să scrie, nu cine știe.

--
Alexandru Szasz

Mihai Croitoru

unread,
Apr 10, 2008, 3:56:08 AM4/10/08
to Diacritice
On 10 Apr, 10:32, "Alexandru Szasz" <alex...@gmail.com> wrote:
> Sunt două litere diferite, nu putem cere Google să facă o asemenea
> imensă excepție.
> Soluția e să dispară toată metodele de a scrie cu diacritice cu sedile
> pe sistemele de operare care pot vedea virgulele. Adică să nu se poată
> scrie cu sedile decât în Windows XP. Apoi lobby la toate saiturile
> să-și convertească articolele. Acum nu putem cere asta fiindcă
> procentul de utilizatori XP e încă mare.

Nu sînt două litere diferite, ci e aceeaşi literă scrisă diferit.
Adică Ş cu sedilă e aceeaşi literă cu Ș cu virgulă, un cuvînt scris cu
oricare din cele două tipuri de literă are acelaşi înţeles (Bucureşti
= București).

Deci Google, Yahoo și MS ar trebui ca la căutarea în pagini scrise în
română a unui cuvînt ce conține Ş sau Ș (de ex. ȘI) să ofere exact
aceleași rezultate, adică paginile care conțin cuvîntul respectiv în
ambele moduri de scriere (ȘI sau ŞI). Evident că nu trebuie să
prezinte şi paginile ce conţin cuvîntul SI, care e cu totul altceva
(nota muzicală). Nu cred că Google ar avea mari probleme să asimileze
Ş cu Ș (Ţ cu Ț) și invers.

E mai uşor şi mai eficient ca Google, Yahoo şi MS să ia o astfel de
măsură, decît ca cele cîteva milioane de utilizatori români să-şi
schimbe modul de a scrie. Iar dacă ar face-o, Google oricum le-ar
oferi rezultate slabe. Adică ei ar scrie corect cu Ș cu virgulă şi
Google nu le-ar da şi rezultatele scrise cu Ş cu sedilă, care sînt
majoritare acum.

Mihai Croitoru

unread,
Apr 10, 2008, 4:04:50 AM4/10/08
to Diacritice
On 10 Apr, 10:38, "Alexandru Szasz" <alex...@gmail.com> wrote:
> Apropo, au fost o serie de nemulțumiri din cauza faptului că Google
> afișa aceleași rezultate și la căutarea cu diacritice și la căutarea
> fără (așa cum am vrea noi) și a modificat lucrurile astfel încât să nu
> se mai facă normalizarea diacriticelor, de aceea pentru fiecare
> diacritică ai alte rezultate. Așa mi se pare și normal. Să sufere cine
> nu știe să scrie, nu cine știe.

De suferit nu suferă decît limba română, dar cum ea nu poate să ţipe
nimeni n-o bagă în seamă, nici măcar Institutul de Lingvistică al
Academiei, cel care ar trebui să se ocupe de chestia asta.

Utilizatorii încearcă toate tipurile de căutări şi dacă văd că
rezultatele optime sînt cele obţinute pentru căutarea fără diacritice,
vor căuta în acest fel. Cei care au situri văd acest comportament şi
se opun introducerii diacriticelor pentru că socotesc că ar pierde din
vizitatori. Cineva care îşi trece situl la diacritice va avea mai
puţini vizitatori din Google decît altcineva care rămîne la scrisul
fără diacritice (situri cu aceaaşi tematică, evident). Deci în cazul
siturilor comerciale sau a celor care trăiesc din publicitate asta
înseamnă pierdere de venituri.

Pentru un sit cu vizibilitate mare şi care nu deprinde prea mult de
Google, trecerea la diacritice e posibilă şi de dorit (vizitatorii
citesc mai uşor). Evenimentul Zilei a făcut mişcarea asta acum vreo 3
luni fără să piardă foarte mulţi vizitatori. Cotidianul ezită s-o facă
pentru că nu e aşa cunoscut ca EVZ şi are şi baza de date care nu
suportă diacriticele.

Silviu Julean

unread,
Apr 10, 2008, 4:24:16 AM4/10/08
to diacr...@googlegroups.com
2008/4/10 Mihai Croitoru <miha...@gmail.com>:

> Căutare cu Google (rezultate) :
>
> "bucuresti" - 33 de milioane
>
> "bucureşti" - 4 milioane
>
> "bucurești" - 50.000

google.com dă rezultate mult mai bune decât google.ro!

Într-adevăr, tocmai am repetat testul lui Secărică, şi am avut
următoarele rezultate:

1. cu google.com:

text plain, search plain: OK
text plain, search cedilla: OK
text plain, search comma: OK

text cedilla, search plain: OK
text cedilla, search cedilla: OK
text cedilla, search comma: Nu merge

text comma, search plain: Nu merge
text comma, search cedilla: Nu merge
text comma, search comma: OK

Observăm că diacriticele cu virgulă nu se potrivesc cu celelalte
diacritice, mai puţin când apar în şirul de căutare - şi atunci se
potrivesc doar cu textul fără diacritice. În rest, motorul
funcţionează perfect cu sedile.

2. cu google.ro:

text plain, search plain: OK
text plain, search cedilla: Nu merge
text plain, search comma: Nu merge

text cedilla, search plain: OK
text cedilla, search cedilla: OK
text cedilla, search comma: Nu merge

text comma, search plain: Nu merge
text comma, search cedilla: Nu merge
text comma, search comma: OK

Faţă de google.com, se observă o asimetrie aparent minoră, dar
încărcată de semnificaţie: oricând se introduc diacritice (fie cu
virgule, fie cu sedile) în câmpul de căutare, paginile găsite vor fi
în număr restrâns.

Acum, să încerc şi testul vostru cu Bucureştiul:

google.com:

bucuresti - 34,300,000
bucureşti - 34,300,000
bucurești - 34,300,000

google.ro:

bucuresti - 33,700,000
bucureşti - 4,060,000
bucurești - 47,600

Ca o notă subiectivă, deseori am nevoie să folosesc termeni de căutare
în limba engleză; atunci, rezultatele de proastă calitate de pe
google.ro mă încurcă enorm de mult, aşa că la orice calculator mă
aşez, comut pe Google în engleză. În plus, chiar şi pentru căutările
în limba română, google.com e mai bun (după cum am arătat şi mai sus)
- aparent e mai bun chiar şi pentru căutările în care nu se folosesc
diacritice! (cu 1 milion de rezultate mai mult pentru bucuresti pe
google.com)

Nu spun că google.ro e o idee proastă, dar, per ansamblu, nu ar trebui
să fie deschis implicit pentru România cât timp merge atât de prost.
Dacă preferaţi eficienţa, (cu părere de rău) trebuie să vă recomand să
nu mai folosiţi google.ro. Folosiţi linkul 'Google.com in English' din
josul paginii.

--
Silviu Julean

Mişu Moldovan

unread,
Apr 10, 2008, 4:30:29 AM4/10/08
to diacr...@googlegroups.com
"sorin.paliga" <sorin....@gmail.com> a scris:

> >
> > dexonline.ro merge bine indiferent de diacritice și indiferent de
> > virgulă sau sedilă.
>
> Evident, numai că dexonline.ro e făcut de oameni serioși care gîndesc
> de la A la Z, nu de diletanți cu pretenții de specialiști.

Aş zice mai degrabă că a fost făcut de un amator care s-a străduit, îmi
aduc aminte de vremea în care dexonline.ro era servit de calculatorul
propriu ţinut pornit non-stop în sufragerie[1]. Cred că nu avea UPS că
mai pica din când în când, probabil când era curentul luat. :)

--
mişu

1.
http://catalinfrancu.blogspot.com/2006/09/rmi-gazd-sntoas-c-ai-primit-dex-ul-n.html

Nicu Buculei

unread,
Apr 10, 2008, 4:40:03 AM4/10/08
to diacr...@googlegroups.com
Silviu Julean wrote:
> Ca o notă subiectivă, deseori am nevoie să folosesc termeni de căutare
> în limba engleză; atunci, rezultatele de proastă calitate de pe
> google.ro mă încurcă enorm de mult, aşa că la orice calculator mă
> aşez, comut pe Google în engleză. În plus, chiar şi pentru căutările
> în limba română, google.com e mai bun (după cum am arătat şi mai sus)
> - aparent e mai bun chiar şi pentru căutările în care nu se folosesc
> diacritice! (cu 1 milion de rezultate mai mult pentru bucuresti pe
> google.com)

Si eu imi pun peste tot cautarea implicita in engleza, dar o fac pentru
ca *eu* prefer rezultatele in engleza. Si luind in considerare punctul
asta de vedere, argumentez totusi ca google.ro ar rezultate mai bune
decit.com pntru cautari in limba romana. Exemplu:

http://www.google.ro/search?q=fedora
http://www.google.com/search?q=fedora

Pentru mine, care NU sint interesat de primul set de rezultate, este
contraproductiv, dar pentru un tuilizator obisnuit vorbitor de limba
romana, este in mod evident o solutie mai buna: jumatate dintre
rezultatele din prima pagina sint scrise in limba romana.

> Nu spun că google.ro e o idee proastă, dar, per ansamblu, nu ar trebui
> să fie deschis implicit pentru România cât timp merge atât de prost.
> Dacă preferaţi eficienţa, (cu părere de rău) trebuie să vă recomand să
> nu mai folosiţi google.ro. Folosiţi linkul 'Google.com in English' din
> josul paginii.

Asta pentru o definite anume a eficienteti. Pentru mine sau pentru tine,
poate, dar cunosc suficient de multi oameni care prefera invers.

--
nicu :: http://nicubunu.ro :: http://nicubunu.blogspot.com

Mihai Croitoru

unread,
Apr 10, 2008, 4:52:53 AM4/10/08
to Diacritice
On 10 Apr, 11:24, "Silviu Julean" <sjul...@gmail.com> wrote:
> Nu spun că google.ro e o idee proastă, dar, per ansamblu, nu ar trebui
> să fie deschis implicit pentru România cât timp merge atât de prost.
> Dacă preferaţi eficienţa, (cu părere de rău) trebuie să vă recomand să
> nu mai folosiţi google.ro. Folosiţi linkul 'Google.com in English' din
> josul paginii.

E bună descoperirea ta, însă lucrurile sînt şi mai complicate (sau mai
degrabă ciudate). Ce spui tu despre Google.ro se aplică doar la
varianta de căutare implicită, cea numită "pe Web". La celelate două
se obțin rezultate diferite.

Google.ro "pagini scrise în limba Română"

bucuresti - 1.970.000
bucureşti - 8.600.000
bucurești - 42.800

Google.ro "pagini din România"

bucuresti - 2.790.000
bucureşti - 7.410.000
bucurești - 25.700

Totuși nu cred că Google.com este alegerea cea mai bună acum pentru
cuvintele românești. Asta pentru că îmi bagă în rezultate și cuvîntul
scris fără diacritice care poate fi găsit și în alte limbi. Dacă eu
vreau paginile ce conțin "ţintă", Google.com îmi dă 14 milioane de
rezultate, probabil majoritatea potrivite pentru "tinta", nu pentru
"ţintă". Google.ro îmi oferă numai paginile ce conţin "ţintă", deci
are o relevanţă mai mare pentru cuvintele româneşti.

Pe moment căutarea cuvintelor româneşti cu diacritice dă cele mai bune
(relevante) rezultate dacă se folosesc diacriticele cu sedilă pe
Google.ro.

Cristian Secară

unread,
Apr 10, 2008, 5:44:11 AM4/10/08
to diacr...@googlegroups.com
On Thu, 10 Apr 2008 10:32:15 +0300, Alexandru Szasz wrote:

> Sunt două litere diferite, nu putem cere Google să facă o asemenea
> imensă excepție.

S și Ş (sau T și Ţ) sunt și mai diferite și totuși s-au muncit să facă
asta. Este valabil și în cazul altor caractere în alte limbi.
Iar Ţ de fapt nu există în nicio limbă în zilele noastre.

Cei de la Google şi Yahoo au implementat şi combining diacritical
marks, pe când cei de la Live (Microsoft) nu. De exemplu expresiile
astea
șurubelnița deșurubează
şurubelniţa deşurubează
live.com nu le găseşte de niciun fel.

Alexandru Szasz

unread,
Apr 10, 2008, 5:49:27 AM4/10/08
to diacr...@googlegroups.com
2008/4/10 Mihai Croitoru <miha...@gmail.com>:

>
> On 10 Apr, 10:32, "Alexandru Szasz" <alex...@gmail.com> wrote:
> > Sunt două litere diferite, nu putem cere Google să facă o asemenea
> > imensă excepție.
> > Soluția e să dispară toată metodele de a scrie cu diacritice cu sedile
> > pe sistemele de operare care pot vedea virgulele. Adică să nu se poată
> > scrie cu sedile decât în Windows XP. Apoi lobby la toate saiturile
> > să-și convertească articolele. Acum nu putem cere asta fiindcă
> > procentul de utilizatori XP e încă mare.
>
> Nu sînt două litere diferite, ci e aceeaşi literă scrisă diferit.
> Adică Ş cu sedilă e aceeaşi literă cu Ș cu virgulă, un cuvînt scris cu
> oricare din cele două tipuri de literă are acelaşi înţeles (Bucureşti
> = București).

Ai dreptate, eu mă gândeam la caractere.

>
> Deci Google, Yahoo și MS ar trebui ca la căutarea în pagini scrise în
> română a unui cuvînt ce conține Ş sau Ș (de ex. ȘI) să ofere exact
> aceleași rezultate, adică paginile care conțin cuvîntul respectiv în
> ambele moduri de scriere (ȘI sau ŞI). Evident că nu trebuie să
> prezinte şi paginile ce conţin cuvîntul SI, care e cu totul altceva
> (nota muzicală). Nu cred că Google ar avea mari probleme să asimileze
> Ş cu Ș (Ţ cu Ț) și invers.

Așa era înainte Google, așa e implicit la o bază de date, și au fost
multe plângeri, Google fiind nevoit să schimbe abordarea.


>
> E mai uşor şi mai eficient ca Google, Yahoo şi MS să ia o astfel de
> măsură, decît ca cele cîteva milioane de utilizatori români să-şi
> schimbe modul de a scrie. Iar dacă ar face-o, Google oricum le-ar
> oferi rezultate slabe. Adică ei ar scrie corect cu Ș cu virgulă şi
> Google nu le-ar da şi rezultatele scrise cu Ş cu sedilă, care sînt
> majoritare acum.
>

Sunt mai multe milioane de oameni care sunt împotriva normalizării
decât cei care sunt pentru.

--
Alexandru Szasz

Cristian Secară

unread,
Apr 10, 2008, 5:56:29 AM4/10/08
to diacr...@googlegroups.com
On Thu, 10 Apr 2008 10:38:06 +0300, Alexandru Szasz wrote:

> Apropo, au fost o serie de nemulțumiri din cauza faptului că Google
> afișa aceleași rezultate și la căutarea cu diacritice și la căutarea
> fără (așa cum am vrea noi) și a modificat lucrurile astfel încât să nu
> se mai facă normalizarea diacriticelor, de aceea pentru fiecare
> diacritică ai alte rezultate. Așa mi se pare și normal. Să sufere cine
> nu știe să scrie, nu cine știe.

Păi asta are un singur rezultat concret, anume că saiturile vor renunța
treptat-treptat la diacritice. Nu mă gândesc la ziare, ci la saituri
comerciale, care vând produse sau servicii (agenții de turism,
rezervări la vile, restaurante, etc.). Este logic să vrei să fii găsit,
iar a fi găsit în condiții discriminatorii înseamnă să fi nevoit să te
dai de partea majorității.

Cristian Secară

unread,
Apr 10, 2008, 5:59:18 AM4/10/08
to diacr...@googlegroups.com
On Thu, 10 Apr 2008 10:35:55 +0300, Alexandru Szasz wrote:

> Dacă vrei, trimite-mi baza de date exportată într-un fișier sql, o
> analizez, îți trimit baza de date convertită corect la utf8 și scriu
> și un articol pe tema asta pentru ceilalți.

Fișierul salvat din interfața phpBB e bun pentru asta ? Că altfel nu
știu ce ar trebui să fac (deși pot să intru cu phpadmin sau ceva de
genul ăsta, îmi prind urechile acolo).

Cristian Secară

unread,
Apr 10, 2008, 6:05:26 AM4/10/08
to diacr...@googlegroups.com
On Thu, 10 Apr 2008 12:49:27 +0300, Alexandru Szasz wrote:

> Sunt mai multe milioane de oameni care sunt împotriva normalizării
> decât cei care sunt pentru.

În condițiile astea ar trebui să trateze pe picior de egalitate Ș cu Ş
și Ț cu Ţ, păstrând aceeași regulă de azi între oricare dintre
varianta diacriticată și S și T.

Cristian Secară

unread,
Apr 10, 2008, 6:00:25 AM4/10/08
to diacr...@googlegroups.com
On Thu, 10 Apr 2008 10:35:55 +0300, Alexandru Szasz wrote:

> Dacă vrei, trimite-mi baza de date exportată într-un fișier sql, o
> analizez, îți trimit baza de date convertită corect la utf8 și scriu
> și un articol pe tema asta pentru ceilalți.

Fișierul salvat din interfața phpBB e bun pentru asta ? Că altfel nu


știu ce ar trebui să fac (deși pot să intru cu phpadmin sau ceva de
genul ăsta, îmi prind urechile acolo).

Cristi

Mihai Croitoru

unread,
Apr 10, 2008, 6:09:45 AM4/10/08
to Diacritice
De fapt Ş şi Ș (Ţ şi Ț) sînt într-adevăr litere diferite, dacă e să
privim problema la nivel global, nu numai pentru română.

Unui turc ce caută un cuvînt cu Ş cu sedilă nu i-ar conveni să
primească rezultate ce conţin şi Ș cu virgulă, pentru că acelea ar fi
clar cuvinte românești. Deci în mod sigur turcii se opun asimilării
lui Ş cu Ș, pe bună dreptate de altfel.

Dar Google (Yahoo, Live) ar putea face asimilarea Ş şi Ș (Ţ şi Ț)
pentru Google.ro şi astfel ar dispare problemele pentru românii ce
folosesc Vista sau chiar Linux ori Mac OSX. În momentul de faţă cei
care doresc să folosească diacriticele corecte (cu virgulă) în căutări
sînt penalizaţi de Google şi sînt obligaţi fie să le folosească pe
cele cu sedilă, fie să nu folosească deloc diacritice.

Adică acum am scăpat de problemele cu codarea diacriticelor şi am dat
de cele legate de bazele de date ale motoarelor de căutare. Pînă nu se
rezolvă şi treaba asta, promovarea folosirii diacriticelor pe internet
se loveşte de un obstacol greu de depăşit.

Alexandru Szasz

unread,
Apr 10, 2008, 6:27:15 AM4/10/08
to diacr...@googlegroups.com
2008/4/10 Cristian Secară <or...@secarica.ro>:

>
> On Thu, 10 Apr 2008 10:35:55 +0300, Alexandru Szasz wrote:
>
> > Dacă vrei, trimite-mi baza de date exportată într-un fișier sql, o
> > analizez, îți trimit baza de date convertită corect la utf8 și scriu
> > și un articol pe tema asta pentru ceilalți.
>
> Fișierul salvat din interfața phpBB e bun pentru asta ? Că altfel nu
> știu ce ar trebui să fac (deși pot să intru cu phpadmin sau ceva de
> genul ăsta, îmi prind urechile acolo).

Da, parcă are ceva el de backup, trimite-mi aia.
Te-ai gândit și să-l actualizezi la versiunea 3? Conform
http://www.phpbb.com/about/features/ versiunea 3 „suportă" UTF8.
Tu probabil l-ai mânărit prin temă să nu mai pună iso-8859-2, dar după
ce eu mă ocup de baza de date, tot mai trebuie să faci o modificare
prin cod; dacă rămâi la versiunea care o ai o să-ți trimit fișierul
modificat.


--
Alexandru Szasz

Cristian Secară

unread,
Apr 10, 2008, 6:41:56 AM4/10/08
to diacr...@googlegroups.com
On Thu, 10 Apr 2008 13:27:15 +0300, Alexandru Szasz wrote:

> Te-ai gândit și să-l actualizezi la versiunea 3? Conform
> http://www.phpbb.com/about/features/ versiunea 3 „suportă" UTF8.

Știu, dar îmi trebuie timp și acum nu am de așa ceva. Dar o să vină și
ziua aia la un moment dat. Până acum actualizările versiunii 2 erau un
chin pentru mine, că trebuia să completez cu mâna modificările la
fișierele .php în limba română direct în utf-8, pentru că nimeni
altcineva nu le mai avea. De fapt nimic complicat pentru cineva care
toată ziua scrie cod, dar nu sunt eu acela ...

> Tu probabil l-ai mânărit prin temă să nu mai pună iso-8859-2, dar după
> ce eu mă ocup de baza de date, tot mai trebuie să faci o modificare
> prin cod; dacă rămâi la versiunea care o ai o să-ți trimit fișierul
> modificat.

Baza de date este deja utf-8 la nivel de caractere, că așa i-am făcut
eu conversia (și s-a propagat ok după aia cu noile mesaje).
O să ți-o trimit să vezi ce și cum.

sorin.paliga

unread,
Apr 10, 2008, 10:35:36 AM4/10/08
to Diacritice

>
> Nu e o ştiinţă, e ceva la îndemână. Dacă faci o baza de date cu setul
> de caractere UTF-8 primeşti în schimb funcţionalitatea asta legată de
> căutarea cu diacritice.
>
> --
> Alexandru Szasz

Sigur că e la îndemînă, totul e la îndemînă, cu condiția să vrei și să
știi să faci acel lucru. În discuția asta s-au amestecat mai multe
lucruri:
- haosul introdus de MS acum mulți ani și cu încăpățînare dus pînă la
exasperare, cu acele s/t sedilă, în loc de s/t comma below (era
perioada cînd, la reuniunile ASRO, cineva zicea superior „s/t cu
sedilă e, de facto, standardul românesc, pierdem vremea cu virgula
asta, n-o va adopta nimeni” – acel cineva era, între alții, Mișu
Moldovan, mai ții minte, amice?)
- lipsa totală de preocupare a instituțiilor chemate să clarifice
situația, respectiv Academia Română;
- diletantismul celor care, cică, oferă soluții.

Toate astea puse cap la cap au condus la situația actuală, cultivată
și de diverși „specialiști” IT, de exemplu cei care analizează nu știu
ce produs nou, deși - în mod evident - habar nu au ce scriu și mai
scriu și fără diacritice și, oricum, agramat. Într-um mediu ostil
culturii, bunului simț și spiritului civic cum ar putea ieși ceva bun?
cum ar putea ieși ceva constructiv?

Mişu Moldovan

unread,
Apr 10, 2008, 10:54:47 AM4/10/08
to diacr...@googlegroups.com
"sorin.paliga" <sorin....@gmail.com> a scris:

>
> Sigur că e la îndemînă, totul e la îndemînă, cu condiția să vrei și să
> știi să faci acel lucru. În discuția asta s-au amestecat mai multe
> lucruri:
> - haosul introdus de MS acum mulți ani și cu încăpățînare dus pînă la
> exasperare, cu acele s/t sedilă, în loc de s/t comma below (era
> perioada cînd, la reuniunile ASRO, cineva zicea superior „s/t cu
> sedilă e, de facto, standardul românesc, pierdem vremea cu virgula
> asta, n-o va adopta nimeni” – acel cineva era, între alții, Mișu
> Moldovan, mai ții minte, amice?)

Nu mai ţin minte să fi zis asta domnu' Paliga, dar dacă ziceţi
d-voastră, aşa o fi, nu cred că se îndoieşte nimeni aici de judecata şi
de imparţialitatea d-voastră.

Dar ţin să vă contrazic la partea cu „zicea superior”, nu m-am simţit
„superior” şi nu cred că m-am exprimat „superior” în acele întâlniri.
Ba chiar dimpotrivă, fiind şi cel mai tânăr pe acolo şi nefăcând parte
din vreo instituţie relevantă, am stat mai mult la cutie, vorbind în
special despre cum stau lucrurile în Linux şi X.

--
mişu

sorin.paliga

unread,
Apr 10, 2008, 2:34:43 PM4/10/08
to Diacritice

>
> Dar ţin să vă contrazic la partea cu „zicea superior”, nu m-am simţit
> „superior” şi nu cred că m-am exprimat „superior” în acele întâlniri.
> Ba chiar dimpotrivă, fiind şi cel mai tânăr pe acolo şi nefăcând parte
> din vreo instituţie relevantă, am stat mai mult la cutie, vorbind în
> special despre cum stau lucrurile în Linux şi X.
>
> --
> mişu
>
>  application_pgp-signature_part
> 1KDescărcaţi

Nici nu ai avea motiv.
Mai rămîne să-mi explici, aștept de o lună, care ar fi fost rolul meu
negativ în discuțiile din perioada aia. Dacă faptul că am susținut s/t
comma below, da, așa e. Și uite că a învins binele. E drept, greu, dar
a învins. Acuma care e, de facto, standardul? s/t comma, nu? Văd că la
asta reacționași prompt, la întrebarea aia veche de o lună tot
aștept.
Nici eu nu făceam parte din vreo cutie specială, ziceam, vorbeam,
dădeam cu părerea și zic că am dat bine. Oricum tot ce zic ăia din
lumea uindăuz contează în cestii d-astea. Bine măcar că au adus la
numitor comun standardul RO.

Mişu Moldovan

unread,
Apr 10, 2008, 4:37:07 PM4/10/08
to diacr...@googlegroups.com
"sorin.paliga" <sorin....@gmail.com> a scris:

>
> Mai rămîne să-mi explici, aștept de o lună, care ar fi fost rolul meu
> negativ în discuțiile din perioada aia. Dacă faptul că am susținut s/t
> comma below, da, așa e. Și uite că a învins binele. E drept, greu, dar
> a învins. Acuma care e, de facto, standardul? s/t comma, nu? Văd că la
> asta reacționași prompt, la întrebarea aia veche de o lună tot
> aștept.

Așa aș putea să zic și io că aștept să vă duceți la bun sfârșit
amenințările repetate de a părăsi această listă, nu? V-am răspuns nu o
dată, ci de mai multe ori la problemele personale pe care le aveți
legate de mine, de ajunsesem să mă citez singur. Iar domnia voastră
răspundea tăind respectivul citat. (Pentru cine a intrat mai târziu la
spectacolul ăsta, nu, nu era vorba de diacritice commabelow).

Acuma nu știu de a fost cu intenție sau nu, personal cred că nu vedeți
decât ceea ce vreți să vedeți, după cum reiese și din lunga discuție pe
tema „tu versus dumneavoastră” unde nu ați reușit să pricepeți nici
măcar în final de ce sondajul de pe macuser.ro era fundamental greșit
și irelevant, deși trei persoane diferite v-au argumentat același lucru.

Mă rog, asta e... Revin cu ceea ce e realmente important și anume cu
rugămintea să lăsați lista asta în pace, este pentru a discuta probleme
de localizare. De așteptați lămuriri personale de la mine, vă repet, nu
mai am ce să mai adaug. De vreți să mă atacați, atacați-mă direct pe
adresa mea personală.

--
mișu

Cristian Secară

unread,
Apr 10, 2008, 4:59:04 PM4/10/08
to diacr...@googlegroups.com
On Thu, 10 Apr 2008 17:54:47 +0300, Mişu Moldovan wrote:

> > - haosul introdus de MS acum mulți ani și cu încăpățînare dus pînă
> > la exasperare, cu acele s/t sedilă, în loc de s/t comma below

Haosul a fost generat mai degrabă de incompetența româniei pe asemenea
probleme. Standardul ISO-8859-2 (Latin 2) datează din 1987, iar atunci
limba română era asociată explicit acelui standard. Cine-i de vină că
s-a vociferat abia prin 1998 pe tema asta când s-a produs standardul
SR 13411, adică cel care a stat la baza ISO 8859-16 (Latin 10) ?
Un scurt istoric, fără pretenții de a fi exhaustiv:
http://www.secarica.ro/html/s-uri_si_t-uri.html#istoric

Chiar și acum, noroc cu Uniuniea Europeană: actualizarea aceea de patru
fonturi pentru Windows XP se datorează unei cereri venite din partea
UE, nu din partea Academiei Române.

> > (era perioada cînd, la reuniunile ASRO, cineva zicea superior „s/t
> > cu sedilă e, de facto, standardul românesc, pierdem vremea cu
> > virgula asta, n-o va adopta nimeni” – acel cineva era, între alții,
> > Mișu Moldovan, mai ții minte, amice?)
> Nu mai ţin minte să fi zis asta domnu' Paliga, dar dacă ziceţi
> d-voastră, aşa o fi, nu cred că se îndoieşte nimeni aici de judecata
> şi de imparţialitatea d-voastră.

Hm. Există un „ceva” care bănuiesc că l-a determinat să vorbească așa.
În niciun caz „superior”, însă din ce țin eu minte pe vremea aia erai
deznădăjduit și înclinat spre o resemnare tristă. Posibil ca asta să fi
generat impresii nedorite :)

Ionel Mugurel Ciobica

unread,
Apr 10, 2008, 8:59:15 PM4/10/08
to diacr...@googlegroups.com
On 10-04-2008, at 00h 56'08", Mihai Croitoru wrote about "[diacritice] Re: Diacritice în bazele de date ?"

>
> Nu sînt două litere diferite, ci e aceeaşi literă scrisă diferit.
> Adică Ş cu sedilă e aceeaşi literă cu Ș cu virgulă, un cuvînt scris cu
> oricare din cele două tipuri de literă are acelaşi înţeles (Bucureşti
> = București).
>

Nu sînt de acord. Ș este o literă românească, pe cînd Ş este o literă
turcească. Întîmplarea face să se citească la fel, dar nu este acceași
literă.

București este capitala României. Bucureşti este scrierea capitalei
României cu alfabet turcesc, incorect pentru limba română.

Mai grav este pentru Ț și Ţ, căci Ţ nu este o literă. Adică nu face
parte din nici un alfabet din nici o țară. E ca și cum ai pune cedila
sub altă literă, R de exemplu. rezultatul nu este bun de nimic.

Mugurel

sorin.paliga

unread,
Apr 11, 2008, 12:53:11 AM4/11/08
to Diacritice

>
> Hm. Există un „ceva” care bănuiesc că l-a determinat să vorbească așa.
> În niciun caz „superior”, însă din ce țin eu minte pe vremea aia erai
> deznădăjduit și înclinat spre o resemnare tristă. Posibil ca asta să fi
> generat impresii nedorite :)
>
> Cristi
>
> --
> Cristian Secarăhttp://www.secarica.ro/

„pe vremea aia erai
> deznădăjduit și înclinat spre o resemnare tristă”
Ești simpatic, Secărică, uneori. Tare simpatic. Poate, dacă tot ești
săritor, îl ajuți pe Mișu Moldovanu să-mi zică, odată și odată, rolul
meu negativ din perioada aia, că tot evită, deși dă cu paru cînd are
ocazia.
Păi sigur că eram „întru resemnare tristă”, de vreme ce linuxiștii și
uindăuzarii își dăduseră mîna cu sîrg pe vremea aia, nici nu pricep de
ce a ieșit binișor, pînă la urmă.
Știi, e o vorbă din Talmud: dacă mergi pe drum și-ți spune unu că ești
măgar, treci mai departe; dacă îți spune și al doilea că ești măgar,
treci mai departe; dacă și al treilea îți spune că ești măgar, pune-ți
hățurile.
De aia am venit doar la două, din trei, întîlniri ASRO, mi-era teamă
că la a treia voi fi nevoit să-mi pun hățurile. Nemaivenind, nu le-am
mai pus, poate și le-au pus alții.

sorin.paliga

unread,
Apr 11, 2008, 12:57:20 AM4/11/08
to Diacritice

> > Nu sînt două litere diferite, ci e aceeaşi literă scrisă diferit.
> > Adică Ş cu sedilă e aceeaşi literă cu Ș cu virgulă, un cuvînt scris cu
> > oricare din cele două tipuri de literă are acelaşi înţeles (Bucureşti
> > = București).
>
> Nu sînt de acord. Ș este o literă românească, pe cînd Ş este o literă
> turcească. Întîmplarea face să se citească la fel, dar nu este acceași
> literă.
>
> București este capitala României. Bucureşti este scrierea capitalei
> României cu alfabet turcesc, incorect pentru limba română.
>
> Mai grav este pentru Ț și Ţ, căci Ţ nu este o literă. Adică nu face
> parte din nici un alfabet din nici o țară. E ca și cum ai pune cedila
> sub altă literă, R de exemplu. rezultatul nu este bun de nimic.
>
> Mugurel

Intrăm într-o discuție, în bună parte inutilă, privind istoria Unicode
și privind ezitările reprezentanților României în dansul ăsta
științific cu semnele diacritice. De vreme ce, la începutul anilor
’90, nu exista un standard românesc, marii zilei, preponderent Apple
și Microsoft (în ordine alfabetică) au făcut și ei cum i-a tăiat
capul. Cînd capul prost a fost tăiat, în final, s-a zbătut ani de zile
trupul fără cap și, pînă la urmă, a sucombat. Problema este ce facem
acuma, după înmormîntare, doar nu o să bocim etern, deși bocetul și
lamentul e specific malului Dîmboviței.

sorin.paliga

unread,
Apr 11, 2008, 1:04:54 AM4/11/08
to Diacritice

> Așa aș putea să zic și io că aștept să vă duceți la bun sfârșit
> amenințările repetate de a părăsi această listă, nu? V-am răspuns nu o
> dată, ci de mai multe ori la problemele personale pe care le aveți
> legate de mine, de ajunsesem să mă citez singur. Iar domnia voastră
> răspundea tăind respectivul citat. (Pentru cine a intrat mai târziu la
> spectacolul ăsta, nu, nu era vorba de diacritice commabelow).
>
Nu am nicio problemă personală, iară nu eu am declanșat războiu.
> Acuma nu știu de a fost cu intenție sau nu, personal cred că nu vedeți
> decât ceea ce vreți să vedeți, după cum reiese și din lunga discuție pe
> tema „tu versus dumneavoastră” unde nu ați reușit să pricepeți nici
> măcar în final de ce sondajul de pe macuser.ro era fundamental greșit
> și irelevant, deși trei persoane diferite v-au argumentat același lucru.

Trei persoane diferite nu au argumentat nimic, mi-au spus, voalat,
„ești prost, pleacă”. aș putea spune același lucru și eu despre ei,
dar mă abțin. În chestiunile astea, votul majoritar nu ține, nu o
întreb pe țața Floarea care e sensul filosofiei kantiene. Iar discuția
tu/dv. nu s-a terminat deloc, nici nu a început o dezbatere serioasă
pe tema asta, a fost o reacție, în bună parte isterică, a unor
persoane care gîndesc cu subînchiriere.

> Mă rog, asta e... Revin cu ceea ce e realmente important și anume cu
> rugămintea să lăsați lista asta în pace, este pentru a discuta probleme
> de localizare. De așteptați lămuriri personale de la mine, vă repet, nu
> mai am ce să mai adaug. De vreți să mă atacați, atacați-mă direct pe
> adresa mea personală.
>
> --
> mișu
De, de localizări vorbesc și eu, și de unele chestiuni grave,
nerezolvate încă. Dacă trebuie să o las, o voi lăsa, oricum nu am
rezolvat mare lucru, deoarece majoritatea nici nu prea vrea să le
rezolve, am senzațiunea.

Mihai Croitoru

unread,
Apr 11, 2008, 1:06:58 AM4/11/08
to Diacritice
On 11 Apr, 03:59, Ionel Mugurel Ciobica <I.M.Ciob...@gmail.com> wrote:
> Nu sînt de acord. Ș este o literă românească, pe cînd Ş este o literă
> turcească. Întîmplarea face să se citească la fel, dar nu este acceași
> literă.

Am zis şi eu acelaşi lucru cu 8 mesaje mai înainte. Oricum, "turcirea"
limbii române (diacritice cu sedilă) este preferabilă
"englezirii" (nefolosirii diacriticelor). Probabil că vor mai trece
vreo 5 ani înainte ca diacriticele cu virgulă să se impună. Asta din
cauza sistemelor cu XP care nu au instalată actualizarea de fonturi,
ca să nu mai zic de sistemele cu Windows 2000 sau 98.

Muţi din cei/cele care au situri sau bloguri sînt foarte reticenţi
cînd vine vorba să-şi piardă din vizitatori de pe urma introducerii
diacriticelor. În marea lor majoritatea ar abandona introducerea
diacriticelor decît să le scadă vizitatorii. A se lua în calcul şi
introducerea minicalculatoarelor portabile (de tipul eeePC de la Asus)
care sînt bazate pe Linux, iar utilizatorii obişnuiţi habar nu au cum
să activeze suportul pentru diacritice. Un exemplu e mai jos unde am
postat şi eu cîteva comentarii:

http://femeiasimpla.com/2008/04/03/a-din-a-sau-i-din-i/

Alexandru Szasz

unread,
Apr 11, 2008, 2:00:22 AM4/11/08
to diacr...@googlegroups.com
2008/4/11 Mihai Croitoru <miha...@gmail.com>:

>
> On 11 Apr, 03:59, Ionel Mugurel Ciobica <I.M.Ciob...@gmail.com> wrote:
> > Nu sînt de acord. Ș este o literă românească, pe cînd Ş este o literă
> > turcească. Întîmplarea face să se citească la fel, dar nu este acceași
> > literă.
>
> Am zis şi eu acelaşi lucru cu 8 mesaje mai înainte. Oricum, "turcirea"
> limbii române (diacritice cu sedilă) este preferabilă
> "englezirii" (nefolosirii diacriticelor). Probabil că vor mai trece
> vreo 5 ani înainte ca diacriticele cu virgulă să se impună. Asta din
> cauza sistemelor cu XP care nu au instalată actualizarea de fonturi,
> ca să nu mai zic de sistemele cu Windows 2000 sau 98.

Când s-a trecut de la î din â în mijloc și sunt nu ni s-a dat o
perioadă de acomodare, țin minte că televiziunile cele mai populare
imediat au luat acea regulă și au aplicat-o.
Nu e loc de compromis nici în privința lui ș. Un pericol care ne paște
este motorul de căutare pe care tot crește numărul de rezultate cu s
cu sedilă, și altul mai important este unul de natură educațională.
Dacă copiii văd peste tot s cu sedilă, nu m-aș mira să văd în curând
scris de mână cu sedilă în loc de virgulă, cu tilda pe a, etc. Scris
de mână fără diacritice am văzut deja.

>
> Muţi din cei/cele care au situri sau bloguri sînt foarte reticenţi
> cînd vine vorba să-şi piardă din vizitatori de pe urma introducerii
> diacriticelor. În marea lor majoritatea ar abandona introducerea
> diacriticelor decît să le scadă vizitatorii. A se lua în calcul şi
> introducerea minicalculatoarelor portabile (de tipul eeePC de la Asus)
> care sînt bazate pe Linux, iar utilizatorii obişnuiţi habar nu au cum
> să activeze suportul pentru diacritice. Un exemplu e mai jos unde am
> postat şi eu cîteva comentarii:
>
> http://femeiasimpla.com/2008/04/03/a-din-a-sau-i-din-i/
>

Habar nu au pentru că eeePC nu are suport pentru română ca să alegi
pur şi simplu dintr-o fereastră. Şi asta probabil pentru că niciun
român nu s-a ocupat de Xandros, distribuţia care o folosesc.

--
Alexandru Szasz

Mihai Croitoru

unread,
Apr 11, 2008, 2:14:41 AM4/11/08
to Diacritice
On 11 Apr, 09:00, "Alexandru Szasz" <alex...@gmail.com> wrote:
> Habar nu au pentru că eeePC nu are suport pentru română ca să alegi
> pur şi simplu dintr-o fereastră. Şi asta probabil pentru că niciun
> român nu s-a ocupat de Xandros, distribuţia care o folosesc.

Aici ar trebui să intervină statul (Agenţia de Protecţie a
Consumatorului) care să nu permită comercializarea dispozitivelor
electronice care nu au suport preinstalat pentru limba română. Acelaşi
stat care ar fi trebuit să oblige vînzătorii de calculatoare să aibă
în oferte tastaturi cu diacritice imprimate...

În cazul eeePC sigur nu e posibilă selectarea limbii române? Pentru că
pe situl Asus la FAQ scrie:
................................
How to change input language?

1. Click the "keyboard" icon on the task bar at the bottom of the
screen to choose the other input options directly.
2. press<Ctrl>+<Shift>to change different input.
................................

http://eeepc.asus.com/global/support.htm

Mihai Croitoru

unread,
Apr 11, 2008, 2:23:20 AM4/11/08
to Diacritice
On 11 Apr, 09:00, "Alexandru Szasz" <alex...@gmail.com> wrote:
> Nu e loc de compromis nici în privința lui ș. Un pericol care ne paște
> este motorul de căutare pe care tot crește numărul de rezultate cu s
> cu sedilă, și altul mai important este unul de natură educațională.
> Dacă copiii văd peste tot s cu sedilă, nu m-aș mira să văd în curând
> scris de mână cu sedilă în loc de virgulă, cu tilda pe a, etc. Scris
> de mână fără diacritice am văzut deja.

Lumea nu percepe Ş-ul ca avînd sedilă şi Ș-ul ca avînd virgulă. Cred
că 99% din utilizatorii de calculatoare nu ştiu depre diferenţa dintre
sedilă şi virgulă, dar dacă-i pui să scrie ceva de mînă folosesc
virgula, nu sedila, pentru că aşa au învăţat la şcoală şi este deja un
automatism.

Trecerea de la Ş la Ș nu este deloc uşoară pentru ziare sau alte
situri ce folosesc diacritice. Mulţi ar protesta şi ar zice că văd
pătrăţele. Alţii ar zice că literele cu virgulă au altă dimensiune (ca
aici, pe Google Groups) şi se vede urît. Poate că lucrurile vor putea
fi accelerate cînd procentul de utilizatori de XP SP3 şi Vista va
depăşi 80%.

Mişu Moldovan

unread,
Apr 11, 2008, 3:08:53 AM4/11/08
to diacr...@googlegroups.com
"sorin.paliga" <sorin....@gmail.com> a scris:

>
> >
> Nu am nicio problemă personală, iară nu eu am declanșat războiu.
> > Acuma nu știu de a fost cu intenție sau nu, personal cred că nu
> > vedeți decât ceea ce vreți să vedeți, după cum reiese și din lunga
> > discuție pe tema „tu versus dumneavoastră” unde nu ați reușit să
> > pricepeți nici măcar în final de ce sondajul de pe macuser.ro era
> > fundamental greșit și irelevant, deși trei persoane diferite v-au
> > argumentat același lucru.
>
> Trei persoane diferite nu au argumentat nimic, mi-au spus, voalat,
> „ești prost, pleacă”. aș putea spune același lucru și eu despre ei,
> dar mă abțin.

Citez din nou: „Sondajul e greșit, în ambele moduri de adresare
dezbătute se folosește adresarea la persoana a II-a singular când se
dau comenzi calculatorului.”

Ca să explic mai pe îndelete, deşi sper că nu e nevoie, nu există
diferenţe între abordarea propusă pe macuser.ro şi cea utilizată în
traducerile politicoase când se dau comenzi calculatorului. În ambele
cazuri varianta agreată este „Eşti prost, pleacă”, adică modul
imperativ, persoana a II-a singular.

--
mişu

Mişu Moldovan

unread,
Apr 11, 2008, 3:27:49 AM4/11/08
to diacr...@googlegroups.com
"Alexandru Szasz" <ale...@gmail.com> a scris:

>
> Dacă copiii văd peste tot s cu sedilă, nu m-aș mira să văd în curând
> scris de mână cu sedilă în loc de virgulă, cu tilda pe a, etc. Scris
> de mână fără diacritice am văzut deja.

Sunt foarte interesat de chestia asta. În ce împrejurări s-a întâmplat?


> Habar nu au pentru că eeePC nu are suport pentru română ca să alegi
> pur şi simplu dintr-o fereastră. Şi asta probabil pentru că niciun
> român nu s-a ocupat de Xandros, distribuţia care o folosesc.

Sunt împotriva ideii ca de fiecare distribuţie să se ocupe un român ca
să fie OK pentru români. Nu ştiu cum e cu eeePC, dar dacă foloseşte
Linux cu glibc ar trebui să fie OK. Or fi tăiat ei din pachete ca să
ocupe mai puţin instalarea? Adică de exemplu pachetul KDE cu
traducerile româneşti? Sau au mânărit centrul de control KDE şi nu mai
include opţiunile de schimbare a aranjamentului de tastatură? Ştie
cineva?

--
mişu

Mihai Croitoru

unread,
Apr 11, 2008, 3:29:09 AM4/11/08
to Diacritice
On 11 Apr, 10:08, Mişu Moldovan <du...@gnome.ro> wrote:
> Ca să explic mai pe îndelete, deşi sper că nu e nevoie, nu există
> diferenţe între abordarea propusă pe macuser.ro şi cea utilizată în
> traducerile politicoase când se dau comenzi calculatorului. În ambele
> cazuri varianta agreată este "Eşti prost, pleacă", adică modul
> imperativ, persoana a II-a singular.

Da, şi de aici intervin diferenţele.

PC-ul răspunde : Sigur doriţi să plec ?
Mac-ul răspunde : Sigur doreşti să plec ?

Intervenţiile astea în afara subiectului pe toate firele ne fac să
avem pe acest grup o replică scrisă a clipurilor video publicitare Mac
contra PC.

Mihai Croitoru

unread,
Apr 11, 2008, 4:09:55 AM4/11/08
to Diacritice
On 11 Apr, 10:27, Mişu Moldovan <nizna...@gmail.com> wrote:
> Sunt împotriva ideii ca de fiecare distribuţie să se ocupe un român ca
> să fie OK pentru români. Nu ştiu cum e cu eeePC, dar dacă foloseşte
> Linux cu glibc ar trebui să fie OK. Or fi tăiat ei din pachete ca să
> ocupe mai puţin instalarea? Adică de exemplu pachetul KDE cu
> traducerile româneşti? Sau au mânărit centrul de control KDE şi nu mai
> include opţiunile de schimbare a aranjamentului de tastatură? Ştie
> cineva?

Voluntariatul e singura soluţie pentru ca să se rezolve cît mai repede
problemele cu diacriticele româneşti pe dispozitivele astea noi care
apar. Statul nu se bagă, iar utilizatorilor puţin le pasă.

Legăturile de mai jos sînt la pagini cu comentarii ale utilizatorilor/
cumpărătorilor potenţiali, dar nimeni nu întreabă de suportul pentru
limba română. Nici în prezentarea produsului de pe eMAG vînzătorul nu
socoteşte necesar să spună ceva despre suportul pentru diacriticele
româneşti. Lăsarea limbii române pe mîna utilizatorilor/vînzătorilor/
publicitarilor s-a dovedit a fi un lucru greşit, de aia au apărut
problemele cu care ne confruntăm acum.

http://www.emag.ro/notebook_laptop/notebook-eee-pc-asus-701-4gb-512mb-ram-wlan-alb--pEEEPC4G-W0009#meniu

http://forum.emag.ro/index.php?showtopic=6700

Sergiu Bivol

unread,
Apr 11, 2008, 4:57:09 AM4/11/08
to Diacritice
Cu diacriticele nu există nici o problemă în bazele de date. Trebuie
doar ca cei care le fac să aibă un creier măcar cît firul de mazăre ca
să poată să lucreze cu diacritice atît în interior, cît și în orice
operații. Și eu am proiectat și gestionez o bază de date (mică, a unei
universități din Chișinău) și mă confrunt cu aceleași situații
obișnuite, dar extrem de simplu de rezolvat:

1) în reprezentarea internă totul se scrie cu șț cu virgulă, conform
standardului; setul de caractere se stabilește la Unicod, gestiunea -
utf8_romanian_ci.
2) la interogare - SET NAMES utf8;
și un algoritm care să elimine diferența dintre codiță și virgulă:

DACĂ șir_căutat CONȚINE ş: ÎNLOCUIEȘTE CU ș
......
DACĂ șir_căutat CONȚINE Ţ: ÎNLOCUIEȘTE CU Ț

INTEROGHEAZĂ baza_de_date CU șir_căutat

Astfel, utilizatorii primesc răspunsul la interogare fără să blesteme
limba română.
Tot ce contează este ca lecțiile de informatică în școli și
universități să înceapă cu fraza „Iată un calculator, și iată cum se
scrie la el în limba română...” Așa încep toate cărțile despre sisteme
de operare și baze de date la ruși.
Noi, românii, ne-am găsit mai hîtri ca toți, să învățăm această temă
de sine stătător. Și e mare rușine.

Mihai Croitoru

unread,
Apr 11, 2008, 5:11:38 AM4/11/08
to Diacritice
On 11 Apr, 11:57, Sergiu Bivol <sergiu-bi...@mail.md> wrote:
> Tot ce contează este ca lecțiile de informatică în școli și
> universități să înceapă cu fraza „Iată un calculator, și iată cum se
> scrie la el în limba română...” Așa încep toate cărțile despre sisteme
> de operare și baze de date la ruși.
> Noi, românii, ne-am găsit mai hîtri ca toți, să învățăm această temă
> de sine stătător. Și e mare rușine.

E vorba doar de o delăsare generalizată ("merge şi aşa") şi de
consecinţa reputaţiei proaste pe care o are limba română (dar şi
România în general) printre români. Românii care lucrează în Spania
sau Franţa nu se apucă acolo să scrie fără diacriticele spaniole sau
franţuzeşti, le-ar fi ruşine să nu se facă de rîs şi să apară ca
inculţi, dar aici în România nu le pasă de părerea celorlalţi, tocmai
pentru că nefolosirea diacriticelor este regula şi nu excepţia.

Chiar dacă se rezolvă problema cu bazele de date şi toate o să fie
compatibile cu diacriticele corecte, asta nu va rezolva problema
utilizatorilor, din care peste 80% scriu fără diacritice şi nu se
gîndesc deloc că ar face ceva greşit, tocmai pentru că se uită în
jurul lor (real sau virtual) şi văd acelaşi comportament cînd vine
vorba de scriul la calculator.

Alexandru Szasz

unread,
Apr 11, 2008, 5:18:46 AM4/11/08
to diacr...@googlegroups.com
2008/4/11 Sergiu Bivol <sergiu...@mail.md>:

>
> și un algoritm care să elimine diferența dintre codiță și virgulă:
>
> DACĂ șir_căutat CONȚINE ş: ÎNLOCUIEȘTE CU ș
> ......
> DACĂ șir_căutat CONȚINE Ţ: ÎNLOCUIEȘTE CU Ț
>

Am mai spus anterior, nu trebuie nimic special, dacă coloana e cu utf8
case insensitive (ci) atunci se face normalizare, adică dacă se caută
cu LIKE după un cuvânt cu s, s cu sedilă, cu virgulă sau cu alte
chestii sunt întoarse toate rezultatele care conțin s, s cu sedilă sau
alte chestii.

2008/4/11 Mişu Moldovan <nizn...@gmail.com>:


> "Alexandru Szasz" <ale...@gmail.com> a scris:
>
> >
> > Dacă copiii văd peste tot s cu sedilă, nu m-aș mira să văd în curând
> > scris de mână cu sedilă în loc de virgulă, cu tilda pe a, etc. Scris
> > de mână fără diacritice am văzut deja.
>
> Sunt foarte interesat de chestia asta. În ce împrejurări s-a întâmplat?

Am văzut o lucrare scrisă de un elev de liceu. Am mai văzut și
formulare completate la diferite cozi. Grafitti pe pereți iarăși.

> "Alexandru Szasz" <ale...@gmail.com> a scris:

> > Habar nu au pentru că eeePC nu are suport pentru română ca să alegi
> > pur şi simplu dintr-o fereastră. Şi asta probabil pentru că niciun
> > român nu s-a ocupat de Xandros, distribuţia care o folosesc.
>

> Sunt împotriva ideii ca de fiecare distribuţie să se ocupe un român ca
> să fie OK pentru români. Nu ştiu cum e cu eeePC, dar dacă foloseşte
> Linux cu glibc ar trebui să fie OK. Or fi tăiat ei din pachete ca să
> ocupe mai puţin instalarea? Adică de exemplu pachetul KDE cu
> traducerile româneşti? Sau au mânărit centrul de control KDE şi nu mai
> include opţiunile de schimbare a aranjamentului de tastatură? Ştie
> cineva?

E vorba de distribuție, nu de X. De exemplu, fedora are o unealtă care
se cheamă system-config-language, în care poți alege Română. După ce
alegi asta scrie fișierele /etc/i18n, tastatura și ce mai trebuie.
Deci astea sunt specifice distribuției.

Acum la tastatură s-ar putea să fie inclusă aplicația kde/gnome care
poate schimba tastatura, dar cine știe dacă e instalată maparea
românească pentru X, poate au tăiat din pachete să fie mai mică
distribuția.

2008/4/11 Mihai Croitoru <miha...@gmail.com>:


>
>
> Lumea nu percepe Ş-ul ca avînd sedilă şi Ș-ul ca avînd virgulă. Cred
> că 99% din utilizatorii de calculatoare nu ştiu depre diferenţa dintre
> sedilă şi virgulă, dar dacă-i pui să scrie ceva de mînă folosesc
> virgula, nu sedila, pentru că aşa au învăţat la şcoală şi este deja un
> automatism.

Tu vroiai să spui de fapt că mulți oameni nu știu ce înseamnă
diacritice sau sedile. Oricine știe că ș se scrie s și „o linie" sub
care nu se unește cu s. Asta e diferența majoră dintre sedilă și
virgulă.

Eu am încercat un eeePC într-un magazin și când m-am dus acolo la
limbi nu era româna. Oricum pot să pariez că nu sunt nici fonturi care
să scrie cu șț cu virgulă în Xandros.

În altă ordine de idei, Mișu și Sorin, vă rog să vorbiți în privat
despre ce aveți de împărțit, e tare greu de urmărit un subiect dacă
tot trebuie să trec peste texte care nu mă interesează și nu cred că
interesează nici pe altcineva. Iar dacă vreți să-mi răspundeți în
legătură cu asta, schimbați vă rog subiectul. Mulțumesc.

--
Alexandru Szasz

Cristian Secară

unread,
Apr 11, 2008, 5:31:47 AM4/11/08
to diacr...@googlegroups.com
On Fri, 11 Apr 2008 02:11:38 -0700 (PDT), Mihai Croitoru wrote:

> Chiar dacă se rezolvă problema cu bazele de date şi toate o să fie
> compatibile cu diacriticele corecte, asta nu va rezolva problema
> utilizatorilor, din care peste 80% scriu fără diacritice şi nu se
> gîndesc deloc că ar face ceva greşit, tocmai pentru că se uită în
> jurul lor (real sau virtual) şi văd acelaşi comportament cînd vine
> vorba de scriul la calculator.

Dacă ar avea tastaturi cu taste pictate (din fabrică) cu caractere
românești, ar scrie măcar de curiozitate. Unii poate că ar continua.

Alexandru Szasz

unread,
Apr 11, 2008, 5:36:14 AM4/11/08
to diacr...@googlegroups.com
2008/4/11 Cristian Secară <or...@secarica.ro>:

>
> Dacă ar avea tastaturi cu taste pictate (din fabrică) cu caractere
> românești, ar scrie măcar de curiozitate. Unii poate că ar continua.
>

Dar Fujitsu-Siemens, de exemplu, distribuie cu calculatoarele lor
tastaturi românești (nestandard încă cred), dar o fac degeaba dacă
omul nu selectează limba română pentru tastatură din sistemul de
operare.

--
Alexandru Szasz

Mişu Moldovan

unread,
Apr 11, 2008, 5:47:29 AM4/11/08
to diacr...@googlegroups.com
"Alexandru Szasz" <ale...@gmail.com> a scris:
>
> Eu am încercat un eeePC într-un magazin și când m-am dus acolo la
> limbi nu era româna. Oricum pot să pariez că nu sunt nici fonturi care
> să scrie cu șț cu virgulă în Xandros.

Şi io-s gata să pariez că se pot afişa... Cine taie? Şi pe ce pariem?

Dacă e foarte posibil să nu fi inclus localizări ale interfeţei în prea
multe limbi, mi se pare foarte puţin probabil să fi încercat să elimine
glifele cu diacritice din fonturile DejaVu, ar fi absurd şi nu ar
câştiga mai nimic. S-ar putea să câştigi pariul dacă nu-s fonturile
DejaVu incluse, dar m-aş mira.

--
mişu

Mihai Croitoru

unread,
Apr 11, 2008, 5:48:59 AM4/11/08
to Diacritice
On 11 Apr, 12:18, "Alexandru Szasz" <alex...@gmail.com> wrote:
> Tu vroiai să spui de fapt că mulți oameni nu știu ce înseamnă
> diacritice sau sedile. Oricine știe că ș se scrie s și „o linie" sub
> care  nu se unește cu s. Asta e diferența majoră dintre sedilă și
> virgulă.

Nici vorbă, lumea nu îşi pune problema de ce la Ş e o chestie unită de
literă, iar la Ţ una care nu e unită. Sînt lucruri de detaliu pentru
utilizatori, pe ei îi interesează doar să poată scrie la calculator în
aşa fel încît să fie înţeleşi de alţii. Şi pentru că "alţii" îi
înţeleg şi dacă scriu fără diacritice (sau mai ales aşa), atunci vor
scrie fără diacritice pentru că e cel mai simplu (nu mai folosesc 5
taste cu litere în plus faţa de cele de pe tastatura US). Există o
mişcare de rezistenţă faţă de diacritice căreia nu trebuie să-i
neglijăm importanţa. Noi vorbim aici de sedilă şi virgulă, dar 80% din
utilizatori au tranşat deja problema, ei nu folosesc nici una, nici
alta.

Mai mult, portalul clopotel.ro, cel mai vizitat portal pentru copii/
adoloscenţi conform SATI.ro, nu are diacritice. Şi mai tare e că acum
pe prima pagină e promovat albumul personal al unei fete de 15 ani
care scrie cu sh, cu k, care uită unele vocale şi care nu foloseşte
cratima (ci punctul!). În partea de jos a paginii sînt utilizatorii
online. Clic pe oricare din ei/ele pentru a le vedea profilul. Nimeni
nu foloseşte diacritice, toţi folosesc prescurtări.

http://www.clopotel.ro/prieteni/pagina-flyAwayIntoTheSun-237216-album.html

Cam asta e situaţia la momentul de faţă. Dacă nu pot fi convinşi să
scrie cu diacritice utilizatori de peste 20-25 de ani, cum o să li se
poată cere asta unora de 15 ani sau mai puţin ?

Alexandru Szasz

unread,
Apr 11, 2008, 6:13:58 AM4/11/08
to diacr...@googlegroups.com
2008/4/11 Mihai Croitoru <miha...@gmail.com>:

>
> On 11 Apr, 12:18, "Alexandru Szasz" <alex...@gmail.com> wrote:
> > Tu vroiai să spui de fapt că mulți oameni nu știu ce înseamnă
> > diacritice sau sedile. Oricine știe că ș se scrie s și „o linie" sub
> > care nu se unește cu s. Asta e diferența majoră dintre sedilă și
> > virgulă.
>
> Nici vorbă, lumea nu îşi pune problema de ce la Ş e o chestie unită de
> literă, iar la Ţ una care nu e unită. Sînt lucruri de detaliu pentru
> utilizatori, pe ei îi interesează doar să poată scrie la calculator în
> aşa fel încît să fie înţeleşi de alţii.

Ai văzut pe cineva să scrie de mână cu sedile ? Adică să unească
intenționat „linia" de jos cu litera ?
Eu nu am văzut, de aceea cred că îi interesează pe oameni asta în
sensul că au imprimat pe creier că nu se face asta.
Am văzut i cu inimioare deasupra, dar sedile în scris încă nu.

În documente vizual nu-i deranjează, nu văd imediat diferența, însă eu
spuneam că dacă se perpetuează obiceiul, în timp copii vor începe să
scrie cu sedile și atunci va fi haos.

--
Alexandru Szasz

Cristian Secară

unread,
Apr 11, 2008, 6:14:57 AM4/11/08
to diacr...@googlegroups.com
On Fri, 11 Apr 2008 12:36:14 +0300, Alexandru Szasz wrote:

> Dar Fujitsu-Siemens, de exemplu, distribuie cu calculatoarele lor
> tastaturi românești (nestandard încă cred), dar o fac degeaba dacă
> omul nu selectează limba română pentru tastatură din sistemul de
> operare.

Nu știu nimic despre asta. Au existat câteva tastaturi pe standardul
din 1998 (în principiu) făcute de Siemens, dar nu cred să fi fost
fabricate mai mult de 200 de bucăți. Arată așa
http://www.cimec.ro/joaca/
Eu am una Cherry, tot pe standardul din 1998 (strict). Bună, dar nu
formidabilă. Logitech sau Microsoft sunt net superioare (mecanic, la
pipăire, nu mă refer la altceva).

Altă tâmpenie în ziua de azi este că se insistă pe PS/2 la tastaturi.

Alexandru Szasz

unread,
Apr 11, 2008, 6:21:49 AM4/11/08
to diacr...@googlegroups.com
2008/4/11 Cristian Secară <or...@secarica.ro>:

>
> On Fri, 11 Apr 2008 12:36:14 +0300, Alexandru Szasz wrote:
>
> > Dar Fujitsu-Siemens, de exemplu, distribuie cu calculatoarele lor
> > tastaturi românești (nestandard încă cred), dar o fac degeaba dacă
> > omul nu selectează limba română pentru tastatură din sistemul de
> > operare.
>
> Nu știu nimic despre asta. Au existat câteva tastaturi pe standardul
> din 1998 (în principiu) făcute de Siemens, dar nu cred să fi fost
> fabricate mai mult de 200 de bucăți. Arată așa
> http://www.cimec.ro/joaca/

Da, din aia am avut și eu la lucru ( http://www.alexxed.com/node/33 ).
Erau vreo 50 în toată firma, deci nu cred că numai 200 au fost
fabricate.

--
Alexandru Szasz

Mihai Croitoru

unread,
Apr 11, 2008, 6:56:12 AM4/11/08
to Diacritice
On 11 Apr, 13:13, "Alexandru Szasz" <alex...@gmail.com> wrote:
> Ai văzut pe cineva să scrie de mână cu sedile ? Adică să unească
> intenționat „linia" de jos cu litera ?
> Eu nu am văzut, de aceea cred că îi interesează pe oameni asta în
> sensul că au imprimat pe creier că nu se face asta.
> Am văzut i cu inimioare deasupra, dar sedile în scris încă nu.
>
> În documente vizual nu-i deranjează, nu văd imediat diferența, însă eu
> spuneam că dacă se perpetuează obiceiul, în timp copii vor începe să
> scrie cu sedile și atunci va fi haos.

Evident că nu am văzut pe nimeni scriind cu sedilă, dar scrisul de
mînă este oricum mai mult sau mai puţin indescifrabil la adulţi, mai
ales la cei care nu l-au mai practicat de multă vreme. Iar copiii/
adolescenţii nu vor mai scrie deloc cu diacritice, pe măsură ce
scrisul se va muta de pe hîrtie pe calculator şi în şcoală. Ăsta e
pericolul, nu că vor scrie cu sedilă şi nu cu virgulă, ei oricum vor
scrie cum le va permite calculatorul de la şcoală, la care mă îndoiesc
că vor putea să umble în setări. Iar dacă învăţătorii/profesorii vor
proveni din cei care s-au format scriind la calculator fără
diacritice, atunci toleranţa va fi şi mai mare la lipsa diacriticelor.
Dar Ministerul Educaţiei are alte treburi, probabil e cu gîndul la
următoarea grevă a personalului didactic...

Oricum şi pe tastatura Fujitsu-Siemens se văd clar sedilele la Ş şi Ţ.
Şi căutînd pe internet am dat şi de un sit care-şi propune să le ofere
străinilor noţiuni de română. E scris cu diacritice, dar cu cele cu
sedilă, chiar şi Ţ-ul. E un sit amatoristic, dar e al doilea rezultat
obţinut la căutarea "learn romanian" cu Google. Cea mai tare e faza :
"About 70% of the Romanian vocabulary is of Latin origin but there
were added many borrowings from Slavic languages (in the sphere of
religious terms)[...]". Cred că ăla/aia care-a făcut situl consideră
că şi "iubire, dragoste, prietenie" şi derivatele sînt termeni
religioşi, că doar provin din slavă...

http://www.learnromanian.ro/english/Romanian-vocabulary-alphabet.php

sorin.paliga

unread,
Apr 11, 2008, 12:33:53 PM4/11/08
to Diacritice

>
> Aici ar trebui să intervină statul (Agenţia de Protecţie a
> Consumatorului) care să nu permită comercializarea dispozitivelor
> electronice care nu au suport preinstalat pentru limba română. Acelaşi
> stat care ar fi trebuit să oblige vînzătorii de calculatoare să aibă
> în oferte tastaturi cu diacritice imprimate...

Ha, ha, ha... Care stat? Statul în c... poate. Păi ani de zile statul,
la care te referi și în care speri în van, nu a făcut absolut nimic pt
grăbirea standardizării limbii române, într-un tîrziu a intervenit
ASRO, la presiunile lui Secărică (dacă nu era el, nici aia nu era,
cred) și, după ani, s-a ajuns la un soi de coerență, după ce, ani de
zile, MS - mai ales - a avut grijă să răspîndească incoerența.
Sigur că e haotic încă, s/t sedilă e majoritar încă, deși incorect. Nu
ar fi chiar așa de greu să uniformizezi bazele de date RO admițînd,
încă doi ani, să zicem, s/t sedilă alături de s/t virgulă, după care
gata, numai s/t virgulă.
Problema cu s/t sedilă nu e atît turcism și nu ar fi, teoretic, mai
rea decît s/t virgulă. Pur și simplu așa au considerat intelectualii
sec. XIX că trebuie făcut (Titu Maiorescu a avut atunci un cuvînt
greu). Puteau alege s/t sedilă, puteau alege s/t cu punct (sus sau
jos), puteau alege sh și tz... Au ales s/t cu virgulă. De ce? Deoarece
ș românesc provine din s latin, iar ț din t latin (în anumite secvențe
fonetice). Se putea alege, cum ziceam, s/t sedilă. Cred că s-a ales
virgula deoarece mîna face mai ușor virgula sub o literă decît sedila,
mai greu de încondeiat, ca să zic așa. Diverse alte limbi au ales alte
soluții, nici mai bune, nici mai rele. Este dreptul fiecărei țări să
aleagă un standard.
Nenorocirea a venit acuma, în era IT, cînd MS – dorind probabil să
reducă la minim diacriticele – a răspîndit s sedilă și pt română și,
nu se știe de ce, probabil pt simetrie, și t sedilă, deși t sedilă nu
e normat niciunde (Unicode a dres-o, la un moment dat, afirmând că t
sedilă ar fi folosit pt transcrieri semite - adică tzav, bag sama,
deși nu cred, cred că e o găselniță, ebraic tzav e transcris prin tz,
nicicînd prin ţ, adică t sedilă; eu unul nu am văzut nicio normă în
acest sens și am toate motivele să cred că au dres busuiocul invocând
chestia asta).
Bun, ce-a fost a fost, lui Titu Maiorescu i s-a făcut dreptate și în
era IT, Apple a învins iar, MS s-a conformat (deși putea să o facă
mult mai devreme, nu trebuia să aștepte Vista). Va mai trece un timp
pînă cînd lucrurile se vor uniformiza. Cît de repede, nu știu. În
măsura în care, fie și în ceasul al 13-lea, Academia se va implica,
poate. Eu nu cred și, dat fiind precedentul jocului imbecil de-a â/î,
mai bine lipsă decît așa cum a făcut în 1992–1993.

Mișu Moldovan

unread,
Apr 11, 2008, 2:29:05 PM4/11/08
to diacr...@googlegroups.com
Cristian Secară <or...@secarica.ro> a scris:

„Deznădăjduit” cred că-i mult spus, dar eram într-adevăr pesimist. Și
sunt în continuare pesimist, pentru că prin natura muncii mele de zi cu
zi văd zeci, sute de utilizatori români și îi urmăresc cum pocesc
limba română și cum reacționează când au probleme de localizare.

Resemnat nu eram, de aia am și acceptat să particip la respectivele
întruniri, deși eram jenat de relativa mea neînsemnătate în privința
elaborării unui nou standard de tastatură românească. Mă bucur că a
intrat în standardul final și aranjamentul pe care îl folosim în X,
înseamnă că n-am făcut doar act de prezență.

Dar departe de mine și atunci, la fel ca și acum, ideile de genul
„pierdem vremea cu virgula asta”. Noi aveam deja în 2003-2004 în X un
aranjament numit „comma” ce genera diacritice cu virgulă dedesubt. Cred
că a fost adăugat în 2000 de Marius Andreiana, dar nu era implicit,
pentru că lumea nu era pregătită pentru așa ceva. Dar asta s-a schimbat
încetul cu încetul, în special datorită eforturilor tale, Cristi. Și
începând de anul ăsta distribuțiile Linux, BSD, OpenSolaris etc. ce
folosesc xkeyboard-config (deci cam toate) vor avea ca aranjament
implicit pentru limba română un set ce va genera diacritice corecte.

Sunt conștient că încă e devreme pentru așa ceva, instalările XP domină
și cele mai multe nu afișează diacriticele commabelow, dar e important
să tragem și noi de balanță înspre diacriticele corecte. De când i-ai
convins și pe cei de la Microsoft România, e indubitabil că vom ajunge
mai devreme sau mai târziu la ele, sper să se simtă în privința asta și
impactul utilizatorilor Linux ce scriu românește cu diacritice.

--
mișu

Cristian Secară

unread,
Apr 11, 2008, 3:05:54 PM4/11/08
to diacr...@googlegroups.com
On Fri, 11 Apr 2008 21:29:05 +0300, Mișu Moldovan wrote:

> Resemnat nu eram, de aia am și acceptat să particip la respectivele
> întruniri, deși eram jenat de relativa mea neînsemnătate în privința
> elaborării unui nou standard de tastatură românească. Mă bucur că a
> intrat în standardul final și aranjamentul pe care îl folosim în X,
> înseamnă că n-am făcut doar act de prezență.

Hm. Există un aspect să zicem mai obscur despre cum a ajuns să fie
prezent în standard aranjamentul doi (cel care pe primul nivel e nativ
EN-US).
Introducerea aranjamentului à la Linux l-am băgat pe gât mai mult pe
considerente psihologice decât că eram sau sunt convins de grozăvia lui
pe sistemele utilizatorilor banali (= care nu au nevoie de lina de
comandă). Am mizat pe acest aranjament pentru a favoriza acceptarea
ideii de tastatură românească în general.
Mai precis am mizat pe asta (extras de undeva din pagina de la
http://www.secarica.ro/arhive/sr_13392/html/ro_kbd_std_-_etapa_1.html ):
===
[despre aranjamentul 2]
* categoria celor cărora le este teamă să încerce ceva nou şi care –
cred ei – le dă peste cap ceva cu care s-au obişnuit (tastatura US
English) dar care ar dori totuşi să ştie că pot, la nevoie, să facă
ceva în plus; aceştia nu au folosit practic niciodată vreun caracter
românesc; este însă o metodă psihologică foarte eficientă de a-i
obişnui cu prezenţa limbii române pe tastatură
* o categorie (redusă) de utilizatori, în special tineri, care este
total împotriva utilizării unei tastaturi non-US, dar care acceptă un
compromis prin folosirea acestui tip de aranjament de caractere
===
Din percepția mea de până acum, înclin să cred că psihologia a
funcționat ...

> Și începând de anul ăsta distribuțiile Linux, BSD, OpenSolaris etc.
> ce folosesc xkeyboard-config (deci cam toate) vor avea ca aranjament
> implicit pentru limba română un set ce va genera diacritice corecte.

Aici am o obiecție legată de denumiri, dar o să revin cu un subiect
separat. Așa pe scurt îmi pare ceva haotic, confuz, nesugestiv.

> Sunt conștient că încă e devreme pentru așa ceva, instalările XP
> domină și cele mai multe nu afișează diacriticele commabelow, dar e
> important să tragem și noi de balanță înspre diacriticele corecte. De
> când i-ai convins și pe cei de la Microsoft România, e indubitabil că
> vom ajunge mai devreme sau mai târziu la ele, sper să se simtă în
> privința asta și impactul utilizatorilor Linux ce scriu românește cu
> diacritice.

Aici a existat și un aspect psihologic în care eu am căzut în plasă. La
vremea aia (cu tastatura) am fost indus să cred că Linuxul este deja ok
dpdv al ș și ț corecte și că iată, doar Microsoft trage totul îndărăt.
Ulterior mi s-a dovedit că practica era cam diferită de teorie, dar a
funcționat involuntar în direcția bună (i.e. considerată de noi
„bună” :)
Unul dintre cei care au favorizat crearea acelei impresii false (dar
constructive) a fost Mugurel Ciobîcă :) (dar au existat și alți
factorui, diverse discuții pe lista tic-lobby și rtfs, rtfs-ul fiind un
fel de diacritice de azi)

Mișu Moldovan

unread,
Apr 11, 2008, 3:46:27 PM4/11/08
to diacr...@googlegroups.com
Cristian Secară <or...@secarica.ro> a scris:
> On Fri, 11 Apr 2008 21:29:05 +0300, Mișu Moldovan wrote:
>
> Introducerea aranjamentului à la Linux l-am băgat pe gât mai mult pe
> considerente psihologice decât că eram sau sunt convins de grozăvia lui
> pe sistemele utilizatorilor banali (= care nu au nevoie de lina de
> comandă). Am mizat pe acest aranjament pentru a favoriza acceptarea
> ideii de tastatură românească în general.
> Mai precis am mizat pe asta (extras de undeva din pagina de la
> http://www.secarica.ro/arhive/sr_13392/html/ro_kbd_std_-_etapa_1.html ):
[snip]

> Din percepția mea de până acum, înclin să cred că psihologia a
> funcționat ...

Da, de acord, dar motorul din spatele acestui aranjament au fost
utilizatorii săi din Linux/BSD/etc. pe care sper că i-am reprezentat
într-o anumită măsură la două dintre acele întruniri.


> > Sunt conștient că încă e devreme pentru așa ceva, instalările XP
> > domină și cele mai multe nu afișează diacriticele commabelow, dar e
> > important să tragem și noi de balanță înspre diacriticele corecte. De
> > când i-ai convins și pe cei de la Microsoft România, e indubitabil că
> > vom ajunge mai devreme sau mai târziu la ele, sper să se simtă în
> > privința asta și impactul utilizatorilor Linux ce scriu românește cu
> > diacritice.
>
> Aici a existat și un aspect psihologic în care eu am căzut în plasă. La
> vremea aia (cu tastatura) am fost indus să cred că Linuxul este deja ok
> dpdv al ș și ț corecte și că iată, doar Microsoft trage totul îndărăt.

Mai bine spus „Linux putea fi OK”, pentru că Linux poate însemna multe.
Dar da, la momentul respectiv exista tot ce era necesar pentru o
instalare în care să se genereze și să se afișeze diacriticele cu
virgulă dedesubt, fie ele din ISO-8859-16 sau UTF-8. Între timp multe
chestii ce trebuiau instalate sau setate manual au ajuns să fie
instalate sau setate implicit la instalare, în special dacă se alege
limba română în procedura de instalare a sistemului de operare.


> Ulterior mi s-a dovedit că practica era cam diferită de teorie, dar a
> funcționat involuntar în direcția bună (i.e. considerată de noi
> „bună” :)
> Unul dintre cei care au favorizat crearea acelei impresii false (dar
> constructive) a fost Mugurel Ciobîcă :) (dar au existat și alți
> factorui, diverse discuții pe lista tic-lobby și rtfs, rtfs-ul fiind un
> fel de diacritice de azi)

Da, păcat că a murit RTFS-ul, dar era previzibil că nu va ține mult, a
fost o inițiativă a unui om care nu era prea implicat în localizare,
Florin Andrei, pe care l-am scos din minți pe listele RLUG cu refuzul
de a abandona folosirea diacriticelor în mailuri. A fost o flamă lungă
pe lista rlug-offtopic despre diacritice în mailuri și într-un final
Florin Andrei și-a sumes mânecile și a pornit proiectul RTFS. E posibil
să fi avut el ceva gânduri din astea și înainte, dar cert e că aia a
fost picătura ce a umplut paharul. Din păcate a fost o inițiativă
destul de goală, adică multă vorbărie, puține chestii concrete...

--
mișu

Reply all
Reply to author
Forward
0 new messages