Administratorii sunt prost informaţi. O coloană într-un tabel mysql cu
colaţia utf8_general_ci populată cu diacritice generează aceleaşi
rezultate şi dacă se caută cu diacritice şi dacă se caută fără. O să
revin cu un mic script care rezolvă baza de date, o să-l prezint şi
adminstratorului de acolo pentru a-l aplica dacă doreşte.
Mai sunt unii programatori care codează diacriticele în entităţi, una
dintre cele mai dese dovezi de lene sau prostie, astfel că se trimite
la mysql o prostie de gen „barcó".
--
Alexandru Szasz
> Ar trebui un program cam cum are Google, care reuşeşte să ofere
> rezultate bune indiferent dacă cuvîntul introdus este cu sau fără
> diacritice.
dexonline.ro merge bine indiferent de diacritice și indiferent de
virgulă sau sedilă.
Cristi
--
Cristian Secară
http://www.secarica.ro/
> Mai sunt unii programatori care codează diacriticele în entităţi, una
> dintre cele mai dese dovezi de lene sau prostie, astfel că se trimite
> la mysql o prostie de gen „barcó".
De obicei asta se întâmplă dacă pagina care conține formularul în care
se introduce textul are codarea declarată pe 8 biți în loc de Unicode.
Caracterele care nu cad în respectiva codare sunt reprezentate ca
entități din alea (browserul face asta la momentul trimiterii).
Am scris un articol pe diacritice.ro despre subiectul ăsta:
http://www.diacritice.ro/node/32
Sper să fie cuiva de folos.
O să încerc să atac într-o zi şi problema căutării într-un alt articol.
--
Alexandru Szasz
> > Ar trebui un program cam cum are Google, care reuşeşte să ofere
> > rezultate bune indiferent dacă cuvîntul introdus este cu sau fără
> > diacritice.
> dexonline.ro merge bine indiferent de diacritice și indiferent de
> virgulă sau sedilă.
De fapt dexonline.ro e singurul pe care îl știu să meargă corect.
Google NU merge corect, pentru că nu știe să facă echivalarea între ș
și ț cu virgule și nimic altceva și nu știu cui ar trebui să reclam
asta.
Am făcut mai demult o pagină de test pentru asta care (încă) îmi
dovedește acest lucru
http://www.secarica.ro/html/test_motor_de_cautare.html
Nu e o ştiinţă, e ceva la îndemână. Dacă faci o baza de date cu setul
de caractere UTF-8 primeşti în schimb funcţionalitatea asta legată de
căutarea cu diacritice.
--
Alexandru Szasz
Mulţumesc, am corectat.
2008/4/10 Mihai Croitoru <miha...@gmail.com>:
>
> On 10 Apr, 03:00, Lucian Constantin <struct_bylight...@yahoo.com>
> wrote:
>
> > O rezolvi pentru prenume cu o listă de referinţă, pentru numele de
> > famile nici vorbă, mai ales când ai o întreagă carte de telefon. Doar
> > aşa, dacă iei fiecare nume şi-l verifici manual.
>
> Probabil că nu merge cu adăugarea automată de diacritice la numele de
> familie. Sînt şi nume de familie de genul "Creanga" şi "Creangă" sau
> "Stanca" şi "Stâncă", unde ambele variante sînt posibile, deci nu pot
> fi adăugate automat diacritice în baza de date.
Totuşi nu există numele Margaritescu, există un procent pe care-l poţi rezolva.
>
> Soluţia pare a fi cea adoptată de Dexonline.ro, omul să poată căuta cu/
> fără diacritice şi rezultatele afişate să fie aceleaşi.
>
Trebuie doar ca programatorii de ocazie români să înţeleagă că limba
română nu încape în ISO-8859-1, nici în ISO-8859-2, de fapt orice
pagină în ISO e o mare tâmpenie pentru că nu poţi afişa decât limbile
din acel ISO la un moment dat pe când cu UTF-8 ai posibilitatea să
afişezi mai multe limbi în acelaşi timp.
Faptul că nu se poate căuta cu diacritice ţine de proasta pregătire a
programatorilor care fac saiturile alea. Chiar nu e o ştiinţă, nu
trebuie decât să lucrezi cu setul de caractere UTF-8, nicio bucată de
cod în plus ca să lucrezi cu diacritice.
Eu la Narro mai am o bucăţică de cod într-un plugin care la salvare în
baza de date converteşte sedilele la virgule pentru a fi eu mulţumit
când mă uit în baza de date şi pentru a avea consistenţă. La afişare
tot printr-un plugin permit utilizatorului să aleagă dacă vrea să vadă
cu sedile sau cu virgule. Asta s-ar putea face automat în felul ăsta:
virgule pentru orice diferit de Windows XP, sedile pentru Windows XP.
Dar asta e ceva mai complex, măcar de ar fi sedile decât nimic.
--
Alexandru Szasz
> E destul de neplăcută situaţia, cine are Vista e în pom dacă
> foloseşte căutări cu diacritice pe Google.
E și mai complicat. IE 7 are ca motor de căutare implicit pe
www.live.com. Se poate schimba, dar e cam alambicat.
Iar live.com suferă de aceeași problemă, în plus din ce testasem eu
mai demult nu recunoaște ghilimelele românești dacă vreau să caut
expresii complete.
> Faptul că nu se poate căuta cu diacritice ţine de proasta pregătire a
> programatorilor care fac saiturile alea. Chiar nu e o ştiinţă, nu
> trebuie decât să lucrezi cu setul de caractere UTF-8, nicio bucată de
> cod în plus ca să lucrezi cu diacritice.
Hm. Probabil că mai e ceva la nivel de bază de date (ceva de declarat pe
acolo), pentru că, de exemplu, forumul meu phpBB l-am trecut la utf-8
acum mai mulți ani folosind o metodă cam empirică ce-i drept. Ca forum
merge perfect, în schimb căutarea nu. Adică nu în sensul discuției de
aici.
Sunt două litere diferite, nu putem cere Google să facă o asemenea
imensă excepție.
Soluția e să dispară toată metodele de a scrie cu diacritice cu sedile
pe sistemele de operare care pot vedea virgulele. Adică să nu se poată
scrie cu sedile decât în Windows XP. Apoi lobby la toate saiturile
să-și convertească articolele. Acum nu putem cere asta fiindcă
procentul de utilizatori XP e încă mare.
--
Alexandru Szasz
Configurarea bazei de date înseamnă și configurarea serverului. Ori
pui serverul să lucreze cu nume utf8 ori apelezi după fiecare apel
mysql_select_db interogarea mysql_query('SET NAMES UTF8'). Asta-ți
lipsea ție cu phpBB.
Dacă vrei, trimite-mi baza de date exportată într-un fișier sql, o
analizez, îți trimit baza de date convertită corect la utf8 și scriu
și un articol pe tema asta pentru ceilalți.
Nu mai folosesc phpBB de mult, n-am eu un forum pe care să încerc.
--
Alexandru Szasz
Apropo, au fost o serie de nemulțumiri din cauza faptului că Google
afișa aceleași rezultate și la căutarea cu diacritice și la căutarea
fără (așa cum am vrea noi) și a modificat lucrurile astfel încât să nu
se mai facă normalizarea diacriticelor, de aceea pentru fiecare
diacritică ai alte rezultate. Așa mi se pare și normal. Să sufere cine
nu știe să scrie, nu cine știe.
--
Alexandru Szasz
google.com dă rezultate mult mai bune decât google.ro!
Într-adevăr, tocmai am repetat testul lui Secărică, şi am avut
următoarele rezultate:
1. cu google.com:
text plain, search plain: OK
text plain, search cedilla: OK
text plain, search comma: OK
text cedilla, search plain: OK
text cedilla, search cedilla: OK
text cedilla, search comma: Nu merge
text comma, search plain: Nu merge
text comma, search cedilla: Nu merge
text comma, search comma: OK
Observăm că diacriticele cu virgulă nu se potrivesc cu celelalte
diacritice, mai puţin când apar în şirul de căutare - şi atunci se
potrivesc doar cu textul fără diacritice. În rest, motorul
funcţionează perfect cu sedile.
2. cu google.ro:
text plain, search plain: OK
text plain, search cedilla: Nu merge
text plain, search comma: Nu merge
text cedilla, search plain: OK
text cedilla, search cedilla: OK
text cedilla, search comma: Nu merge
text comma, search plain: Nu merge
text comma, search cedilla: Nu merge
text comma, search comma: OK
Faţă de google.com, se observă o asimetrie aparent minoră, dar
încărcată de semnificaţie: oricând se introduc diacritice (fie cu
virgule, fie cu sedile) în câmpul de căutare, paginile găsite vor fi
în număr restrâns.
Acum, să încerc şi testul vostru cu Bucureştiul:
bucuresti - 34,300,000
bucureşti - 34,300,000
bucurești - 34,300,000
bucuresti - 33,700,000
bucureşti - 4,060,000
bucurești - 47,600
Ca o notă subiectivă, deseori am nevoie să folosesc termeni de căutare
în limba engleză; atunci, rezultatele de proastă calitate de pe
google.ro mă încurcă enorm de mult, aşa că la orice calculator mă
aşez, comut pe Google în engleză. În plus, chiar şi pentru căutările
în limba română, google.com e mai bun (după cum am arătat şi mai sus)
- aparent e mai bun chiar şi pentru căutările în care nu se folosesc
diacritice! (cu 1 milion de rezultate mai mult pentru bucuresti pe
google.com)
Nu spun că google.ro e o idee proastă, dar, per ansamblu, nu ar trebui
să fie deschis implicit pentru România cât timp merge atât de prost.
Dacă preferaţi eficienţa, (cu părere de rău) trebuie să vă recomand să
nu mai folosiţi google.ro. Folosiţi linkul 'Google.com in English' din
josul paginii.
--
Silviu Julean
Aş zice mai degrabă că a fost făcut de un amator care s-a străduit, îmi
aduc aminte de vremea în care dexonline.ro era servit de calculatorul
propriu ţinut pornit non-stop în sufragerie[1]. Cred că nu avea UPS că
mai pica din când în când, probabil când era curentul luat. :)
--
mişu
1.
http://catalinfrancu.blogspot.com/2006/09/rmi-gazd-sntoas-c-ai-primit-dex-ul-n.html
Si eu imi pun peste tot cautarea implicita in engleza, dar o fac pentru
ca *eu* prefer rezultatele in engleza. Si luind in considerare punctul
asta de vedere, argumentez totusi ca google.ro ar rezultate mai bune
decit.com pntru cautari in limba romana. Exemplu:
http://www.google.ro/search?q=fedora
http://www.google.com/search?q=fedora
Pentru mine, care NU sint interesat de primul set de rezultate, este
contraproductiv, dar pentru un tuilizator obisnuit vorbitor de limba
romana, este in mod evident o solutie mai buna: jumatate dintre
rezultatele din prima pagina sint scrise in limba romana.
> Nu spun că google.ro e o idee proastă, dar, per ansamblu, nu ar trebui
> să fie deschis implicit pentru România cât timp merge atât de prost.
> Dacă preferaţi eficienţa, (cu părere de rău) trebuie să vă recomand să
> nu mai folosiţi google.ro. Folosiţi linkul 'Google.com in English' din
> josul paginii.
Asta pentru o definite anume a eficienteti. Pentru mine sau pentru tine,
poate, dar cunosc suficient de multi oameni care prefera invers.
--
nicu :: http://nicubunu.ro :: http://nicubunu.blogspot.com
> Sunt două litere diferite, nu putem cere Google să facă o asemenea
> imensă excepție.
S și Ş (sau T și Ţ) sunt și mai diferite și totuși s-au muncit să facă
asta. Este valabil și în cazul altor caractere în alte limbi.
Iar Ţ de fapt nu există în nicio limbă în zilele noastre.
Cei de la Google şi Yahoo au implementat şi combining diacritical
marks, pe când cei de la Live (Microsoft) nu. De exemplu expresiile
astea
șurubelnița deșurubează
şurubelniţa deşurubează
live.com nu le găseşte de niciun fel.
Ai dreptate, eu mă gândeam la caractere.
>
> Deci Google, Yahoo și MS ar trebui ca la căutarea în pagini scrise în
> română a unui cuvînt ce conține Ş sau Ș (de ex. ȘI) să ofere exact
> aceleași rezultate, adică paginile care conțin cuvîntul respectiv în
> ambele moduri de scriere (ȘI sau ŞI). Evident că nu trebuie să
> prezinte şi paginile ce conţin cuvîntul SI, care e cu totul altceva
> (nota muzicală). Nu cred că Google ar avea mari probleme să asimileze
> Ş cu Ș (Ţ cu Ț) și invers.
Așa era înainte Google, așa e implicit la o bază de date, și au fost
multe plângeri, Google fiind nevoit să schimbe abordarea.
>
> E mai uşor şi mai eficient ca Google, Yahoo şi MS să ia o astfel de
> măsură, decît ca cele cîteva milioane de utilizatori români să-şi
> schimbe modul de a scrie. Iar dacă ar face-o, Google oricum le-ar
> oferi rezultate slabe. Adică ei ar scrie corect cu Ș cu virgulă şi
> Google nu le-ar da şi rezultatele scrise cu Ş cu sedilă, care sînt
> majoritare acum.
>
Sunt mai multe milioane de oameni care sunt împotriva normalizării
decât cei care sunt pentru.
--
Alexandru Szasz
> Apropo, au fost o serie de nemulțumiri din cauza faptului că Google
> afișa aceleași rezultate și la căutarea cu diacritice și la căutarea
> fără (așa cum am vrea noi) și a modificat lucrurile astfel încât să nu
> se mai facă normalizarea diacriticelor, de aceea pentru fiecare
> diacritică ai alte rezultate. Așa mi se pare și normal. Să sufere cine
> nu știe să scrie, nu cine știe.
Păi asta are un singur rezultat concret, anume că saiturile vor renunța
treptat-treptat la diacritice. Nu mă gândesc la ziare, ci la saituri
comerciale, care vând produse sau servicii (agenții de turism,
rezervări la vile, restaurante, etc.). Este logic să vrei să fii găsit,
iar a fi găsit în condiții discriminatorii înseamnă să fi nevoit să te
dai de partea majorității.
> Dacă vrei, trimite-mi baza de date exportată într-un fișier sql, o
> analizez, îți trimit baza de date convertită corect la utf8 și scriu
> și un articol pe tema asta pentru ceilalți.
Fișierul salvat din interfața phpBB e bun pentru asta ? Că altfel nu
știu ce ar trebui să fac (deși pot să intru cu phpadmin sau ceva de
genul ăsta, îmi prind urechile acolo).
> Sunt mai multe milioane de oameni care sunt împotriva normalizării
> decât cei care sunt pentru.
În condițiile astea ar trebui să trateze pe picior de egalitate Ș cu Ş
și Ț cu Ţ, păstrând aceeași regulă de azi între oricare dintre
varianta diacriticată și S și T.
> Dacă vrei, trimite-mi baza de date exportată într-un fișier sql, o
> analizez, îți trimit baza de date convertită corect la utf8 și scriu
> și un articol pe tema asta pentru ceilalți.
Fișierul salvat din interfața phpBB e bun pentru asta ? Că altfel nu
știu ce ar trebui să fac (deși pot să intru cu phpadmin sau ceva de
genul ăsta, îmi prind urechile acolo).
Cristi
Da, parcă are ceva el de backup, trimite-mi aia.
Te-ai gândit și să-l actualizezi la versiunea 3? Conform
http://www.phpbb.com/about/features/ versiunea 3 „suportă" UTF8.
Tu probabil l-ai mânărit prin temă să nu mai pună iso-8859-2, dar după
ce eu mă ocup de baza de date, tot mai trebuie să faci o modificare
prin cod; dacă rămâi la versiunea care o ai o să-ți trimit fișierul
modificat.
--
Alexandru Szasz
> Te-ai gândit și să-l actualizezi la versiunea 3? Conform
> http://www.phpbb.com/about/features/ versiunea 3 „suportă" UTF8.
Știu, dar îmi trebuie timp și acum nu am de așa ceva. Dar o să vină și
ziua aia la un moment dat. Până acum actualizările versiunii 2 erau un
chin pentru mine, că trebuia să completez cu mâna modificările la
fișierele .php în limba română direct în utf-8, pentru că nimeni
altcineva nu le mai avea. De fapt nimic complicat pentru cineva care
toată ziua scrie cod, dar nu sunt eu acela ...
> Tu probabil l-ai mânărit prin temă să nu mai pună iso-8859-2, dar după
> ce eu mă ocup de baza de date, tot mai trebuie să faci o modificare
> prin cod; dacă rămâi la versiunea care o ai o să-ți trimit fișierul
> modificat.
Baza de date este deja utf-8 la nivel de caractere, că așa i-am făcut
eu conversia (și s-a propagat ok după aia cu noile mesaje).
O să ți-o trimit să vezi ce și cum.
Nu mai ţin minte să fi zis asta domnu' Paliga, dar dacă ziceţi
d-voastră, aşa o fi, nu cred că se îndoieşte nimeni aici de judecata şi
de imparţialitatea d-voastră.
Dar ţin să vă contrazic la partea cu „zicea superior”, nu m-am simţit
„superior” şi nu cred că m-am exprimat „superior” în acele întâlniri.
Ba chiar dimpotrivă, fiind şi cel mai tânăr pe acolo şi nefăcând parte
din vreo instituţie relevantă, am stat mai mult la cutie, vorbind în
special despre cum stau lucrurile în Linux şi X.
--
mişu
Așa aș putea să zic și io că aștept să vă duceți la bun sfârșit
amenințările repetate de a părăsi această listă, nu? V-am răspuns nu o
dată, ci de mai multe ori la problemele personale pe care le aveți
legate de mine, de ajunsesem să mă citez singur. Iar domnia voastră
răspundea tăind respectivul citat. (Pentru cine a intrat mai târziu la
spectacolul ăsta, nu, nu era vorba de diacritice commabelow).
Acuma nu știu de a fost cu intenție sau nu, personal cred că nu vedeți
decât ceea ce vreți să vedeți, după cum reiese și din lunga discuție pe
tema „tu versus dumneavoastră” unde nu ați reușit să pricepeți nici
măcar în final de ce sondajul de pe macuser.ro era fundamental greșit
și irelevant, deși trei persoane diferite v-au argumentat același lucru.
Mă rog, asta e... Revin cu ceea ce e realmente important și anume cu
rugămintea să lăsați lista asta în pace, este pentru a discuta probleme
de localizare. De așteptați lămuriri personale de la mine, vă repet, nu
mai am ce să mai adaug. De vreți să mă atacați, atacați-mă direct pe
adresa mea personală.
--
mișu
> > - haosul introdus de MS acum mulți ani și cu încăpățînare dus pînă
> > la exasperare, cu acele s/t sedilă, în loc de s/t comma below
Haosul a fost generat mai degrabă de incompetența româniei pe asemenea
probleme. Standardul ISO-8859-2 (Latin 2) datează din 1987, iar atunci
limba română era asociată explicit acelui standard. Cine-i de vină că
s-a vociferat abia prin 1998 pe tema asta când s-a produs standardul
SR 13411, adică cel care a stat la baza ISO 8859-16 (Latin 10) ?
Un scurt istoric, fără pretenții de a fi exhaustiv:
http://www.secarica.ro/html/s-uri_si_t-uri.html#istoric
Chiar și acum, noroc cu Uniuniea Europeană: actualizarea aceea de patru
fonturi pentru Windows XP se datorează unei cereri venite din partea
UE, nu din partea Academiei Române.
> > (era perioada cînd, la reuniunile ASRO, cineva zicea superior „s/t
> > cu sedilă e, de facto, standardul românesc, pierdem vremea cu
> > virgula asta, n-o va adopta nimeni” – acel cineva era, între alții,
> > Mișu Moldovan, mai ții minte, amice?)
> Nu mai ţin minte să fi zis asta domnu' Paliga, dar dacă ziceţi
> d-voastră, aşa o fi, nu cred că se îndoieşte nimeni aici de judecata
> şi de imparţialitatea d-voastră.
Hm. Există un „ceva” care bănuiesc că l-a determinat să vorbească așa.
În niciun caz „superior”, însă din ce țin eu minte pe vremea aia erai
deznădăjduit și înclinat spre o resemnare tristă. Posibil ca asta să fi
generat impresii nedorite :)
Nu sînt de acord. Ș este o literă românească, pe cînd Ş este o literă
turcească. Întîmplarea face să se citească la fel, dar nu este acceași
literă.
București este capitala României. Bucureşti este scrierea capitalei
României cu alfabet turcesc, incorect pentru limba română.
Mai grav este pentru Ț și Ţ, căci Ţ nu este o literă. Adică nu face
parte din nici un alfabet din nici o țară. E ca și cum ai pune cedila
sub altă literă, R de exemplu. rezultatul nu este bun de nimic.
Mugurel
Când s-a trecut de la î din â în mijloc și sunt nu ni s-a dat o
perioadă de acomodare, țin minte că televiziunile cele mai populare
imediat au luat acea regulă și au aplicat-o.
Nu e loc de compromis nici în privința lui ș. Un pericol care ne paște
este motorul de căutare pe care tot crește numărul de rezultate cu s
cu sedilă, și altul mai important este unul de natură educațională.
Dacă copiii văd peste tot s cu sedilă, nu m-aș mira să văd în curând
scris de mână cu sedilă în loc de virgulă, cu tilda pe a, etc. Scris
de mână fără diacritice am văzut deja.
>
> Muţi din cei/cele care au situri sau bloguri sînt foarte reticenţi
> cînd vine vorba să-şi piardă din vizitatori de pe urma introducerii
> diacriticelor. În marea lor majoritatea ar abandona introducerea
> diacriticelor decît să le scadă vizitatorii. A se lua în calcul şi
> introducerea minicalculatoarelor portabile (de tipul eeePC de la Asus)
> care sînt bazate pe Linux, iar utilizatorii obişnuiţi habar nu au cum
> să activeze suportul pentru diacritice. Un exemplu e mai jos unde am
> postat şi eu cîteva comentarii:
>
> http://femeiasimpla.com/2008/04/03/a-din-a-sau-i-din-i/
>
Habar nu au pentru că eeePC nu are suport pentru română ca să alegi
pur şi simplu dintr-o fereastră. Şi asta probabil pentru că niciun
român nu s-a ocupat de Xandros, distribuţia care o folosesc.
--
Alexandru Szasz
Citez din nou: „Sondajul e greșit, în ambele moduri de adresare
dezbătute se folosește adresarea la persoana a II-a singular când se
dau comenzi calculatorului.”
Ca să explic mai pe îndelete, deşi sper că nu e nevoie, nu există
diferenţe între abordarea propusă pe macuser.ro şi cea utilizată în
traducerile politicoase când se dau comenzi calculatorului. În ambele
cazuri varianta agreată este „Eşti prost, pleacă”, adică modul
imperativ, persoana a II-a singular.
--
mişu
Sunt foarte interesat de chestia asta. În ce împrejurări s-a întâmplat?
> Habar nu au pentru că eeePC nu are suport pentru română ca să alegi
> pur şi simplu dintr-o fereastră. Şi asta probabil pentru că niciun
> român nu s-a ocupat de Xandros, distribuţia care o folosesc.
Sunt împotriva ideii ca de fiecare distribuţie să se ocupe un român ca
să fie OK pentru români. Nu ştiu cum e cu eeePC, dar dacă foloseşte
Linux cu glibc ar trebui să fie OK. Or fi tăiat ei din pachete ca să
ocupe mai puţin instalarea? Adică de exemplu pachetul KDE cu
traducerile româneşti? Sau au mânărit centrul de control KDE şi nu mai
include opţiunile de schimbare a aranjamentului de tastatură? Ştie
cineva?
--
mişu
Am mai spus anterior, nu trebuie nimic special, dacă coloana e cu utf8
case insensitive (ci) atunci se face normalizare, adică dacă se caută
cu LIKE după un cuvânt cu s, s cu sedilă, cu virgulă sau cu alte
chestii sunt întoarse toate rezultatele care conțin s, s cu sedilă sau
alte chestii.
2008/4/11 Mişu Moldovan <nizn...@gmail.com>:
> "Alexandru Szasz" <ale...@gmail.com> a scris:
>
> >
> > Dacă copiii văd peste tot s cu sedilă, nu m-aș mira să văd în curând
> > scris de mână cu sedilă în loc de virgulă, cu tilda pe a, etc. Scris
> > de mână fără diacritice am văzut deja.
>
> Sunt foarte interesat de chestia asta. În ce împrejurări s-a întâmplat?
Am văzut o lucrare scrisă de un elev de liceu. Am mai văzut și
formulare completate la diferite cozi. Grafitti pe pereți iarăși.
> "Alexandru Szasz" <ale...@gmail.com> a scris:
> > Habar nu au pentru că eeePC nu are suport pentru română ca să alegi
> > pur şi simplu dintr-o fereastră. Şi asta probabil pentru că niciun
> > român nu s-a ocupat de Xandros, distribuţia care o folosesc.
>
> Sunt împotriva ideii ca de fiecare distribuţie să se ocupe un român ca
> să fie OK pentru români. Nu ştiu cum e cu eeePC, dar dacă foloseşte
> Linux cu glibc ar trebui să fie OK. Or fi tăiat ei din pachete ca să
> ocupe mai puţin instalarea? Adică de exemplu pachetul KDE cu
> traducerile româneşti? Sau au mânărit centrul de control KDE şi nu mai
> include opţiunile de schimbare a aranjamentului de tastatură? Ştie
> cineva?
E vorba de distribuție, nu de X. De exemplu, fedora are o unealtă care
se cheamă system-config-language, în care poți alege Română. După ce
alegi asta scrie fișierele /etc/i18n, tastatura și ce mai trebuie.
Deci astea sunt specifice distribuției.
Acum la tastatură s-ar putea să fie inclusă aplicația kde/gnome care
poate schimba tastatura, dar cine știe dacă e instalată maparea
românească pentru X, poate au tăiat din pachete să fie mai mică
distribuția.
2008/4/11 Mihai Croitoru <miha...@gmail.com>:
>
>
> Lumea nu percepe Ş-ul ca avînd sedilă şi Ș-ul ca avînd virgulă. Cred
> că 99% din utilizatorii de calculatoare nu ştiu depre diferenţa dintre
> sedilă şi virgulă, dar dacă-i pui să scrie ceva de mînă folosesc
> virgula, nu sedila, pentru că aşa au învăţat la şcoală şi este deja un
> automatism.
Tu vroiai să spui de fapt că mulți oameni nu știu ce înseamnă
diacritice sau sedile. Oricine știe că ș se scrie s și „o linie" sub
care nu se unește cu s. Asta e diferența majoră dintre sedilă și
virgulă.
Eu am încercat un eeePC într-un magazin și când m-am dus acolo la
limbi nu era româna. Oricum pot să pariez că nu sunt nici fonturi care
să scrie cu șț cu virgulă în Xandros.
În altă ordine de idei, Mișu și Sorin, vă rog să vorbiți în privat
despre ce aveți de împărțit, e tare greu de urmărit un subiect dacă
tot trebuie să trec peste texte care nu mă interesează și nu cred că
interesează nici pe altcineva. Iar dacă vreți să-mi răspundeți în
legătură cu asta, schimbați vă rog subiectul. Mulțumesc.
--
Alexandru Szasz
> Chiar dacă se rezolvă problema cu bazele de date şi toate o să fie
> compatibile cu diacriticele corecte, asta nu va rezolva problema
> utilizatorilor, din care peste 80% scriu fără diacritice şi nu se
> gîndesc deloc că ar face ceva greşit, tocmai pentru că se uită în
> jurul lor (real sau virtual) şi văd acelaşi comportament cînd vine
> vorba de scriul la calculator.
Dacă ar avea tastaturi cu taste pictate (din fabrică) cu caractere
românești, ar scrie măcar de curiozitate. Unii poate că ar continua.
Dar Fujitsu-Siemens, de exemplu, distribuie cu calculatoarele lor
tastaturi românești (nestandard încă cred), dar o fac degeaba dacă
omul nu selectează limba română pentru tastatură din sistemul de
operare.
--
Alexandru Szasz
Şi io-s gata să pariez că se pot afişa... Cine taie? Şi pe ce pariem?
Dacă e foarte posibil să nu fi inclus localizări ale interfeţei în prea
multe limbi, mi se pare foarte puţin probabil să fi încercat să elimine
glifele cu diacritice din fonturile DejaVu, ar fi absurd şi nu ar
câştiga mai nimic. S-ar putea să câştigi pariul dacă nu-s fonturile
DejaVu incluse, dar m-aş mira.
--
mişu
Ai văzut pe cineva să scrie de mână cu sedile ? Adică să unească
intenționat „linia" de jos cu litera ?
Eu nu am văzut, de aceea cred că îi interesează pe oameni asta în
sensul că au imprimat pe creier că nu se face asta.
Am văzut i cu inimioare deasupra, dar sedile în scris încă nu.
În documente vizual nu-i deranjează, nu văd imediat diferența, însă eu
spuneam că dacă se perpetuează obiceiul, în timp copii vor începe să
scrie cu sedile și atunci va fi haos.
--
Alexandru Szasz
> Dar Fujitsu-Siemens, de exemplu, distribuie cu calculatoarele lor
> tastaturi românești (nestandard încă cred), dar o fac degeaba dacă
> omul nu selectează limba română pentru tastatură din sistemul de
> operare.
Nu știu nimic despre asta. Au existat câteva tastaturi pe standardul
din 1998 (în principiu) făcute de Siemens, dar nu cred să fi fost
fabricate mai mult de 200 de bucăți. Arată așa
http://www.cimec.ro/joaca/
Eu am una Cherry, tot pe standardul din 1998 (strict). Bună, dar nu
formidabilă. Logitech sau Microsoft sunt net superioare (mecanic, la
pipăire, nu mă refer la altceva).
Altă tâmpenie în ziua de azi este că se insistă pe PS/2 la tastaturi.
Da, din aia am avut și eu la lucru ( http://www.alexxed.com/node/33 ).
Erau vreo 50 în toată firma, deci nu cred că numai 200 au fost
fabricate.
--
Alexandru Szasz
„Deznădăjduit” cred că-i mult spus, dar eram într-adevăr pesimist. Și
sunt în continuare pesimist, pentru că prin natura muncii mele de zi cu
zi văd zeci, sute de utilizatori români și îi urmăresc cum pocesc
limba română și cum reacționează când au probleme de localizare.
Resemnat nu eram, de aia am și acceptat să particip la respectivele
întruniri, deși eram jenat de relativa mea neînsemnătate în privința
elaborării unui nou standard de tastatură românească. Mă bucur că a
intrat în standardul final și aranjamentul pe care îl folosim în X,
înseamnă că n-am făcut doar act de prezență.
Dar departe de mine și atunci, la fel ca și acum, ideile de genul
„pierdem vremea cu virgula asta”. Noi aveam deja în 2003-2004 în X un
aranjament numit „comma” ce genera diacritice cu virgulă dedesubt. Cred
că a fost adăugat în 2000 de Marius Andreiana, dar nu era implicit,
pentru că lumea nu era pregătită pentru așa ceva. Dar asta s-a schimbat
încetul cu încetul, în special datorită eforturilor tale, Cristi. Și
începând de anul ăsta distribuțiile Linux, BSD, OpenSolaris etc. ce
folosesc xkeyboard-config (deci cam toate) vor avea ca aranjament
implicit pentru limba română un set ce va genera diacritice corecte.
Sunt conștient că încă e devreme pentru așa ceva, instalările XP domină
și cele mai multe nu afișează diacriticele commabelow, dar e important
să tragem și noi de balanță înspre diacriticele corecte. De când i-ai
convins și pe cei de la Microsoft România, e indubitabil că vom ajunge
mai devreme sau mai târziu la ele, sper să se simtă în privința asta și
impactul utilizatorilor Linux ce scriu românește cu diacritice.
--
mișu
> Resemnat nu eram, de aia am și acceptat să particip la respectivele
> întruniri, deși eram jenat de relativa mea neînsemnătate în privința
> elaborării unui nou standard de tastatură românească. Mă bucur că a
> intrat în standardul final și aranjamentul pe care îl folosim în X,
> înseamnă că n-am făcut doar act de prezență.
Hm. Există un aspect să zicem mai obscur despre cum a ajuns să fie
prezent în standard aranjamentul doi (cel care pe primul nivel e nativ
EN-US).
Introducerea aranjamentului à la Linux l-am băgat pe gât mai mult pe
considerente psihologice decât că eram sau sunt convins de grozăvia lui
pe sistemele utilizatorilor banali (= care nu au nevoie de lina de
comandă). Am mizat pe acest aranjament pentru a favoriza acceptarea
ideii de tastatură românească în general.
Mai precis am mizat pe asta (extras de undeva din pagina de la
http://www.secarica.ro/arhive/sr_13392/html/ro_kbd_std_-_etapa_1.html ):
===
[despre aranjamentul 2]
* categoria celor cărora le este teamă să încerce ceva nou şi care –
cred ei – le dă peste cap ceva cu care s-au obişnuit (tastatura US
English) dar care ar dori totuşi să ştie că pot, la nevoie, să facă
ceva în plus; aceştia nu au folosit practic niciodată vreun caracter
românesc; este însă o metodă psihologică foarte eficientă de a-i
obişnui cu prezenţa limbii române pe tastatură
* o categorie (redusă) de utilizatori, în special tineri, care este
total împotriva utilizării unei tastaturi non-US, dar care acceptă un
compromis prin folosirea acestui tip de aranjament de caractere
===
Din percepția mea de până acum, înclin să cred că psihologia a
funcționat ...
> Și începând de anul ăsta distribuțiile Linux, BSD, OpenSolaris etc.
> ce folosesc xkeyboard-config (deci cam toate) vor avea ca aranjament
> implicit pentru limba română un set ce va genera diacritice corecte.
Aici am o obiecție legată de denumiri, dar o să revin cu un subiect
separat. Așa pe scurt îmi pare ceva haotic, confuz, nesugestiv.
> Sunt conștient că încă e devreme pentru așa ceva, instalările XP
> domină și cele mai multe nu afișează diacriticele commabelow, dar e
> important să tragem și noi de balanță înspre diacriticele corecte. De
> când i-ai convins și pe cei de la Microsoft România, e indubitabil că
> vom ajunge mai devreme sau mai târziu la ele, sper să se simtă în
> privința asta și impactul utilizatorilor Linux ce scriu românește cu
> diacritice.
Aici a existat și un aspect psihologic în care eu am căzut în plasă. La
vremea aia (cu tastatura) am fost indus să cred că Linuxul este deja ok
dpdv al ș și ț corecte și că iată, doar Microsoft trage totul îndărăt.
Ulterior mi s-a dovedit că practica era cam diferită de teorie, dar a
funcționat involuntar în direcția bună (i.e. considerată de noi
„bună” :)
Unul dintre cei care au favorizat crearea acelei impresii false (dar
constructive) a fost Mugurel Ciobîcă :) (dar au existat și alți
factorui, diverse discuții pe lista tic-lobby și rtfs, rtfs-ul fiind un
fel de diacritice de azi)
Da, de acord, dar motorul din spatele acestui aranjament au fost
utilizatorii săi din Linux/BSD/etc. pe care sper că i-am reprezentat
într-o anumită măsură la două dintre acele întruniri.
> > Sunt conștient că încă e devreme pentru așa ceva, instalările XP
> > domină și cele mai multe nu afișează diacriticele commabelow, dar e
> > important să tragem și noi de balanță înspre diacriticele corecte. De
> > când i-ai convins și pe cei de la Microsoft România, e indubitabil că
> > vom ajunge mai devreme sau mai târziu la ele, sper să se simtă în
> > privința asta și impactul utilizatorilor Linux ce scriu românește cu
> > diacritice.
>
> Aici a existat și un aspect psihologic în care eu am căzut în plasă. La
> vremea aia (cu tastatura) am fost indus să cred că Linuxul este deja ok
> dpdv al ș și ț corecte și că iată, doar Microsoft trage totul îndărăt.
Mai bine spus „Linux putea fi OK”, pentru că Linux poate însemna multe.
Dar da, la momentul respectiv exista tot ce era necesar pentru o
instalare în care să se genereze și să se afișeze diacriticele cu
virgulă dedesubt, fie ele din ISO-8859-16 sau UTF-8. Între timp multe
chestii ce trebuiau instalate sau setate manual au ajuns să fie
instalate sau setate implicit la instalare, în special dacă se alege
limba română în procedura de instalare a sistemului de operare.
> Ulterior mi s-a dovedit că practica era cam diferită de teorie, dar a
> funcționat involuntar în direcția bună (i.e. considerată de noi
> „bună” :)
> Unul dintre cei care au favorizat crearea acelei impresii false (dar
> constructive) a fost Mugurel Ciobîcă :) (dar au existat și alți
> factorui, diverse discuții pe lista tic-lobby și rtfs, rtfs-ul fiind un
> fel de diacritice de azi)
Da, păcat că a murit RTFS-ul, dar era previzibil că nu va ține mult, a
fost o inițiativă a unui om care nu era prea implicat în localizare,
Florin Andrei, pe care l-am scos din minți pe listele RLUG cu refuzul
de a abandona folosirea diacriticelor în mailuri. A fost o flamă lungă
pe lista rlug-offtopic despre diacritice în mailuri și într-un final
Florin Andrei și-a sumes mânecile și a pornit proiectul RTFS. E posibil
să fi avut el ceva gânduri din astea și înainte, dar cert e că aia a
fost picătura ce a umplut paharul. Din păcate a fost o inițiativă
destul de goală, adică multă vorbărie, puține chestii concrete...
--
mișu