Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

mysql croatian utf8 collation

17 views
Skip to first unread message

voksic

unread,
Nov 27, 2009, 1:51:07 PM11/27/09
to
Nakon razgovora s Montyem i von Fickom na nedavnom UDS-u, dogovorili
smo suradnju kako bi se ispravio vjecni bug u MariaDB koji je
onemogucavao sortiranje po pravilima hrvatskog jezika. To je danas/
jucer i ucinjeno.

Ova novost biti ce dio MySQL-a 5.6, (vrlo vjerojatno) MariaDB 5.1, a
postoji i patch za MySQL 5.1. Vise o problematici:

http://www.collation-charts.org/articles/croatian.htm

Pozdrav

Eden Kirin

unread,
Nov 27, 2009, 3:31:02 PM11/27/09
to
voksic wrote:
> Nakon razgovora s Montyem i von Fickom na nedavnom UDS-u, dogovorili
> smo suradnju kako bi se ispravio vjecni bug u MariaDB koji je
> onemogucavao sortiranje po pravilima hrvatskog jezika. To je danas/
> jucer i ucinjeno.

Aleluja! Svaka vam dala.

--
www.vikendi.net -/- www.supergrupa.com

Josip Makar

unread,
Nov 28, 2009, 6:07:09 AM11/28/09
to
"voksic" <vok...@gmail.com> wrote in message
news:39a7d2db-86e7-4fb2...@v25g2000yqk.googlegroups.com...

Vrlo pohvalno.
U gore navedebom �lanku se navodi:
The "real" Croatian sorting rules consider digraphs Dďż˝, Lj, Nj as single
letters. That means:

* Dďż˝ comes between Dz and ďż˝
* Lj comes between Lz and M
* Nj comes between Nz and O

Mo�da su samo tipfeleri u �lanku, ali trebalo bi:
* Lj comes between Lďż˝ and M
* Nj comes between Nďż˝ and O


Vedran Krivokuca [Volim Diplomaciju]

unread,
Nov 28, 2009, 6:35:24 AM11/28/09
to
Dana Sat, 28 Nov 2009 12:07:09 +0100, Josip Makar napisa:

> The "real" Croatian sorting rules consider digraphs Dž, Lj, Nj as single
> letters.

Uz to Unicode uredno ima "naše" digrafe definirane.

--
~ Klub obožavatelja Ambasadora Valenta, est 2008.
~ http://www.new.facebook.com/group.php?gid=36698154027

voksic

unread,
Nov 28, 2009, 7:23:40 AM11/28/09
to
On 28 stu, 12:35, "Vedran Krivokuca [Volim Diplomaciju]"
<n...@casastorta.net> wrote:

> Uz to Unicode uredno ima "naše" digrafe definirane.

Da, samo smo mi preblesavi da bi slozili raspored na tipkovnici koji
bi sadrzavao sve nase znakove. Zbog ljenosti moramo ici od softvera do
softvera i traziti nebulozne mogucnosti.

Davorin Vlahovic

unread,
Nov 28, 2009, 8:20:25 AM11/28/09
to

Ubuntu ima takav raspored, zamijeni q i w sa lj i nj, i mislim da je y
zamijenjen sa dž.
--
Reality is why I can never have nice things.

voksic

unread,
Nov 28, 2009, 8:37:45 AM11/28/09
to
On 28 stu, 14:20, Davorin Vlahovic <nr...@ylf.krs.ref.rh> wrote:

> Ubuntu ima takav raspored, zamijeni q i w sa lj i nj, i mislim da je y
> zamijenjen sa dž.

Znam da ima - 'hr unicode'. Nije to Ubuntu specificnost, vjerujem da
to sve (novije) distribucije imaju.

Drazen Kacar

unread,
Nov 28, 2009, 8:46:51 AM11/28/09
to
Davorin Vlahovic wrote:
> [Sat, 28 Nov 2009 04:23:40 -0800 (PST)] voksic je napisao/la:
> > On 28 stu, 12:35, "Vedran Krivokuca [Volim Diplomaciju]"
> ><n...@casastorta.net> wrote:
> >
> >> Uz to Unicode uredno ima "na�e" digrafe definirane.

> >
> > Da, samo smo mi preblesavi da bi slozili raspored na tipkovnici koji
> > bi sadrzavao sve nase znakove. Zbog ljenosti moramo ici od softvera do
> > softvera i traziti nebulozne mogucnosti.
>
> Ubuntu ima takav raspored, zamijeni q i w sa lj i nj, i mislim da je y
> zamijenjen sa dďż˝.

Ma �ekaj. To zahtijeva da tipka�:

a) promijeni svoje tipka�ke navike
b) zna kad ide "dďż˝", a kad "d" i "ďż˝"

Ovo prvo mi se kosi s idejom da kompjuteri trebaju slu�iti ljudima, a ne
ljudi kompjuterima. A drugo je jebeno naporno i zahtjevno. Ako se dobro
sje�am, postoje dva pravila. Prvo ka�e da su dva slova u igri kad se radi
o bilo kojoj vrsti slo�enice, npr. "nad�upan" ima d i � zato �to je "nad"
prefiks.

Drugo pravilo ka�e da za rije�i stranog porijekla idu dva slova ako je
tako u izvornom jeziku. �to valjda zna�i da "milje" ima "l" i "j", a ne
"lj". (Nisam provjeravao, ne da mi se.) Mislim da je stvarno malo previ�e
zahtijevati od svakog tipka�a da ima kompletnu tablicu rije�i stranog
porijekla u glavi.

Normalno bi bilo da se tako ne�to rje�ava input metodom, pa da ljudi
normalno utipkaju "l" i "j", a onda to software ostavi kao dva slova ili
pretvori u jedno "lj". Od programa nije pretjerano zahtijevati da ima
tablicu sa stranim rije�ima. I jo� malo koda za konjugacije, rodove i
sli�na svojstva materinjeg nam jezika.

A mo�da i malo umjetne inteligencije i heuristike da sku�i upotrebljava li
se "milje" u zna�enju ozra�ja ili u zna�enju �ipke. :-)

--
.-. .-. Yes, I am an agent of Satan, but my duties are largely
(_ \ / _) ceremonial.
|
| da...@fly.srk.fer.hr

voksic

unread,
Nov 28, 2009, 9:38:44 AM11/28/09
to
On 28 stu, 14:46, Drazen Kacar <d...@fly.srk.fer.hr> wrote:

> Ma čekaj. To zahtijeva da tipkač:
>
> a) promijeni svoje tipkačke navike

koje su do sad bile krive.

> b) zna kad ide "dž", a kad "d" i "ž"

odnosno, poznaje jezik kojim pise.

Dakle, slazem se da bi takvo sto zahtijevalo prilagodbu, ali postoji
li alternativa? Sam si naveo primjer gdje se nikada i nikako nece moci
sloziti ispravno sortiranje, sve dok cemo koristiti iste znakove na
tipkovnici za razlicite znakove u nasem pismu. Ima tu jos i
'injektiranje' i slicne druge pojave.

> Normalno bi bilo da se tako nešto rješava input metodom, pa da ljudi


> normalno utipkaju "l" i "j", a onda to software ostavi kao dva slova ili
> pretvori u jedno "lj". Od programa nije pretjerano zahtijevati da ima

> tablicu sa stranim riječima. I još malo koda za konjugacije, rodove i
> slična svojstva materinjeg nam jezika.

To nije rjesenje, to je workaround. Rjesenje je da ljudi utipkavaju
pismom kojim se sluze, a ne da izmisljaju rijeci svaki put kada nesto
upisuju. Nisu ljudi krivi, ovakve stvari postoje i u drugim jezicima,
samo su drugi shvatili da bi trebalo koristiti drugacije znakove. Mi
koristimo kombinaciju postojecih. Kada bi umjesto nj imali #, umjesto
lj % i umjesto dž &, znali bi kada ide dž, a kada &. Kada je Gaj
napravio to pismo, ocito nije razmisljao o tome :/

U svakom slucaju, ovo je vrlo kompleksna tematika, a nadam se da ovaj
dodatak za mysql barem malo ublaziti patnje :D

Drazen Kacar

unread,
Nov 28, 2009, 10:46:18 AM11/28/09
to
voksic wrote:
> On 28 stu, 14:46, Drazen Kacar <d...@fly.srk.fer.hr> wrote:
>
> > b) zna kad ide "dďż˝", a kad "d" i "ďż˝"

>
> odnosno, poznaje jezik kojim pise.

Postoji poznavanje jezika na nivou obrazovane osobe i poznavanje jezika na
nivou jezikoslovnog stru�njaka. Za ve�inu stvari u pravopisu i gramatici
mi je sasvim u redu da u�e pod normalno obrazovanje, ali ovdje se ve�inom
radi o stranim rije�ima koje su u�le u korpus hrvatskog jezika. Pa mislim
da se u ovom konkretnom slu�aju radi o poznavanju jezika iz kojih su te
rije�i do�le. Ili ih mora� nau�iti napamet, �to mi izgleda privla�no,
po�eljno i pametno koliko i u�enje napamet svih flagova GNU ls naredbe.

> Dakle, slazem se da bi takvo sto zahtijevalo prilagodbu, ali postoji
> li alternativa?

Postoji, ali ti ju nazivaďż˝ workaroundom.

> > normalno utipkaju "l" i "j", a onda to software ostavi kao dva slova ili
> > pretvori u jedno "lj". Od programa nije pretjerano zahtijevati da ima

> > tablicu sa stranim rije�ima. I jo� malo koda za konjugacije, rodove i
> > sli�na svojstva materinjeg nam jezika.


>
> To nije rjesenje, to je workaround.

Zbog �ega smatra� da je to workaround?

> Rjesenje je da ljudi utipkavaju pismom kojim se sluze,

Hm, za�to li se onda sve te GUI aplikacije dobro prodaju, kad je zapravo
rje�enje nau�iti koliko treba i onda jednostavno utipkati �to ve� ide?
Programi slu�e tome da olak�aju stvari koje su bile te�ke ili u�ine
mogu�im ono �to bi bez njih bilo nemogu�e (u razumnom vremenu).

> a ne da izmisljaju rijeci svaki put kada nesto
> upisuju. Nisu ljudi krivi, ovakve stvari postoje i u drugim jezicima,
> samo su drugi shvatili da bi trebalo koristiti drugacije znakove. Mi
> koristimo kombinaciju postojecih. Kada bi umjesto nj imali #, umjesto

> lj % i umjesto dďż˝ &, znali bi kada ide dďż˝, a kada &. Kada je Gaj


> napravio to pismo, ocito nije razmisljao o tome :/

Ne bi znali, isto kao �to danas ne znaju razlikovati � i � ili ije i je.

Vedran Krivokuca [Volim Diplomaciju]

unread,
Nov 28, 2009, 2:31:01 PM11/28/09
to
Dana Sat, 28 Nov 2009 13:46:51 +0000, Drazen Kacar napisa:

[...]

> A možda i malo umjetne inteligencije i heuristike da skuži upotrebljava
> li se "milje" u značenju ozračja ili u značenju čipke. :-)

Ditto, dakle sve što si prije ovoga napisao pada u vodu. :-)

Drazen Kacar

unread,
Nov 28, 2009, 2:57:37 PM11/28/09
to
Vedran Krivokuca [Volim Diplomaciju] wrote:
> Dana Sat, 28 Nov 2009 13:46:51 +0000, Drazen Kacar napisa:
>
> > A mo�da i malo umjetne inteligencije i heuristike da sku�i upotrebljava
> > li se "milje" u zna�enju ozra�ja ili u zna�enju �ipke. :-)
>
> Ditto, dakle sve �to si prije ovoga napisao pada u vodu. :-)

Pa kad nema nikoga tko �e voditi on-topi�ne i zanimljive rasprave, pa
moram sam sa sobom. Mo�emo sad pasti u depresiju ili se zalagati za
promjenu pravopisa jer nismo sposobni isprogramirati dovoljno dobru
umjetnu inteligenciju.

Vedran Krivokuca [Volim Diplomaciju]

unread,
Nov 28, 2009, 3:21:07 PM11/28/09
to
Dana Sat, 28 Nov 2009 19:57:37 +0000, Drazen Kacar napisa:

>>> A možda i malo umjetne inteligencije i heuristike da skuži
>>> upotrebljava li se "milje" u značenju ozračja ili u značenju čipke.
>>> :-)
>>
>> Ditto, dakle sve što si prije ovoga napisao pada u vodu. :-)
>
> Pa kad nema nikoga tko će voditi on-topične i zanimljive rasprave, pa
> moram sam sa sobom.

Gogala je uvijek ontopic, čak i kad priča o tome kako su majke sugovornika
kurve koje su rodile idiote.

> Možemo sad pasti u depresiju ili se zalagati za


> promjenu pravopisa jer nismo sposobni isprogramirati dovoljno dobru
> umjetnu inteligenciju.

Kakvu vražju umjetnu inteligenciju i to još za kontekstualni "input
method... Pa cijele osamdesete i veći dio devedesetih je mantra
informatičke industrije bila da je nemoguće napisati "spell checker" za
naš jezik jer je "prekompleksan za takvo što" (ili u drugoj varijanti:
nismo mi glupi Ameri pa da nam je jezik jednostavan poput engleskog). :-)))

Drazen Kacar

unread,
Nov 28, 2009, 3:36:53 PM11/28/09
to
Vedran Krivokuca [Volim Diplomaciju] wrote:
> Dana Sat, 28 Nov 2009 19:57:37 +0000, Drazen Kacar napisa:

> > Pa kad nema nikoga tko �e voditi on-topi�ne i zanimljive rasprave, pa


> > moram sam sa sobom.
>
> Gogala je uvijek ontopic,

Mogu�e, ali s njim je malo te�ko razgovarati kad je on-topic.

> �ak i kad pri�a o tome kako su majke sugovornika

> kurve koje su rodile idiote.

Pa svakome se mo�e zalomiti idiot, nema to veze s prostitucijom.

> Kakvu vra�ju umjetnu inteligenciju i to jo� za kontekstualni "input
> method... Pa cijele osamdesete i ve�i dio devedesetih je mantra
> informati�ke industrije bila da je nemogu�e napisati "spell checker" za

A ti vjeruje� informati�koj industriji? Ja im vjerujem kad ka�u da se
ne�to ne isplati. Bilo kakve druge razloge iz njihovih usta ne uzimam ba�
ozbiljno.

> na� jezik jer je "prekompleksan za takvo �to" (ili u drugoj varijanti:

> nismo mi glupi Ameri pa da nam je jezik jednostavan poput engleskog). :-)))

Akademija se ovih dana prili�no trudi oko tih stvari (ne samo spell
checkera). Jedino �to im software nije friiii. S obzirom da se financira
iz poreza, ja bih vrlo rado jednom priupitao ministra znanosti za�to je
tome tako. Samo ne znam gdje da ulovim tu zvjerku.

Vedran Krivokuca [Volim Diplomaciju]

unread,
Nov 28, 2009, 4:26:51 PM11/28/09
to
Dana Sat, 28 Nov 2009 20:36:53 +0000, Drazen Kacar napisa:

>> Kakvu vražju umjetnu inteligenciju i to još za kontekstualni "input


>> method... Pa cijele osamdesete i veći dio devedesetih je mantra

>> informatičke industrije bila da je nemoguće napisati "spell checker"
>> za
>
> A ti vjeruješ informatičkoj industriji? Ja im vjerujem kad kažu da se
> nešto ne isplati. Bilo kakve druge razloge iz njihovih usta ne uzimam
> baš ozbiljno.

Nije pitanje vjerovanja argumentima, nego to što argumentacija ukazuje na
nesposobnost. :-) Ja stvarno vjerujem da nitko nije imao pojma
desetljećima kako treba izgledati spellchecker, a ne da "samo" nije bilo
budžeta za isti. :-)

>> naš jezik jer je "prekompleksan za takvo što" (ili u drugoj varijanti:


>> nismo mi glupi Ameri pa da nam je jezik jednostavan poput engleskog).
>> :-)))
>

> Akademija se ovih dana prilično trudi oko tih stvari (ne samo spell
> checkera). Jedino što im software nije friiii. S obzirom da se financira
> iz poreza, ja bih vrlo rado jednom priupitao ministra znanosti zašto je


> tome tako. Samo ne znam gdje da ulovim tu zvjerku.

Vidiš, zgodna informacija o kojoj nisam imao pojma. Ako neka mogućnost
iskrsne, javim.

voksic

unread,
Nov 28, 2009, 4:55:49 PM11/28/09
to
On 28 stu, 16:46, Drazen Kacar <d...@fly.srk.fer.hr> wrote:

> Zbog čega smatraš da je to workaround?

Jer ne rijesava sve. Evo, imas rijec 'injekcija' - kada ju pises,
pises ju jednako za dva razlicita pojma i dva razlicita izgovaranja:

injekcija (sa nj) - sprica, igla i sl.
injekcija (sa n i j) - matematicka funkcija

Al pazi sad:

injekcija
injekcija ili i%ekcija

> Ne bi znali, isto kao što danas ne znaju razlikovati č i ć ili ije i je.

Vrlo vjerojatno, ali te probleme ne mozes rijesiti informatickim
postupcima, vec samo edukacijom. Barem bi mogli sortirati rijeci kod
onih koji znaju pravopis :)

Mladen Gogala

unread,
Nov 28, 2009, 5:08:53 PM11/28/09
to
On Sat, 28 Nov 2009 13:55:49 -0800, voksic wrote:

> Vrlo vjerojatno, ali te probleme ne mozes rijesiti informatickim
> postupcima, vec samo edukacijom.

Oh, to se itekako moze rijesiti informatickim postupcima, primjenjujuci
algoritam koji je otkrio izvjesni Monzy:

http://www.youtube.com/watch?v=Fow7iUaKrq4

Kill dash nine.

> Barem bi mogli sortirati rijeci kod
> onih koji znaju pravopis

Sortirati rijeci, kazes? I to kod onih koji znaju pravopis?

--
http://mgogala.freehostia.com

Vedran Furač

unread,
Nov 28, 2009, 10:54:33 PM11/28/09
to
Drazen Kacar wrote:

> Normalno bi bilo da se tako nešto rješava input metodom, pa da ljudi


> normalno utipkaju "l" i "j", a onda to software ostavi kao dva slova ili
> pretvori u jedno "lj". Od programa nije pretjerano zahtijevati da ima

Trivijala. U /usr/share/X11/locale/en_US.UTF-8/Compose dodaš (ako već
nije) multikey entry za l+j itd. koji generiraju digraf LJ itd.

Alternativno, u neki gtk program utipkaš Ctrl+Shift+U 01C7 i dobiješ LJ.

--
http://vedranf.net | a8e7a7783ca0d460fee090cc584adc12

Vedran Krivokuca [Volim Diplomaciju]

unread,
Nov 29, 2009, 6:27:28 AM11/29/09
to
Dana Sun, 29 Nov 2009 04:54:33 +0100, Vedran Furač napisa:

> Trivijala. U /usr/share/X11/locale/en_US.UTF-8/Compose dodaš (ako već
> nije) multikey entry za l+j itd. koji generiraju digraf LJ itd.

Ali nije svaki Lj LJ

Vedran Furač

unread,
Nov 29, 2009, 6:48:39 AM11/29/09
to
Vedran Krivokuca [Volim Diplomaciju] wrote:

> Dana Sun, 29 Nov 2009 04:54:33 +0100, Vedran Furač napisa:
>
>> Trivijala. U /usr/share/X11/locale/en_US.UTF-8/Compose dodaš (ako već
>> nije) multikey entry za l+j itd. koji generiraju digraf LJ itd.
>
> Ali nije svaki Lj LJ

Jasno.

L j => Lj

<multikey> L j => LJ


--
http://vedranf.net | a8e7a7783ca0d460fee090cc584adc12

Vedran Krivokuca [Volim Diplomaciju]

unread,
Nov 29, 2009, 7:07:58 AM11/29/09
to
Dana Sun, 29 Nov 2009 12:48:39 +0100, Vedran Furač napisa:

>>> Trivijala. U /usr/share/X11/locale/en_US.UTF-8/Compose dodaš (ako već
>>> nije) multikey entry za l+j itd. koji generiraju digraf LJ itd.
>>
>> Ali nije svaki Lj LJ
>
> Jasno.
>
> L j => Lj
>
> <multikey> L j => LJ

Ne mislim na tehničku razliku (znam i to bolje od tebe), nego u jezičnom
smislu.

Tomislav

unread,
Nov 29, 2009, 7:11:08 AM11/29/09
to
Vedran Fura? <ved...@vedranf.mine.nu> wrote:

> Jasno.
>
> L j => Lj
>

> <multikey> L j => ?

Panjino jedna. Ne znam kaj bi ti drugo reko.
--
Pozdrav
Tomislav Car
Ma ti si frustrirani seronja s njuza, ima vas za izvoz.... by Oleg
Mastruko, hr.rec.fotografija.digitalna

Vedran Furač

unread,
Nov 29, 2009, 7:36:21 AM11/29/09
to
Vedran Krivokuca [Volim Diplomaciju] wrote:

> Dana Sun, 29 Nov 2009 12:48:39 +0100, Vedran Furač napisa:
>
>>>> Trivijala. U /usr/share/X11/locale/en_US.UTF-8/Compose dodaš (ako već
>>>> nije) multikey entry za l+j itd. koji generiraju digraf LJ itd.
>>> Ali nije svaki Lj LJ
>> Jasno.
>>
>> L j => Lj
>>
>> <multikey> L j => LJ
>
> Ne mislim na tehničku razliku (znam i to bolje od tebe),

Jasno, ti sve znaš bolje od svih drugih.

> nego u jezičnom smislu.

Pa i govorim u jezičnom smislu.


--
http://vedranf.net | a8e7a7783ca0d460fee090cc584adc12

Vedran Furač

unread,
Nov 29, 2009, 7:36:26 AM11/29/09
to
Tomislav wrote:

> Vedran Fura? <ved...@vedranf.mine.nu> wrote:
>
>> Jasno.
>>
>> L j => Lj
>>
>> <multikey> L j => ?
>
> Panjino jedna. Ne znam kaj bi ti drugo reko.

Tomislav Car
frustrirani seronja s njuza

--
http://vedranf.net | a8e7a7783ca0d460fee090cc584adc12

Vedran Krivokuca [Volim Diplomaciju]

unread,
Nov 29, 2009, 7:47:52 AM11/29/09
to
Dana Sun, 29 Nov 2009 13:36:21 +0100, Vedran Furač napisa:

>> nego u jezičnom smislu.
>
> Pa i govorim u jezičnom smislu.

Jasno. :-)

voksic

unread,
Nov 29, 2009, 8:05:16 AM11/29/09
to
Ubuntu paketi koji sadrze utf8 croatian collation:

Hardy: deb http://ppa.launchpad.net/ivoks/mysql-hr/ubuntu hardy main
Jaunty: deb http://ppa.launchpad.net/ivoks/mysql-hr/ubuntu jaunty
main
Karmic: deb http://ppa.launchpad.net/ivoks/mysql-hr/ubuntu karmic
main

Nastojati cu ih redovito odrzavati.

Tomislav

unread,
Nov 29, 2009, 9:10:03 AM11/29/09
to
voksic <vok...@gmail.com> wrote:

> To nije rjesenje, to je workaround.

Taj "workaround" postoji vec jaaaako dugo i zove se ligature. Na Macu je
postojao adresar jos krajem osamdesetih ili pocetkom devedesetih, ne
sjecam se tocno, koji je pomocu ligatura rjesavao taj problem. Da je
radio savrseno, upravo ovaj primjer s injekcijom, nije. Makar, Obzirom
da se radilo o adresaru, radio je savrseno. :-)

Danas taj, kak ti kazes, workaround, koriste sve layout aplikacije.
Ukoliko neka aplikacija nema ugradjen taj workaround, ona je mrtva prije
no sta je uopce izasla na trziste. Sad cu biti zloban, takva aplikacija
moze imat prodju samo medju "pingvinima".

Imas i druge jezike koji se susrecu s tim problemom (finski i jos
neki primjerice), no njihov problem je ipak nesto manji. Kombinacija
grafema fl uvijek daje ligaturu fl, pricam sad o samom jeziku a ne o
njegovom biljezenju, ne desava se da je to nekada kombinacija dva fonema
a nekad samo jedan fonem.

Drazen Kacar

unread,
Nov 29, 2009, 9:42:02 AM11/29/09
to
Tomislav wrote:
> voksic <vok...@gmail.com> wrote:
>
> > To nije rjesenje, to je workaround.
>
> Taj "workaround" postoji vec jaaaako dugo i zove se ligature.

Ligatura je ne�to sli�no, ali ne i sasvim isto. Ligatura je stvar
prezentacije, njome dobijeďż˝ znak sa spojenim slovima na ekranu ili papiru,
ali u samom dokumentu su to jo� uvijek dva ili tri razli�ita znaka.

Ovdje se radi o tome da bi i znak u dokumentu (dakle memoriji) trebao biti
jedan, a ne vi�e njih. Jer taj jedan omogu�uje sortiranje, a ima i neke
veze s pretra�ivanjem. �ak ponekad i s rastavljanjem na slogove. Mo�e to
neka aplikacija zamijeniti s kodnom to�kom na kojoj je ligatura
(vjerojatno �e pri tome morati koristiti Unicode private range), ali time
se isti �as odri�e svih funkcija OS-a koje imaju ikakve veze sa slovima,
pa onda sve to mora implementirati sama. �to je mal�ice naporno, pa bi
bilo lijepo da OS[1] ima pristojnu podr�ku za takve stvari.

> Danas taj, kak ti kazes, workaround, koriste sve layout aplikacije.
> Ukoliko neka aplikacija nema ugradjen taj workaround, ona je mrtva prije
> no sta je uopce izasla na trziste.

Jesi siguran? Za�to po novinama ve� godinama vi�am rastavljanje na slogove
baďż˝ usred l-j i n-j? Uglavnom kad se tako ne bi trebalo rastavljati.

> Sad cu biti zloban, takva aplikacija moze imat prodju samo medju
> "pingvinima".

Pingvini nisu nu�no grafi�ari. Aplikacijama nitko ne brani da koriste
ligature ako su u fontu.

[1] I aplikacije koje izigravaju platformu.

Vedran Furač

unread,
Nov 29, 2009, 9:45:42 AM11/29/09
to
Vedran Krivokuca [Volim Diplomaciju] wrote:

> Dana Sun, 29 Nov 2009 13:36:21 +0100, Vedran Furač napisa:
>
>>> nego u jezičnom smislu.
>> Pa i govorim u jezičnom smislu.
>
> Jasno. :-)

Drago mi je da ti je jasno. Sad objasni Tomislavu.


--
http://vedranf.net | a8e7a7783ca0d460fee090cc584adc12

Tomislav

unread,
Nov 29, 2009, 10:56:34 AM11/29/09
to
Drazen Kacar <da...@fly.srk.fer.hr> wrote:

> Ligatura je ne?to sli?no, ali ne i sasvim isto. Ligatura je stvar
> prezentacije, njome dobije? znak sa spojenim slovima na ekranu ili papiru,
> ali u samom dokumentu su to jo? uvijek dva ili tri razli?ita znaka.

Err, ne bas. Bojim se da ti je poznavanje ligatura poprilicno
povrsno.

Ligatura nije samo stvar prezentacije. Za pocetak, postoje
tipografske (aka grafemske) i fonetske ligature. Da se vratim malo u
povijest i nastanak danasnjih modernih ligatura. Ligature kakve danas
poznajemo poticu sa spanjolskih nadgrobnih spomenika iz 15 stoljeca.
Radi se o fonemu "nj" odnosno dva grafema "n". Obzirom da je mjesto na
nadgrobnom spomeniku mjesto poprilicno skuceno, kombinacija grafema
"nn", odnosno fonem "nj", je preraso u ligaturu "n" (n s tildom).
Jednako tako, ligature ff, "ft, "fi" itd. Ovdje se radi o fonetskoj
ligaturi. S druge strane, "ff" je grafemska ligatura. Kod nas su
ligature "dz", "lj" i "nj" i fonemske i grafemske.

> Ovdje se radi o tome da bi i znak u dokumentu (dakle memoriji) trebao biti

> jedan, a ne vi?e njih.

Moderni racunalni sistemi, odnosno oni koji do toga drze, kao i
aplikacije, ce automatski dva znaka "f" zamijeniti ligaturom "ff". Na
zalost, mi smo saka jada pa niko nema volje kvalitetno implementirati
"nase" ligature, iako one u modernim fontovima postoje. Jos Boze pomozi,
da je kod nas stvar jednostavna kao kod spanjolskog jezika di dva znaka
"nn" uvijek daju n (n s tildom). No kod nas nije uvijek slucaj da skup
grafema "nj" oznava dvoglas "nj" koji se u tom slucaju pise ligaturom,
pa je, kako bi se to i vizuelno naznacilo, "j" malo vise podvuceno pod
"n" (pogledaj neki font koji sadrzi ligaturu nj pa ce ti biti jasno o
cemu pricam).

Kako vec spomenuh u prethodnom postu. Navedeni adresar je uprvo zbog
dobre implementacija ligatura dobro sortirao.

> Mo?e to
> neka aplikacija zamijeniti s kodnom to?kom na kojoj je ligatura
> (vjerojatno ?e pri tome morati koristiti Unicode private range), ali time
> se isti ?as odri?e svih funkcija OS-a koje imaju ikakve veze sa slovima,
> pa onda sve to mora implementirati sama. ?to je mal?ice naporno, pa bi
> bilo lijepo da OS[1] ima pristojnu podr?ku za takve stvari.

Samo cu spomenuti da je u nekim osevima to implementirano od
"stoljeca sedmog". Pa ak se to moglo u jedan OS implementirat prije vise
dvadeset godina, ne vidim razloga zasto danas drugi osevi to nebi mogli.

> Jesi siguran? Za?to po novinama ve? godinama vi?am rastavljanje na slogove
> ba? usred l-j i n-j? Uglavnom kad se tako ne bi trebalo rastavljati.

Pogledaj dva tri pasusa prije ovog. Ima nesto di spominjem saku
jada.

> Pingvini nisu nu?no grafi?ari. Aplikacijama nitko ne brani da koriste


> ligature ako su u fontu.

Da se obrecnem, odnosno malo detaljnije elaboriram prijasnji post,
odnosno dio na koji si ovime odgovorio. Problem jest da je Linux
zajednica mahom IT zajednica. Nije u tome problem, problem je kad se
neko iz IT zajednice, ko je maltene iskljucivo IT-jevac, nadje prozvanim
davati ocjene da je GIMP (uzmi aplikaciju i pripadajucu bransu po volji)
dobar proizvod. Eto ti tipicnih primjera s grupe, Furac i Bananko.

Drazen Kacar

unread,
Nov 29, 2009, 11:45:52 AM11/29/09
to
Tomislav wrote:
> Drazen Kacar <da...@fly.srk.fer.hr> wrote:
>
> > Ligatura je ne?to sli?no, ali ne i sasvim isto. Ligatura je stvar
> > prezentacije, njome dobije? znak sa spojenim slovima na ekranu ili papiru,
> > ali u samom dokumentu su to jo? uvijek dva ili tri razli?ita znaka.
>
> Err, ne bas. Bojim se da ti je poznavanje ligatura poprilicno
> povrsno.

�ini mi se da imamo terminolo�ku zabunu.

Moji (polazni) termini:

Pravopis ka�e da su d�, lj i nj slova. Isto kao �to su a, b i c slova.
Ne ka�e da su to ligature, ne ka�e da su to dva slova, nego ka�e da se
radi o jednom slovu.

Unicode definira code pointe za slova. (Ne znam kako se code point
prevodi, radi se jednostavno o dodjeljivanju broja nekom slovu, tako da
se sva ta slova standardiziraju). Unicode za dďż˝, lj i nj ima code pointe.
Za ligature nema, koliko je meni poznato.

Iz �ega ja pak ligaturom nazivam ono �to ti dolje zove� tipografskom
ligaturom.

> Ligatura nije samo stvar prezentacije. Za pocetak, postoje
> tipografske (aka grafemske) i fonetske ligature.

> Kod nas su ligature "dz", "lj" i "nj" i fonemske i grafemske.

Gdje pi�e da su to ligature? Pravopis neima, gramatika neima taj pojam.
Koliko je meni poznato, barem. Pravopis koristi pojam dvoslov u istoj
re�enici u kojoj preostalih 27 slova naziva jednoslovima i to je sve.

> Moderni racunalni sistemi, odnosno oni koji do toga drze, kao i
> aplikacije, ce automatski dva znaka "f" zamijeniti ligaturom "ff". Na
> zalost, mi smo saka jada pa niko nema volje kvalitetno implementirati
> "nase" ligature, iako one u modernim fontovima postoje.

Pa gle, to ne bi trebalo zahtijevati posebnu implementaciju. Za o�ekivati
je da �e pojedini font imati standardiziranu oznaku za ligature (tako da
se jednozna�no mo�e do�i do "fl", "ffl", "ij" ili kakva je ve�. A onda
jedan te isti algoritam za prezentaciju mo�e upotrijebiti znak s ligaturom
kad treba ispisati tih par znakova koje ligatura mijenja.

Ono �to bi specijalno nama trebalo je obrnuta stvar. Kad se u tekstu
naleti na code point za dďż˝, lj ili nj, a font nema taj znak, onda bi
umjesto njega trebalo staviti odgovaraju�a dva koja sigurno postoje. Ili
on-the-fly stvoriti glif za originalni code point (s uklju�enim kerningom,
bez obzira je li to globalno uklju�eno ili nije).

Nedavno je bio ovdje postan link na novu definiciju hr lokala za pingvina.
Oti�ao ja to pogledati u Firefoxu i bilo je na par mjesta tih slova u
komentarima. Ali su mi bila nekako mala, bljedunjava i slaba�ka, valjda
zato �to ih je Firefox izvukao iz drugog fonta.

> No kod nas nije uvijek slucaj da skup grafema "nj" oznava dvoglas "nj"
> koji se u tom slucaju pise ligaturom, pa je, kako bi se to i vizuelno
> naznacilo, "j" malo vise podvuceno pod "n" (pogledaj neki font koji
> sadrzi ligaturu nj pa ce ti biti jasno o cemu pricam).

E, to nisam znao. Ali morate vi kerefeke izvoditi, �im imate gdje. :-)

> > (vjerojatno ?e pri tome morati koristiti Unicode private range), ali time
> > se isti ?as odri?e svih funkcija OS-a koje imaju ikakve veze sa slovima,
> > pa onda sve to mora implementirati sama. ?to je mal?ice naporno, pa bi
> > bilo lijepo da OS[1] ima pristojnu podr?ku za takve stvari.
>
> Samo cu spomenuti da je u nekim osevima to implementirano od
> "stoljeca sedmog". Pa ak se to moglo u jedan OS implementirat prije vise
> dvadeset godina, ne vidim razloga zasto danas drugi osevi to nebi mogli.

Koje to? Ja sam se u thread uklju�io kad sam spomenuo input metodu, i to
joďż˝ s heuristikom. Ima i drugih stvari koje bi OS trebao ili mogao
podr�avati, ali "implementacija" se uglavnom svodi na pisanje
specifikacije razli�itih podataka (npr. �to su velika, a �to mala slova,
collation order i sl.), ali ne i pisanje koda. Input metoda s heuristikom
debelo zahtijeva pisanje koda.

> > Jesi siguran? Za?to po novinama ve? godinama vi?am rastavljanje na slogove
> > ba? usred l-j i n-j? Uglavnom kad se tako ne bi trebalo rastavljati.
>
> Pogledaj dva tri pasusa prije ovog. Ima nesto di spominjem saku
> jada.

Meni se samo �ini da oni ne koriste odgovaraju�i (pot)program za
rastavljanje rije�i na slogove. Zbog �krtosti, pretpostavljam.

> Da se obrecnem, odnosno malo detaljnije elaboriram prijasnji post,
> odnosno dio na koji si ovime odgovorio. Problem jest da je Linux
> zajednica mahom IT zajednica. Nije u tome problem, problem je kad se
> neko iz IT zajednice, ko je maltene iskljucivo IT-jevac, nadje prozvanim
> davati ocjene da je GIMP (uzmi aplikaciju i pripadajucu bransu po volji)
> dobar proizvod. Eto ti tipicnih primjera s grupe, Furac i Bananko.

A valjda je njima dobar. Meni radi[tm], svima ga preporu�ujem. :-)

Tomislav

unread,
Nov 29, 2009, 12:26:11 PM11/29/09
to
Drazen Kacar <da...@fly.srk.fer.hr> wrote:

> ?ini mi se da imamo terminolo?ku zabunu.
>
> Moji (polazni) termini:
>
> Pravopis ka?e da su d?, lj i nj slova. Isto kao ?to su a, b i c slova.
> Ne ka?e da su to ligature, ne ka?e da su to dva slova, nego ka?e da se
> radi o jednom slovu.

Prvo valja rasclaniti slova oliti graficki zapis (grafem) od zvuka
(fonem). Ligature nisu u domeni niti pravopisa niti gramatike, one
spadaju u domenu tipografije.

> Unicode definira code pointe za slova. (Ne znam kako se code point
> prevodi, radi se jednostavno o dodjeljivanju broja nekom slovu, tako da

> se sva ta slova standardiziraju). Unicode za d?, lj i nj ima code pointe.


> Za ligature nema, koliko je meni poznato.

Kak nema code pointa za ligature? Pogledaj ponovo:-) Zdravo
seljacki. Ligatura je znak koji se sastoji od dva postojeca znaka a
oznacava zvuk koji ne oznacava niti jedan od od dva znaka koji
sacinjavaju ligaturu. Kako bi se to vizuelno ipak na neki nacin
naznacilo, postoje male modifikacije u odnosu na dva znaka koji
sacinjavaju ligaturu.

> Iz ?ega ja pak ligaturom nazivam ono ?to ti dolje zove? tipografskom
> ligaturom.

Jep. Danas mahom prevladavaju tipografske ligature. Evo primjera
engleskog jezika, office, izgovarao bi se jednako i da se pise ofice, no
u nekim jezicima ne. Takav primjer recimo imas u njemackom, "Strasse" se
ne izgovara isto kao i "Stra�e" niti jednako ko "Strase". "S" oznacava
kratko s, ligatura "ss" (koja u racunalnom svijetu nikada nije uvedena
(barem ja ne znam da ju je iko implementirao) oznacava srednje dugo s,
dok oznacava dugo s. No svabi su pred par godina isli u reviziju jezika
kako bi postao jednostavniji za koristenje, pa sad imas samo dva slcaja,
postoji "s" i "ss", a "�" je izbaceno iz jezika. Neso slicno kao kod
nas, tvrdo i meko "c". [1]

> Gdje pi?e da su to ligature? Pravopis neima, gramatika neima taj pojam.


> Koliko je meni poznato, barem. Pravopis koristi pojam dvoslov u istoj

> re?enici u kojoj preostalih 27 slova naziva jednoslovima i to je sve.

Kako vec spomenuh gore, to je u domeni tipografije i nije nekaj kaj
se uci u osnovnoj ili srednjoj skoli. Ne uci se niti na faksu ako faks
nije ako to nije domena doticnog faksa.

> Pa gle, to ne bi trebalo zahtijevati posebnu implementaciju. Za o?ekivati
> je da ?e pojedini font imati standardiziranu oznaku za ligature (tako da
> se jednozna?no mo?e do?i do "fl", "ffl", "ij" ili kakva je ve?. A onda
> jedan te isti algoritam za prezentaciju mo?e upotrijebiti znak s ligaturom


> kad treba ispisati tih par znakova koje ligatura mijenja.

Da. No kako rekoh, kod nas je problem malo zesci. Naime dvoslov "nj"
ne oznacava uvijek ligaturu (fonem) "nj". To znaci da bi
sistem/aplikacija trebala imati rjecnik na osnovu kojeg ce, ili nece,
dvoslov zamijeniti ligaturom. Kad bi to imao, znaci korektan unos, nebi
imao ama bas nikakvih problema sa sortiranjem i pretrazivanjem obzirom
da ligatura "nj" nema isti kod kao znakovi "n" i "j".

> Ono ?to bi specijalno nama trebalo je obrnuta stvar. Kad se u tekstu
> naleti na code point za d?, lj ili nj, a font nema taj znak, onda bi
> umjesto njega trebalo staviti odgovaraju?a dva koja sigurno postoje. Ili
> on-the-fly stvoriti glif za originalni code point (s uklju?enim kerningom,
> bez obzira je li to globalno uklju?eno ili nije).

Krivo. :-) Nama treba implementacija nasih ligatura kao kod drugih
jezika. Kad otipkas slova "n" i "j", "d" i "z", il neku drugu
kombinaciju, onda on to zamijeni pripadajucom ligaturom. Ukoliko u fontu
ligatura ne postoji, ne mijenja nista. No da, onda u takvom dokumentu
otpada i sortitanje. Al kak rekoh, mi smo samo saka jada, ko ce se
zamarati tim problemom? Da nas ima ko Kineza, imao bi nase ligature vec
odavno. :-)

> > No kod nas nije uvijek slucaj da skup grafema "nj" oznava dvoglas "nj"
> > koji se u tom slucaju pise ligaturom, pa je, kako bi se to i vizuelno
> > naznacilo, "j" malo vise podvuceno pod "n" (pogledaj neki font koji
> > sadrzi ligaturu nj pa ce ti biti jasno o cemu pricam).

> E, to nisam znao. Ali morate vi kerefeke izvoditi, ?im imate gdje. :-)

Nisu to kerefeke. :-) To ti je zato da bi mogo vizuelno razlikovati
"injekciju" od "injekcije" :-)

> Koje to?

Ak spomenem OS, bude mi Furac reko da trolam po grupi. I nebi ja imo
nis protiv toga da mi kaze kak trolam, mahom trolam tu, ali nebi podnio
da mi to odgovori na ovu prepisku kad ne trolam. Ono, trolam vecinu
vremena tu i nikad mi ne kaze da trolam, jedamput u tri mjeseca napisem
ne trolerski post, a on mi na to kaze da trolam. Neboi to prezivio. :-)

> Meni se samo ?ini da oni ne koriste odgovaraju?i (pot)program za
> rastavljanje rije?i na slogove. Zbog ?krtosti, pretpostavljam.

Dobro ti se cini, no point je da se takvi slucajevi rastavljanja
rijeci nebi desavale da su u pitanju ligature, taman da ne koriste
nikakav program za rastavljanje istih. Inace, vjerojatno koriste finski
ili talijanski za hipenaciju, radi poprilicno dobro s hrvatskim, al kak
vidis, ne uvijek. :-)

> A valjda je njima dobar. Meni radi[tm], svima ga preporu?ujem. :-)

Ajd, ti si za nijansu bolji od Furaca, ti barem kazes da je tebi
dobar. On maltene pa kaze da je svima dobar. :-)

Vedran Furač

unread,
Nov 29, 2009, 12:44:28 PM11/29/09
to
Drazen Kacar wrote:

>> neko iz IT zajednice, ko je maltene iskljucivo IT-jevac, nadje prozvanim
>> davati ocjene da je GIMP (uzmi aplikaciju i pripadajucu bransu po volji)
>> dobar proizvod. Eto ti tipicnih primjera s grupe, Furac i Bananko.
>

> A valjda je njima dobar. Meni radi[tm], svima ga preporučujem. :-)

Dobrodošao u grupu! ;)


--
http://vedranf.net | a8e7a7783ca0d460fee090cc584adc12

Drazen Kacar

unread,
Nov 29, 2009, 12:54:40 PM11/29/09
to
Tomislav wrote:
> Drazen Kacar <da...@fly.srk.fer.hr> wrote:

> Prvo valja rasclaniti slova oliti graficki zapis (grafem) od zvuka
> (fonem). Ligature nisu u domeni niti pravopisa niti gramatike, one
> spadaju u domenu tipografije.

Dobro.

> > Unicode definira code pointe za slova. (Ne znam kako se code point
> > prevodi, radi se jednostavno o dodjeljivanju broja nekom slovu, tako da
> > se sva ta slova standardiziraju). Unicode za d?, lj i nj ima code pointe.
> > Za ligature nema, koliko je meni poznato.
>
> Kak nema code pointa za ligature? Pogledaj ponovo:-)

Gle, to gledanje je naporno. Kad sam zadnji put gledao (prije nekoliko
godina) nije bilo code pointa za ligature "fl" i "ffl". Adobe je za svoje
Type 1 fontove to stavio negdje u private range. Mislim da su i obznanili
gdje �to ide, da se korisnici mogu sna�i.

Ako znaďż˝ za neki Unicode code point za ligaturu, bio bih zahvalan na
pointeru.

> Zdravo seljacki. Ligatura je znak koji se sastoji od dva postojeca
> znaka a oznacava zvuk koji ne oznacava niti jedan od od dva znaka koji
> sacinjavaju ligaturu.

Da, ali to i dalje ne zna�i da im Unicode treba dodijeliti code point.
Neimanje code pointa ih ne sprje�ava da postoje u fontu (datoteci), a
moglo bi se do njih do�i i bez alociranja code pointa iz private rangea,
ali s tim je lak�e i zgodnije.

> Da. No kako rekoh, kod nas je problem malo zesci. Naime dvoslov "nj"
> ne oznacava uvijek ligaturu (fonem) "nj". To znaci da bi
> sistem/aplikacija trebala imati rjecnik na osnovu kojeg ce, ili nece,
> dvoslov zamijeniti ligaturom. Kad bi to imao, znaci korektan unos, nebi
> imao ama bas nikakvih problema sa sortiranjem i pretrazivanjem obzirom
> da ligatura "nj" nema isti kod kao znakovi "n" i "j".

Tako je. Ja bih, dodu�e, ra�e promijenio pravopis.

> > Ono ?to bi specijalno nama trebalo je obrnuta stvar. Kad se u tekstu
> > naleti na code point za d?, lj ili nj, a font nema taj znak, onda bi
> > umjesto njega trebalo staviti odgovaraju?a dva koja sigurno postoje. Ili
> > on-the-fly stvoriti glif za originalni code point (s uklju?enim kerningom,
> > bez obzira je li to globalno uklju?eno ili nije).
>
> Krivo. :-) Nama treba implementacija nasih ligatura kao kod drugih
> jezika. Kad otipkas slova "n" i "j", "d" i "z", il neku drugu
> kombinaciju, onda on to zamijeni pripadajucom ligaturom.

Ovo moje gore ne isklju�uje tvoje. Ne isklju�uje ama ba� ni�ta, pa ne
vidim za�to je krivo.

> Ukoliko u fontu ligatura ne postoji, ne mijenja nista. No da, onda u
> takvom dokumentu otpada i sortitanje.

Font je samo prezentacija. Ono �to na kraju vidi� na papiru ili ekranu. I
ni�ta osim vizualnog izgleda ne ovisi o tome koje grafeme font ima.

> Nisu to kerefeke. :-) To ti je zato da bi mogo vizuelno razlikovati
> "injekciju" od "injekcije" :-)

Aha. Dobro, kad ti ka�e�. :-)

> Ono, trolam vecinu
> vremena tu i nikad mi ne kaze da trolam, jedamput u tri mjeseca napisem
> ne trolerski post, a on mi na to kaze da trolam. Neboi to prezivio. :-)

Zna� �to se dogodilo de�ku koji je previ�e puta vikao "VUK!"?

> Dobro ti se cini, no point je da se takvi slucajevi rastavljanja
> rijeci nebi desavale da su u pitanju ligature, taman da ne koriste
> nikakav program za rastavljanje istih. Inace, vjerojatno koriste finski
> ili talijanski za hipenaciju, radi poprilicno dobro s hrvatskim, al kak
> vidis, ne uvijek. :-)

Ma, mislim, ja bi to oglobio, pa bi radilo u �asu keks.

> > A valjda je njima dobar. Meni radi[tm], svima ga preporu?ujem. :-)
>
> Ajd, ti si za nijansu bolji od Furaca, ti barem kazes da je tebi
> dobar. On maltene pa kaze da je svima dobar. :-)

Ja samo citiram pingvine. Da budem on-topic. :-)

Vedran Furač

unread,
Nov 29, 2009, 1:03:20 PM11/29/09
to
Tomislav wrote:

>> A valjda je njima dobar. Meni radi[tm], svima ga preporu?ujem. :-)
>
> Ajd, ti si za nijansu bolji od Furaca, ti barem kazes da je tebi
> dobar. On maltene pa kaze da je svima dobar. :-)

Počeo si me spominjat više nego Nalis Zubčića i obrnuto. Nego, opet
zaboravljaš. Složili smo se s tvojom procjenom da je GIMP dobar za 15%
profesionalaca.


--
http://vedranf.net | a8e7a7783ca0d460fee090cc584adc12

Tomislav

unread,
Nov 29, 2009, 1:20:31 PM11/29/09
to
Drazen Kacar <da...@fly.srk.fer.hr> wrote:

> Ako zna? za neki Unicode code point za ligaturu, bio bih zahvalan na
> pointeru.

ff ligatura
Character code: 64256
Unicode: U + FB00
Glypth ID: 266
HTML: &#64256

> Da, ali to i dalje ne zna?i da im Unicode treba dodijeliti code point.

Nije da im ne treba dodijeliti, dodijelio im je.

> Font je samo prezentacija. Ono ?to na kraju vidi? na papiru ili ekranu. I
> ni?ta osim vizualnog izgleda ne ovisi o tome koje grafeme font ima.

Kak je samo vizuelna prezentacija? Komp sortiranja radi po kodovima.
Upravo zato je bitno mapirati vizuelno znakovlje po nekim standardima,
po kodovima. Mozes ti na mjesto slova "a" staviti i slicicu SaiBabe, al
onda se cijeli sustav raspada.

> Zna? ?to se dogodilo de?ku koji je previ?e puta vikao "VUK!"?

Khmm, znam. Al ajde svejedno pojasni, mozda krivo znam (makar
sumnjam :-)

Tomislav

unread,
Nov 29, 2009, 1:22:12 PM11/29/09
to
Vedran Fura? <ved...@vedranf.mine.nu> wrote:

> Po?eo si me spominjat vi?e nego Nalis Zub?i?a i obrnuto.

To je zato da se Bananko ne osjeca uzamljenim. Zalio mi se nema dugo
da stalno njemu po kicmi skacem. Tak da, NHF. :-)

> Nego, opet
> zaboravlja?. Slo?ili smo se s tvojom procjenom da je GIMP dobar za 15%
> profesionalaca.

OK, nego, smatras li se ti GIMP profesionalcem?

Vedran Krivokuca [Volim Diplomaciju]

unread,
Nov 29, 2009, 1:56:40 PM11/29/09
to
Dana Sun, 29 Nov 2009 15:45:42 +0100, Vedran Furač napisa:

>>>> nego u jezičnom smislu.
>>> Pa i govorim u jezičnom smislu.
>> Jasno. :-)
> Drago mi je da ti je jasno. Sad objasni Tomislavu.

Biseru. :-)

Vedran Furač

unread,
Nov 29, 2009, 2:11:26 PM11/29/09
to
Tomislav wrote:

>> Nego, opet
>> zaboravlja?. Slo?ili smo se s tvojom procjenom da je GIMP dobar za 15%
>> profesionalaca.
>
> OK, nego, smatras li se ti GIMP profesionalcem?

Ne. Ja sam ti radio par tekstura i bannera (neke možeš vidjet u sigu).
Za jedan sam banner dobio i nešto para svojedobno, ali se inače ne bavim
time.


--
http://vedranf.net | a8e7a7783ca0d460fee090cc584adc12

Drazen Kacar

unread,
Nov 29, 2009, 3:02:35 PM11/29/09
to
Tomislav wrote:
> Drazen Kacar <da...@fly.srk.fer.hr> wrote:
>
> > Ako znaďż˝ za neki Unicode code point za ligaturu, bio bih zahvalan na

> > pointeru.
>
> ff ligatura
> Character code: 64256
> Unicode: U + FB00
> Glypth ID: 266
> HTML: &#64256

Fakat. Stavili su tih par uobi�ajenih ligatura.

> Kak je samo vizuelna prezentacija? Komp sortiranja radi po kodovima.
> Upravo zato je bitno mapirati vizuelno znakovlje po nekim standardima,
> po kodovima. Mozes ti na mjesto slova "a" staviti i slicicu SaiBabe, al
> onda se cijeli sustav raspada.

Ne, zato �to ne sortira po sli�ici nego po broju koji je pridru�en slovu
"a". Ako font nema grafem, tekst �e i dalje biti korektan i mo�i �e se
uredno sortirati. Jedino �to ti taj grafem ne�e� vidjeti (ili �e� vidjeti
nekakvu zamjenu).

> > Zna� �to se dogodilo de�ku koji je previ�e puta vikao "VUK!"?


>
> Khmm, znam. Al ajde svejedno pojasni, mozda krivo znam (makar
> sumnjam :-)

Pa... Kad je stvarno do�ao vuk, a on vi�u�i dotr�ao u selo, svi su se
nasmijali i odmahnuli rukom. Na tvoju veliku �alost, vuk nije bio dovoljno
pametan da sku�i koliku mu je uslugu napravio taj klinac, pa je i njega
pojeo. :-)

Tomislav

unread,
Nov 29, 2009, 3:32:13 PM11/29/09
to
Drazen Kacar <da...@fly.srk.fer.hr> wrote:

> Ne, zato ?to ne sortira po sli?ici nego po broju koji je pridru?en slovu
> "a". Ako font nema grafem, tekst ?e i dalje biti korektan i mo?i ?e se
> uredno sortirati. Jedino ?to ti taj grafem ne?e? vidjeti (ili ?e? vidjeti
> nekakvu zamjenu).

Pa o tome pricam. Kom sortira po kodu, ali ako unutra stavis slicicu
SaiBabe, stvar se raspada, jer ti vizuelno to sortanje ne izgleda dobro.
Nda, nebitno, kuzimo se.

> Pa... Kad je stvarno do?ao vuk, a on vi?u?i dotr?ao u selo, svi su se
> nasmijali i odmahnuli rukom. Na tvoju veliku ?alost, vuk nije bio dovoljno
> pametan da sku?i koliku mu je uslugu napravio taj klinac, pa je i njega
> pojeo. :-)

Arghhh, znao sam da znam. Nada je kurva.

voksic

unread,
Nov 29, 2009, 4:54:52 PM11/29/09
to
On 29 stu, 15:10, tomislawDEL...@gmail.com (Tomislav) wrote:

> Taj "workaround" postoji vec jaaaako dugo i zove se ligature. Na Macu je
> postojao adresar jos krajem osamdesetih ili pocetkom devedesetih, ne
> sjecam se tocno, koji je pomocu ligatura rjesavao taj problem. Da je
> radio savrseno, upravo ovaj primjer s injekcijom, nije. Makar, Obzirom
> da se radilo o adresaru, radio je savrseno. :-)

Poanta rasprave je da mi, na bilo kojem OS-u, danas jednako unosimo dž
i dž, što je pogrešno. I ligature to ne mogu ispraviti jer ce uvijek
staviti dž, iako u tu rijec ide dž. Dakle, taj 'workaroud' ne rijesava
sve probleme, kako sam vec i napisao.

Drazen Kacar

unread,
Nov 29, 2009, 5:02:14 PM11/29/09
to
Tomislav wrote:
> Drazen Kacar <da...@fly.srk.fer.hr> wrote:

> > Pa... Kad je stvarno do�ao vuk, a on vi�u�i dotr�ao u selo, svi su se
> > nasmijali i odmahnuli rukom. Na tvoju veliku �alost, vuk nije bio dovoljno
> > pametan da sku�i koliku mu je uslugu napravio taj klinac, pa je i njega


> > pojeo. :-)
>
> Arghhh, znao sam da znam. Nada je kurva.

Nije, Nada je jedna pristojna djevojka. Ali s tvojim uletima, tebe sve
pristojne djevojke odjebu. :-)

Vedran Furač

unread,
Nov 29, 2009, 5:18:39 PM11/29/09
to
voksic wrote:

> On 29 stu, 15:10, tomislawDEL...@gmail.com (Tomislav) wrote:
>
>> Taj "workaround" postoji vec jaaaako dugo i zove se ligature. Na Macu je
>> postojao adresar jos krajem osamdesetih ili pocetkom devedesetih, ne
>> sjecam se tocno, koji je pomocu ligatura rjesavao taj problem. Da je
>> radio savrseno, upravo ovaj primjer s injekcijom, nije. Makar, Obzirom
>> da se radilo o adresaru, radio je savrseno. :-)
>
> Poanta rasprave je da mi, na bilo kojem OS-u, danas jednako unosimo dž
> i dž, što je pogrešno.

Iz lijenosti (ali i nekih drugih razloga), da.

> I ligature to ne mogu ispraviti jer ce uvijek
> staviti dž, iako u tu rijec ide dž.

Umjesto ligature-a ili kakve heuristike, zašto ne prepustiti čovjeku da
odluči ide li nj ili nj?


--
http://vedranf.net | a8e7a7783ca0d460fee090cc584adc12

Tomislav

unread,
Nov 29, 2009, 5:24:29 PM11/29/09
to
voksic <vok...@gmail.com> wrote:

> Poanta rasprave je da mi, na bilo kojem OS-u, danas jednako unosimo d?
> i ?, ?to je pogre?no. I ligature to ne mogu ispraviti jer ce uvijek
> staviti ?, iako u tu rijec ide d?. Dakle, taj 'workaroud' ne rijesava


> sve probleme, kako sam vec i napisao.

Daklem, rekoh vec. To nije workaround. Da je stvar u nekim
slucajevima kompleksna, jest. S drugim jezicima to dobro funkcionira. Al
kaj sad, imamo kompliciran jezik :-)

Tomislav

unread,
Nov 29, 2009, 5:48:35 PM11/29/09
to
Drazen Kacar <da...@fly.srk.fer.hr> wrote:

> Ma nije kompliciran. Da je kompliciran, ti ga nikad ne bi uspio svladati.
> :-)

Vidi vidi, nisam razmisljao na taj nacin, al ko zna, mozda ima nes u
tome. :o

Drazen Kacar

unread,
Nov 29, 2009, 5:47:01 PM11/29/09
to
Tomislav wrote:

> Daklem, rekoh vec. To nije workaround. Da je stvar u nekim
> slucajevima kompleksna, jest. S drugim jezicima to dobro funkcionira. Al
> kaj sad, imamo kompliciran jezik :-)

Ma nije kompliciran. Da je kompliciran, ti ga nikad ne bi uspio svladati.
:-)

--

0 new messages