Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

Ceske uvozovky v UTF8

19 views
Skip to first unread message

Jan Kasprzak

unread,
Apr 20, 2007, 5:58:18 AM4/20/07
to
Dobry den,

omlouvam se za dotaz, ktery nesouvisi s TeXem, jen se sazbou: ktere
UTF-8 znaky se maji pouzivat pro ceske uvozovky? Myslel jsem ze jako
oteviraci treba

U+201E DOUBLE LOW-9 QUOTATION MARK
http://www.fileformat.info/info/unicode/char/201E/index.htm

ale ktere jako uzaviraci? Opticky vypada podobne

U+201C LEFT DOUBLE QUOTATION MARK
http://www.fileformat.info/info/unicode/char/201C/index.htm

ale ten je v Unicode oznaceny jako oteviraci a pojmenovany "LEFT"
(coz muze pak delat problem, pokud treba textovy editor chce parovat
odpovidajici uvozovky a podobne). Nehlede na to ze ve fontech nejspis
bude mit kerning odpovidajici tomu, ze ma byt prilepeny k textu
zleva, nikoli zprava.

Diky,

-Yenya

--
\ Jan "Yenya" Kasprzak <kas at fi.muni.cz> http://www.fi.muni.cz/~kas/
\\ PGP: finger kas at aisa.fi.muni.cz 0D99A7FB206605D7 8B35FCDE05B18A5E //
Mountains. Heavy are the mountains, but that changes over time.
Sky... Blue sky. What your eyes can't see. What your eyes can see.

arec...@yahoo.co.uk

unread,
Apr 20, 2007, 9:09:09 AM4/20/07
to
Snad to o něčem vypovídá: České OpenOfficeOrg ve svém výchozím
nastavení zaměňují klávesnicové uvozovky právě za dvojici, o níž
píšete (201E...201C).

Zdraví
Tomáš Kučera

Zdenek Wagner

unread,
Apr 20, 2007, 9:08:09 AM4/20/07
to Czech and Slovak TeX-related mailing list
20.4.07, Jan Kasprzak <k...@fi.muni.cz>:

> Dobry den,
>
> omlouvam se za dotaz, ktery nesouvisi s TeXem, jen se sazbou: ktere
> UTF-8 znaky se maji pouzivat pro ceske uvozovky? Myslel jsem ze jako
> oteviraci treba
>
> U+201E DOUBLE LOW-9 QUOTATION MARK
> http://www.fileformat.info/info/unicode/char/201E/index.htm
>
> ale ktere jako uzaviraci? Opticky vypada podobne
>
> U+201C LEFT DOUBLE QUOTATION MARK
> http://www.fileformat.info/info/unicode/char/201C/index.htm
>
> ale ten je v Unicode oznaceny jako oteviraci a pojmenovany "LEFT"
> (coz muze pak delat problem, pokud treba textovy editor chce parovat
> odpovidajici uvozovky a podobne). Nehlede na to ze ve fontech nejspis
> bude mit kerning odpovidajici tomu, ze ma byt prilepeny k textu
> zleva, nikoli zprava.
>
Vypada to, ze v UNICODE nic lepsiho neni. Textovy editor, ktery chce
parovat typograficky spravne uvozovky, pak musi mit vyssi inteligenci,
musi odnekud ziskat jazyk textu a pracovat podle nejakych vlastnich
tabulek. Spravny kerning je resitelny. V anglickych textech bude:

<mezera><U+201C><Text>

V ceskych textech bude

<text><U+201C><mezera>

Principialne s tim tedy problem neni, ale to, ze font obsahuje znaky
potrebne pro sazbu cestiny a slovenstiny, jeste neznamena, ze je
udelan typograficky dobre.

Mimochodem, trochu jsem se hadal s unicodovymi experty, zejmena ohedne
pouzivani mezer okolo znaku danda v indickych pismech, a v podstate mi
rekli, ze se od textovych editoru a programu pro sazbu ocekava vysoky
stupen vlastni inteligence, napriklad ze musi sam rozeznat, ktere
mezery maji byt neroztazitelne a nezlomitelne. To je mnohem narocnejsi
uloha nez parovani uvozovek.

> Diky,
>
> -Yenya
>
> --
> \ Jan "Yenya" Kasprzak <kas at fi.muni.cz> http://www.fi.muni.cz/~kas/
> \\ PGP: finger kas at aisa.fi.muni.cz 0D99A7FB206605D7 8B35FCDE05B18A5E //
> Mountains. Heavy are the mountains, but that changes over time.
> Sky... Blue sky. What your eyes can't see. What your eyes can see.

> _______________________________________________
> csTeX mailing list
> cs...@cs.felk.cvut.cz
> http://lists.felk.cvut.cz/mailman/listinfo/cstex
>


--
Zdeněk Wagner
http://hroch486.icpf.cas.cz/wagner/
http://icebearsoft.euweb.cz

0 new messages