Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

RFC: Ceske zkratky mesicu v locales/glibc

1,089 views
Skip to first unread message

Jan Kasprzak

unread,
Mar 8, 2013, 12:00:23 PM3/8/13
to li...@linux.cz, Petr Baudis
Pekny patek preji,

uz delsi dobu mi vadi, ze ceske locales pouzivaji tripismenne
zkratky mesicu - vzdycky kdyz vidim "čen" nebo "čec" tak si rikam
"co to safra je?". Dokonce jsem se dokopal k tomu, abych o tom napsal
maintainerovi locales v glibc. Jeho nazor je, ze takovouto zmenu
je treba prodiskutovat v prislusne jazykove komunite uzivatelu, zjistit
celkovou naladu a mozne protiargumenty. Coz timto cinim.

Moznosti jak resit zkratky mesicu jsou tyto:

1) pouzit rimske cislice. Vyhoda je, ze toto se skutecne v datech
v cestine pouziva ("8. III. 2013, za vlady krale Milose I." :-).
Dalsi vyhoda je, ze takto stanovene zkratky jsou skutecne
zkratkami v tom smyslu, ze jsou kratsi nez puvodni nazvy mesicu.

2) pouzit cele nazvy mesicu ve 2. pade (8. března 2013). Takto to
maji napriklad Rusove:

$ LC_TIME=ru_RU.utf-8 date '+%b %B'
марта Март

Tohle je taky na rozdil od stavajiciho stavu citelne, pouziva se
ve skutecne cestine, akorat to neni zkratka ve vyse uvedenem smyslu
a neda se pouzit samostatne bez cisla dne v mesici (vypada to divne).

3) nechat stavajici stav - tripismenne zkratky ktere se nikde realne
nepouzivaji. Jejich vyhoda ale je, ze vsechny zkratky jsou stejne
dlouhe (a stejne dlouhe jako v anglictine). Nicmene je spousta locales,
ktere tuto vlastnost nemaji (krome te rustiny i treba francouzstina),
takze snad jsou internacionalizovane aplikace s tim uz nejak srozumeny.

Jaky na to mate nazor, pripadne jake mate argumenty krome
vyse uvedenych? Ja za sebe preferuji 1).

Dalsi souvisejici problem je, jestli nezmenit implicitni
znakovou sadu pro locale aliasy "cs" a "cs_CZ" tak, ze by toto byly
aliasy na "cs_CZ.UTF-8" misto stavajiciho "cs_CZ.ISO-8859-2".
Tohle by ale nejspis bylo dobre udelat pro vsechny jazyky, co jeste
porad maji 8-bitovou znakovou sadu jako implicitni.

-Yenya

P.S.: Asi nejkurioznejsi nastaveni je v japonstine, kde jsou
zkratky mesicu takto:

LC_TIME=ja_JP.utf-8 date '+%b %B'
3月 3月
LC_TIME=ja_JP.utf-8 date '+%b %B' -d '2013-12-01'
12月 12月

Cimz maji zkratky prvnich deviti mesicu _delsi_ nez "nezkracene" nazvy,
ale zase maji vsechny zkratky tripismenne.

--
| Jan "Yenya" Kasprzak <kas at {fi.muni.cz - work | yenya.net - private}> |
| New GPG 4096R/A45477D5 - see http://www.fi.muni.cz/~kas/pgp-rollover.txt |
| http://www.fi.muni.cz/~kas/ Journal: http://www.fi.muni.cz/~kas/blog/ |
Please don't top post and in particular don't attach entire digests to your
mail or we'll all soon be using bittorrent to read the list. --Alan Cox

Vladimír Náprstek

unread,
Mar 8, 2013, 12:34:20 PM3/8/13
to Diskuse o Linuxu v cestine
V čem se liší verze: 24.XII.2013 a 24.12.2013? Když už čísla, tak arabská
se běžnému člověku lépe čtou. Ale zase ta římská jsou opravdu lepší než
"čen" nebo "čvc".

O zkratkách:
http://www.pravidla.cz/vice/zkratky-a-znacky/?kapitola=7
http://prirucka.ujc.cas.cz/?id=780


Dne 8. března 2013 18:00 Jan Kasprzak <k...@fi.muni.cz> napsal(a):
> _______________________________________________
> Linux mailing list
> Li...@linux.cz
> http://www.linux.cz/mailman/listinfo/linux

Jaroslav Lukesh

unread,
Mar 8, 2013, 12:38:56 PM3/8/13
to Diskuse o Linuxu v cestine, Petr Baudis
Nechci vám kazit nadšení, ale uvedené třípísmenné zkratky se v úředních
papírech používaly ještě dřív než jsem se narodil 8-)

----- Původní zpráva -----
Od: "Jan Kasprzak" <k...@fi.muni.cz>

Petr Pisar

unread,
Mar 8, 2013, 1:40:17 PM3/8/13
to li...@linux.cz
On 2013-03-08, Jan Kasprzak <k...@fi.muni.cz> wrote:
>
> uz delsi dobu mi vadi, ze ceske locales pouzivaji tripismenne
> zkratky mesicu - vzdycky kdyz vidim "čen" nebo "čec" tak si rikam
> "co to safra je?".

Je to zkratka. strftime(3) rozlisuje plne nazvy mesicu "%B" a zkracene
nazvy "%b".

> Jeho nazor je, ze takovouto zmenu
> je treba prodiskutovat v prislusne jazykove komunite uzivatelu, zjistit
> celkovou naladu a mozne protiargumenty. Coz timto cinim.
>
Coz je trochu nestane, protoze na lokalizaci mame
<dis...@lists.l10n.cz>. Podrobnosti na <http://www.l10n.cz/>.

> Moznosti jak resit zkratky mesicu jsou tyto:
>
> 1) pouzit rimske cislice. Vyhoda je, ze toto se skutecne v datech
> v cestine pouziva ("8. III. 2013, za vlady krale Milose I." :-).
> Dalsi vyhoda je, ze takto stanovene zkratky jsou skutecne
> zkratkami v tom smyslu, ze jsou kratsi nez puvodni nazvy mesicu.
>
Jestli chces cisla, tak "%m".

> 2) pouzit cele nazvy mesicu ve 2. pade (8. března 2013). Takto to
> maji napriklad Rusove:
>
> $ LC_TIME=ru_RU.utf-8 date '+%b %B'
> марта Март
>
> Tohle je taky na rozdil od stavajiciho stavu citelne, pouziva se
> ve skutecne cestine, akorat to neni zkratka ve vyse uvedenem smyslu
> a neda se pouzit samostatne bez cisla dne v mesici (vypada to divne).
>
Ano, neni to zkratka a nelze to pouzit samostatne.

> 3) nechat stavajici stav - tripismenne zkratky ktere se nikde realne
> nepouzivaji. Jejich vyhoda ale je, ze vsechny zkratky jsou stejne
> dlouhe (a stejne dlouhe jako v anglictine). Nicmene je spousta locales,
> ktere tuto vlastnost nemaji (krome te rustiny i treba francouzstina),
> takze snad jsou internacionalizovane aplikace s tim uz nejak srozumeny.
>
Ani coreutils (who -H) nezvladaji zarovnani do sloupcu :( Ale osobne
nechapu, proc ti vadi existence zkratek. Jak uz nekdo psal, pouzivaly se
jeste pred GNU.

> Jaky na to mate nazor, pripadne jake mate argumenty krome
> vyse uvedenych? Ja za sebe preferuji 1).
>
Myslim, ze je jasne, ze ja (3).

> Dalsi souvisejici problem je, jestli nezmenit implicitni
> znakovou sadu pro locale aliasy "cs" a "cs_CZ" tak, ze by toto byly
> aliasy na "cs_CZ.UTF-8" misto stavajiciho "cs_CZ.ISO-8859-2".
> Tohle by ale nejspis bylo dobre udelat pro vsechny jazyky, co jeste
> porad maji 8-bitovou znakovou sadu jako implicitni.
>
Dobry napad, ale to je uz opravdu jen implementacni detail.

> P.S.: Asi nejkurioznejsi nastaveni je v japonstine, kde jsou
> zkratky mesicu takto:
>
> LC_TIME=ja_JP.utf-8 date '+%b %B'
> 3月 3月
> LC_TIME=ja_JP.utf-8 date '+%b %B' -d '2013-12-01'
> 12月 12月
>
> Cimz maji zkratky prvnich deviti mesicu _delsi_ nez "nezkracene" nazvy,
> ale zase maji vsechny zkratky tripismenne.
>
Delka bude ona motivace proc, je maji "zkratky" jine od celych nazvu.

-- Petr

Jan Hrach

unread,
Mar 8, 2013, 11:06:42 PM3/8/13
to Diskuse o Linuxu v cestine
Chtěl bych se zastat současných zkratek, osobně s tím nemám problém (ani s rozlišováním čen/čec). Naopak římské číslice mi přijdou špatně čitelné - jak už někdo píše dále, když už, tak arabské. Ale to si rovnou místo %b můžu dát %m.

On 8.3.2013 18:00, Jan Kasprzak wrote:
> Pekny patek preji,
>
> uz delsi dobu mi vadi, ze ceske locales pouzivaji tripismenne
> zkratky mesicu - vzdycky kdyz vidim "čen" nebo "čec" tak si rikam
> "co to safra je?". Dokonce jsem se dokopal k tomu, abych o tom napsal
> maintainerovi locales v glibc. Jeho nazor je, ze takovouto zmenu
> je treba prodiskutovat v prislusne jazykove komunite uzivatelu, zjistit
> celkovou naladu a mozne protiargumenty. Coz timto cinim.
>
> Moznosti jak resit zkratky mesicu jsou tyto:
>
> 1) pouzit rimske cislice. Vyhoda je, ze toto se skutecne v datech
> v cestine pouziva ("8. III. 2013, za vlady krale Milose I." :-).
> Dalsi vyhoda je, ze takto stanovene zkratky jsou skutecne
> zkratkami v tom smyslu, ze jsou kratsi nez puvodni nazvy mesicu.
>
> 2) pouzit cele nazvy mesicu ve 2. pade (8. března 2013). Takto to
> maji napriklad Rusove:
>
> $ LC_TIME=ru_RU.utf-8 date '+%b %B'
> марта Март
>
> Tohle je taky na rozdil od stavajiciho stavu citelne, pouziva se
> ve skutecne cestine, akorat to neni zkratka ve vyse uvedenem smyslu
> a neda se pouzit samostatne bez cisla dne v mesici (vypada to divne).
>
> 3) nechat stavajici stav - tripismenne zkratky ktere se nikde realne
> nepouzivaji. Jejich vyhoda ale je, ze vsechny zkratky jsou stejne
> dlouhe (a stejne dlouhe jako v anglictine). Nicmene je spousta locales,
> ktere tuto vlastnost nemaji (krome te rustiny i treba francouzstina),
> takze snad jsou internacionalizovane aplikace s tim uz nejak srozumeny.
>
> Jaky na to mate nazor, pripadne jake mate argumenty krome
> vyse uvedenych? Ja za sebe preferuji 1).
>
> Dalsi souvisejici problem je, jestli nezmenit implicitni
> znakovou sadu pro locale aliasy "cs" a "cs_CZ" tak, ze by toto byly
> aliasy na "cs_CZ.UTF-8" misto stavajiciho "cs_CZ.ISO-8859-2".
> Tohle by ale nejspis bylo dobre udelat pro vsechny jazyky, co jeste
> porad maji 8-bitovou znakovou sadu jako implicitni.
>
> -Yenya
>
> P.S.: Asi nejkurioznejsi nastaveni je v japonstine, kde jsou
> zkratky mesicu takto:
>
> LC_TIME=ja_JP.utf-8 date '+%b %B'
> 3月 3月
> LC_TIME=ja_JP.utf-8 date '+%b %B' -d '2013-12-01'
> 12月 12月
>
> Cimz maji zkratky prvnich deviti mesicu _delsi_ nez "nezkracene" nazvy,
> ale zase maji vsechny zkratky tripismenne.
>

--
Jan Hrach, http://jenda.hrach.eu/
GPG CD98 5440 4372 0C6D 164D A24D F019 2F8E 6527 282E

Pavel Machek

unread,
Mar 9, 2013, 2:12:11 PM3/9/13
to Diskuse o Linuxu v cestine
Ahoj!

> V čem se liší verze: 24.XII.2013 a 24.12.2013? Když už čísla, tak arabská
> se běžnému člověku lépe čtou. Ale zase ta římská jsou opravdu lepší než
> "čen" nebo "čvc".

No... U rimskyho cisla je jasny ze je to mesic... Tj. 11/12/13 neni
moc jednoznacny, 11.XII.2013 jednoznacny je.
Pavel
--
(english) http://www.livejournal.com/~pavelmachek
(cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html

Adam Pribyl

unread,
Mar 9, 2013, 2:35:54 PM3/9/13
to Diskuse o Linuxu v cestine
Ja sem za ponechani soucastneho stavu - tedy 3. Nemam s tim zadny problem.
Zmena kodovani neni od veci.

Adam
> | Jan "Yenya" Kasprzak <kas at {fi.muni.cz - work | yenya.net - private}> |
> | New GPG 4096R/A45477D5 - see http://www.fi.muni.cz/~kas/pgp-rollover.txt |
> | http://www.fi.muni.cz/~kas/ Journal: http://www.fi.muni.cz/~kas/blog/ |
> Please don't top post and in particular don't attach entire digests to your
> mail or we'll all soon be using bittorrent to read the list. --Alan Cox
> _______________________________________________
> Linux mailing list
> Li...@linux.cz
> http://www.linux.cz/mailman/listinfo/linux

Odchozi zprava neobsahuje viry, protoze nebyla odeslana z Windows.
Otestovano zdarma a legalne na OS Linux.
(Proc pouzivat Linux - http://proc.linux.cz/).

Martin `MJ' Mares

unread,
Mar 9, 2013, 4:51:37 PM3/9/13
to Diskuse o Linuxu v cestine, Petr Baudis
Hello, world!\n

> zkratky mesicu - vzdycky kdyz vidim "čen" nebo "čec" tak si rikam
> "co to safra je?". Dokonce jsem se dokopal k tomu, abych o tom napsal
> maintainerovi locales v glibc. Jeho nazor je, ze takovouto zmenu
> je treba prodiskutovat v prislusne jazykove komunite uzivatelu, zjistit
> celkovou naladu a mozne protiargumenty. Coz timto cinim.

Třípísmenné zkratky měsíců mi přijdou praštěné a atypické, ovšem
ani 1), ani 2) mi nepřijde o nic lepší. Takže nejspíš ponechat
současný stav.

Přeji pěkný víkend
--
Martin `MJ' Mares <m...@ucw.cz> http://mj.ucw.cz/
Faculty of Math and Physics, Charles University, Prague, Czech Rep., Earth
"This is an object-oriented system. If we change anything, the users object."

Pavel Kankovsky

unread,
Mar 11, 2013, 1:23:44 PM3/11/13
to Diskuse o Linuxu v cestine
On Fri, 8 Mar 2013, Jan Kasprzak wrote:

> uz delsi dobu mi vadi, ze ceske locales pouzivaji tripismenne
> zkratky mesicu - vzdycky kdyz vidim "čen" nebo "čec" tak si rikam
> "co to safra je?".

Jak už tady padlo, tak ty trojpísmené zkratky se používají. A troufám si
tvrdit, že se používaly už v předinternetových dobách. A jsou většinou i
celkem na první pohled srozumitelné, potíže dělá jen ten červen a
červenec.

(To ti naši zatracení předci nemohli vymyslet o jedno originální jméno
měsíce navíc? Nicméně je zajímavé, že podobnou blbost a dokonce u stejných
měsíců udělali i Římané a to dokonce dodatečně, když měli nejdřív Iunius a
Quintilis a druhý z nich přejmenovali na Iulius -- a od nich to pak
převzala většina Evropy.)

V případě jmenovaných locale jsou ale asi pro červen a červenec
zvoleny zkratky spíš méně obvyklé. Řekl bych, že daleko častěji se používá
"čer" a "čec" nebo "čvn" a "čvc":

* Varianta "čer" a "čec" je asi nejčastější, ale má nevýhodu, že "čer"
není na první pohled jednoznačné.

* Možnost "čvn" a "čvc" mi osobně připadá intuitivnější než všechny
ostatní, protože je hned jasné, že tyto konkrétní zkratky jsou
konstruované jinak než jako první tři písmena názvu.

Ale možná bude nejlepší věnovat úsilí tomu, aby šlo všude používat
ISO 8601 a podivnosti místních označení měsíců nechat upadnout do
zapomění...

--
Pavel Kankovsky aka Peak / Jeremiah 9:21 \
"For death is come up into our MS Windows(tm)..." \ 21st century edition /

Jarda

unread,
Mar 11, 2013, 7:24:06 PM3/11/13
to
Dne 8.3.2013 18:00, Jan Kasprzak napsal(a):
> Pekny patek preji,
>
> uz delsi dobu mi vadi, ze ceske locales pouzivaji tripismenne
> zkratky mesicu - vzdycky kdyz vidim "čen" nebo "čec" tak si rikam
> "co to safra je?". Dokonce jsem se dokopal k tomu, abych o tom napsal

tedy Pánové...

potřebovali byste práci :-) ,
zabýváte se tu blbostma...

Jak napsal Pavel Kankovsky

> To ti naši zatracení předci nemohli vymyslet o jedno originální jméno
> měsíce navíc? Nicméně je zajímavé, že podobnou blbost a dokonce
> u stejných měsíců udělali i Římané a to dokonce dodatečně, když měli
> nejdřív Iunius a Quintilis a druhý z nich přejmenovali na Iulius --
> a od nich to pak převzala většina Evropy.

A tuším to byl také Pavel, který mne před mnoha lety přivedl na blbý
nápad, napsat si vlastní funkci na kompletní počeštění a skloňování dnů
a měsíců v českém jazyce (za což mu pochopitelně děkuji) :-)
p.s.
Pavel měl a má stále blbé nápady :-)

A pokud si dobře pamatuju (a že mám paměť jako slon...), tak jsme se tu
prali s mnoha kódováními (Kameníci, ISO, jakési RU8, WIN-nepochopitelné...).

Dnes jste všichni rozmazleni UTF, a brečíte tu nad "čer" a "čec" :-)

Asi raději opravdu používat místo "%b" to "%m".
Jinak Vám nezbývá nic jiného, než si napsat vlastní "fci", kde si
naskloňujete cokolivdle Vaší libosti.

s přáním pěkného dne Jarda
0 new messages