[Article diapubliᅵ dans quatre groupes dont fr.usenet.documents,
avec suivi vers ce dernier groupe]
Bonjour,
J'aimerais discuter un peu de la doc intitulᅵe ᅵ Tables de caracteres
utilisees dans la hierarchie fr.* ᅵ, qui ᅵtait publiᅵe rᅵguliᅵrement
jusqu'ᅵ ce que le robot qui s'en chargeait tombe en panne en 2011.
ᅵ ma connaissance, la derniᅵre version publiᅵe est celle du 1er juin
2001, <
news:doc.cara...@talisker.lacave.net>, que l'on peut
retrouver par exemple ici :
<
http://al.howardknight.net/msgid.cgi?ID=135222658700>.
<cit.>
Les jeux de caractᅵres fortement recommandᅵs dans la hiᅵrarchie
francophone sont la table 7 bits us-ascii et les tables 8 bits
iso-8859-15 et iso-8859-1 (latin 9 et 1).
Il est possible d'utiliser maintenant la table Unicode UTF-8 quand
c'est utile ᅵ la bonne comprᅵhension de ce que l'on veut ᅵcrire.
Aucun autre jeu n'est autorisᅵ.
</cit.>
Si je souhaite revenir dessus, c'est ᅵ cause d'un acteur devenu
malheureusement incontournable pour Usenet en gᅵnᅵral et Usenet-fr
en particulier : Google groupes.
ᅵ cause de cet archiveur devenu simple passerelle web-news, on avait
dᅵjᅵ acceptᅵ que les articles soient encodᅵs en quoted-printable au
lieu de 8bit, parce que tous les articles qui en sortent -- et ils
sont nombreux -- sont en QP.
Or, depuis plusieurs mois, se pose un autre problᅵme : la plupart des
articles rᅵdigᅵs en iso-8859-15 ou iso-8859-1 et 8bit sont charcutᅵs
en arrivant chez Google groupes, tous les caractᅵres non-ASCII ᅵtant
remplacᅵs par des espaces. Au dᅵbut j'ai pensᅵ qu'il s'agissait d'un
bug temporaire et que les dᅵveloppeurs de GG l'auraient vite corrigᅵ,
mais visiblement ils s'en foutent. Ce problᅵme peut rendre un texte
en franᅵais illisible, ᅵ Maᅵtᅵ a dᅵjᅵ ᅵtᅵ aperᅵue ᅵ devenant ᅵ Ma t
a d j t aper ue ᅵ, mais aussi il peut amener ᅵ des contresens, par
exemple en maths, ᅵ 2 ᅵ x ᅵ (2 divisᅵ par x) devenant ᅵ 2 x ᅵ
(2 multipliᅵ par x).
Du coup, et avant de chercher quel autre robot pourrait s'occuper de
la publication de cette doc, j'aimerais discuter de la possibilitᅵ de
donner ᅵ UTF-8 un statut un peu plus ᅵ officiel ᅵ pour Usenet-fr, et
de l'autoriser mᅵme lorsque iso-8859-1 ou iso-8859-15 suffirait --
voire de le conseiller dans tous les cas.
Aprᅵs tout, cette norme existe depuis septembre 1992, ce qui fait dᅵjᅵ
plus de vingt ans (une ᅵternitᅵ ᅵ l'ᅵchelle de l'informatique), et
elle a ᅵtᅵ standardisᅵe peu aprᅵs. Elle est mᅵme devenu obligatoire
pour tous les nouveaux standards Internet, par dᅵfaut et non plus
comme une extension possible.
Donc voilᅵ, j'aimerais savoir s'il y a encore des rᅵticences ᅵ passer
sans restriction ᅵ UTF-8, que ce soit par raison idᅵologique (haine
envers Google par exemple) ou de confort (un dino utilisant un trᅵs
vieux nouvelleur jamais mis ᅵ jour et ne voulant pas en changer), ou
si au contraire Usenet-fr est enfin prᅵt, quelque treize ans aprᅵs
David Madore...
Cordialement,
--
Olivier Miakinen