encodage

4 views
Skip to first unread message

Pierre

unread,
Aug 29, 2007, 8:54:39 AM8/29/07
to RT, ope...@googlegroups.com
Hello

je reviens sur l'encodage. On avait dit d'utiliser l'utf-8 car plus
simple si openDCF est multilingue.
Les fichiers sont actuellement en iso-8859-1
enfin je pense (commande file -i exécuté sous linux)
# file -i *
activer_lot.php: text/x-c++; charset=us-ascii
admin_xml.php: text/x-c++; charset=us-ascii
ajouter_cat.php: text/x-c++; charset=iso-8859-1
article_new.php: text/x-c++; charset=us-ascii
article_update.php: text/x-c++; charset=us-ascii
backup.php: text/x-c++; charset=us-ascii
backup_timeout.php: text/x-c++; charset=us-ascii
bon_fin.php: text/x-c++; charset=us-ascii
bon.php: text/x-c++; charset=iso-8859-1
bon_suite.php: text/x-c++; charset=iso-8859-1
ca_annee.php: text/x-c++; charset=iso-8859-1
-------------------------

les fichiers en "charset=us-ascii" ne contienne aucun caractère
accentué, donc file ne peux pas détecter l'encodage.


Si on veux passer en utf-8 il faut convertir tout les fichiers (ca je
doit pouvoir trouver un script qui le fait)

Mais qu'elle va etre l'inpact ?
1 : sur les infos enregistré dans la base de données ?
2 : Sur les caractères accentué des pdf ?

Quel est ton avis ?

Pierre

(PS : répond aussi sur ope...@googlegroups.com, faut que j'arrive à
savoir si ca marche ou pas ce truc :-( )


Pierre

unread,
Aug 29, 2007, 8:54:39 AM8/29/07
to RT, ope...@googlegroups.com

Pierre

unread,
Aug 29, 2007, 8:54:39 AM8/29/07
to RT, ope...@googlegroups.com

Pierre

unread,
Aug 29, 2007, 8:54:39 AM8/29/07
to RT, ope...@googlegroups.com

Pierre

unread,
Aug 29, 2007, 8:54:39 AM8/29/07
to RT, ope...@googlegroups.com

Flyer

unread,
Aug 30, 2007, 1:00:09 PM8/30/07
to OpenDCF
On 29 août, 14:54, Pierre <pie...@coustillas.com> wrote:

> Si on veux passer en utf-8 il faut convertir tout les fichiers (ca je
> doit pouvoir trouver un script qui le fait)

iconv --from XXX -to XXX * ==> man iconv ;)

>
> Mais qu'elle va etre l'inpact ?
> 1 : sur les infos enregistré dans la base de données ?

Il vaudrait mieux aussi convertir la BDD en UTF8. Dans le cas
contraire il faut paramétrer l'encodage utilisé
par la base de donnée puis le transmettre au driver de BDD au moment
de la connexion afin qu'il effectue
automatiquement les convertions BDD <=> application et inversement.

> 2 : Sur les caractères accentué des pdf ?

Aucun soucis avec les PDF ou alors je ne vois pas de quoi tu parle.

> (PS : répond aussi sur ope...@googlegroups.com, faut que j'arrive à
> savoir si ca marche ou pas ce truc :-( )

Ca fonctionne plus que prévu on dirait. Le message est arrivée 5 fois
dans gggroups (ou alors tu as fais une fausse manipe).

Flyer,

Flyer

unread,
Aug 30, 2007, 1:02:01 PM8/30/07
to OpenDCF
On 30 août, 19:00, Flyer <florent.guili...@gmail.com> wrote:

> Ca fonctionne plus que prévu on dirait. Le message est arrivée 5 fois
> dans gggroups (ou alors tu as fais une fausse manipe).

J'en profite confirmer que mon post a été instantané. Je suis resté
dans la partie web uniquement je n'ai pas utilisé l'interface mail. Ca
fait peut-être une différence.

Flyer,

Pierre

unread,
Aug 30, 2007, 1:19:54 PM8/30/07
to OpenDCF
Merci flyer pour toutes ces infos,
Mais je te pose aussi la question à toi, est il nécessaire de passer
en utf-8 ?

Merci

Pierre

unread,
Aug 30, 2007, 1:28:01 PM8/30/07
to ope...@googlegroups.com
En effet j'ai fait répondre par le site web à mon autre message, et c'est instantané.
J'essaye de répondre par mon client mail (peut etre est que la réponse est plus rapide, et que seulement les premiers messages sont long)


Flyer a écrit :

Pierre

unread,
Aug 30, 2007, 1:50:15 PM8/30/07
to ope...@googlegroups.com
en effet la réponse par le client mail est rapide.
Il semble donc que seul les premiers messages poster par un client mail
soient long.

Pierre a écrit :

Flyer

unread,
Aug 31, 2007, 10:37:57 AM8/31/07
to OpenDCF
On 30 août, 19:19, Pierre <pcoustil...@gmail.com> wrote:
> Merci flyer pour toutes ces infos,
> Mais je te pose aussi la question à toi, est il nécessaire de passer
> en utf-8 ?
>

Passer quoi exactement en UTF-8?

il y a :
- les pages web générée
- les fichiers sources
- les chaines de caractères manipulées par le code
- la base de donnée

Le plus simple et robuste pour le développeur c'est de:
- générer les page web en UTF8
- mettre tous les fichiers sources dans un même jeu de caractère (ça
peut très bien être ANSI, ISO-8859-1 ou UTF8). L'encodage des fichiers
sources n'a pas beaucoup d'importance.
- toujours utiliser UTF8 en interne, c'est à dire que tous les
programmes doivent considérer qu'ils manipulent des chaines de
caractères en UTF8. Si des données sont lues depuis l'extérieur il
faudra s'assurer qu'elle soient en UTF8 et les convertir à défaut. On
a ainsi un encodage pivot. Tout ce qui entre est converti en UTF8 et à
l'inverse tout ce qui sort est converti à partir d'UTF8
- avoir une base de donnée en UTF8 ainsi on est sûr de toujours
pouvoir enregistrer n'importe-quel caractère et de le récupérer en
l'état

Arrivé ici c'est le minimum et le plus simple qu'on puisse faire.

Seulement tout ceci fait un peu trop de contraintes pour
l'utilisateur. Il faudrait alors:
- rendre paramétrable l'encodage des page web générés et/ou se baser
sur l'entête Accept-Charset envoyé par le navigateur. Il faudra alors
convertir les pages de l'UTF8 (encodage interne) vers l'encodage
souhaité par le navigateur. Je suis sûr qu'il y a des modules qui
s'occupe déjà de faire tout ça.
- rendre paramétrable l'encodage de la base de donnée car les
utilisateurs ne peuvent pas toujours le choisir. Il leur est souvent
imposé. Ce cas est assez simple il suffit de paramétrer le driver de
connexion à la BDD et les transcodages dans les 2 sens sont
transparent.

Est-ce que j'ai oublié qq chose ?

Flyer,

Reply all
Reply to author
Forward
0 new messages