Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

Test de page Windows 1252 (lecture sous Mac ou Linux)

1 view
Skip to first unread message

Denis Beauregard

unread,
Jul 13, 2011, 12:47:02 PM7/13/11
to
Bonjour,

En changeant la configuration de mon site après reconfiguration
par l'hébergeur, j'ai constaté la présence de caractères propres
à Windows 1252 et qui ne sont pas rendus correctement en ISO.

J'ai identifié la page suivante par hasard et je ne sais pas comment
je pourrais trouver les autres pages avec des apostrophes françaises.

http://www.francogene.com/rech-fr/dep-fr.php

Je voudrais savoir si le texte suivant (aux 2/3 du tableau) est bien
affiché sur un Mac ou sur Linux.

======

Départements disparus ou renommés
Les pays indiqués sont ceux d’aujourd’hui. À l’époque du changement,
la carte de l’Europe était très différente de celle d’aujourd’hui et
plusieurs pays étaient morcelés. Les changements récents se font en
deux temps: un vote et un changement réel des frontières ou du nom.

======

Si je recherche ’ avec l'outil de recherche de Windows 7, il en trouve
dans tous les fichiers, donc impossible pour le moment de trouver
quelles sont les pages problématiques. Je pourrais sans doute passer
progressivement à du UTF8 mais cela demandera beaucoup de temps...
Seamonkey a au moins l'effet secondaire de transformer en entités les
lettres accentuées, ce qui rend le charset non critique.

En passant, j'aimerais bien savoir comment configurer Windows 7 pour
que Seamonkey édite un fichier directement (sans faire le ctrl-E).


Denis

Dominique Ottello

unread,
Jul 13, 2011, 1:30:22 PM7/13/11
to
Denis Beauregard <denis.b-at-franc...@nospam.com.invalid>
écrivait :

> J'ai identifié la page suivante par hasard et je ne sais pas comment
> je pourrais trouver les autres pages avec des apostrophes françaises.

Utiliser un éditeur de texte capable d'effectuer des recherches
multicritères sur des fichiers multiples.
J'utilise UltraEdit et je viens de faire un essai :
il est capable de retrouver les apostrophes typographiques CP-1252
ouvrantes ‘ (Alt-0145) ou fermantes ’ (Alt-0146) dans 12193 fichiers en
moins de quinze secondes.

D'ailleurs, merci ; ça m'a permis de voir qu'il m'en restait encore dans
trois fichiers.

UltraEdit est payant, mais Notepad++ devrait pouvoir le faire.
--
Ce n'est pas parce qu'ils sont nombreux à avoir tort
qu'ils ont forcément raison. Coluche

Message has been deleted
Message has been deleted

SAM

unread,
Jul 13, 2011, 3:10:43 PM7/13/11
to
Le 13/07/11 19:30, Dominique Ottello a écrit :

> Denis Beauregard<denis.b-at-franc...@nospam.com.invalid>
> écrivait :
>
>> J'ai identifié la page suivante par hasard et je ne sais pas comment
>> je pourrais trouver les autres pages avec des apostrophes françaises.

Bon, on a vu qu'elle passait bien maintenant ...

> Utiliser un éditeur de texte capable d'effectuer des recherches
> multicritères sur des fichiers multiples.

(...)


> UltraEdit est payant, mais Notepad++ devrait pouvoir le faire.

BBEdit (sur Mac) devrait pouvoir le faire directement sur le serveur.
Mébon ... c'est un soft payant et ... pas prévu pour Windows.

--
Stéphane Moriaux avec/with iMac-intel

Sergio

unread,
Jul 14, 2011, 2:52:18 AM7/14/11
to
Le 13/07/2011 18:47, Denis Beauregard a écrit :
>

> Si je recherche ’ avec l'outil de recherche de Windows 7, il en trouve
> dans tous les fichiers, donc impossible pour le moment de trouver
> quelles sont les pages problématiques. Je pourrais sans doute passer

FINDSTR en ligne de commande :

FINDSTR /S "’" *.php

> progressivement à du UTF8 mais cela demandera beaucoup de temps...
> Seamonkey a au moins l'effet secondaire de transformer en entités les
> lettres accentuées, ce qui rend le charset non critique.
>
> En passant, j'aimerais bien savoir comment configurer Windows 7 pour
> que Seamonkey édite un fichier directement (sans faire le ctrl-E).


--
Serge http://leserged.online.fr/
Mon blog: http://cahierdesergio.free.fr/
Soutenez le libre: http://www.framasoft.org

Denis Beauregard

unread,
Jul 14, 2011, 9:08:18 AM7/14/11
to
Le Thu, 14 Jul 2011 08:52:18 +0200, Sergio
<serge....@delbono.net.invalid> écrivait dans
fr.comp.infosystemes.www.auteurs:

>Le 13/07/2011 18:47, Denis Beauregard a écrit :
>>
>
>> Si je recherche ’ avec l'outil de recherche de Windows 7, il en trouve
>> dans tous les fichiers, donc impossible pour le moment de trouver
>> quelles sont les pages problématiques. Je pourrais sans doute passer
>
>FINDSTR en ligne de commande :
>
>FINDSTR /S "’" *.php

Merci beaucoup !

Il y a toutefois un léger problème. Cela détecte presque 16 000 lignes
mais en regardant de près (avec le bloc-notes), ce caractère ne se
trouve que 16 fois. FINDSTR ne fait pas la distinction entre les deux
caractères. Ce sera un peu plus compliqué mais comme je peux réunir en
2 étapes toutes les lignes puis identifier les bonnes lignes, je vais
pouvoir modifier mon site et passer de Windows 1252 à du vrai ISO.


Denis

Lea Gris

unread,
Jul 14, 2011, 4:06:01 PM7/14/11
to
Le 14/07/2011 15:08, Denis Beauregard a écrit :

> Il y a toutefois un léger problème. Cela détecte presque 16 000 lignes
> mais en regardant de près (avec le bloc-notes), ce caractère ne se
> trouve que 16 fois. FINDSTR ne fait pas la distinction entre les deux
> caractères. Ce sera un peu plus compliqué mais comme je peux réunir en
> 2 étapes toutes les lignes puis identifier les bonnes lignes, je vais
> pouvoir modifier mon site et passer de Windows 1252 à du vrai ISO.

Avec un shell unix ça serait vite réglé :

perl -pi -e 's/’/\'' *.php
find . -type -f -name *\.php -exec recode iso-8859-1...UTF-8
perl -pi -e 's/iso-8859-1/utf-8/' *.php

--
Lea Gris

Denis Beauregard

unread,
Jul 14, 2011, 4:19:19 PM7/14/11
to
Le Thu, 14 Jul 2011 22:06:01 +0200, Lea Gris <l...@nomail.invalid>
écrivait dans fr.comp.infosystemes.www.auteurs:

Malheureusement, je n'arrive pas à faire communiquer mon PC avec
Windows 7 avec mon autre PC qui a un Linux Debian mal configuré
(et que je n'ai pas pu remplacé par un Kubuntu l'an dernier).


Denis

Olivier Miakinen

unread,
Jul 15, 2011, 5:35:27 AM7/15/11
to
Bonjour,

Le 13/07/2011 18:47, Denis Beauregard a écrit :
>

> En changeant la configuration de mon site après reconfiguration
> par l'hébergeur, j'ai constaté la présence de caractères propres
> à Windows 1252 et qui ne sont pas rendus correctement en ISO.
>
> J'ai identifié la page suivante par hasard et je ne sais pas comment
> je pourrais trouver les autres pages avec des apostrophes françaises.
>
> http://www.francogene.com/rech-fr/dep-fr.php

http://validator.w3.org/check?uri=http%3A%2F%2Fwww.francogene.com%2Frech-fr%2Fdep-fr.php&charset=(detect+automatically)&doctype=Inline&group=0

<cit.>
Line 1031, Column 37: non SGML character number 146

Les pays indiqu&eacute;s sont ceux d’aujourd’hui. &Agrave; l’&eacute;poque
</cit.>

Rigolo : les caractères accentués « é » et « À » sont encodés alors
qu'ils n'en auraient pas besoin, tandis que l'apostrophe typographique
ne l'est pas alors qu'elle le devrait.

> Je voudrais savoir si le texte suivant (aux 2/3 du tableau) est bien
> affiché sur un Mac ou sur Linux.

Mon SeaMonkey sur Linux contourne le bug, et l'affiche comme si c'était
du cp1252 bien qu'il s'agisse d'iso-8859-1. Il n'en reste pas moins que
la page est incorrecte (et pas seulement à cause du charset : voir le
doctype).

> Si je recherche ’ avec l'outil de recherche de Windows 7, il en trouve
> dans tous les fichiers, donc impossible pour le moment de trouver
> quelles sont les pages problématiques.

Je ne connais pas cet outil de recherche de Windows 7, mais j'ai déjà
eu de mauvaises expériences avec des outils de recherche sur Windows.
As-tu déjà envisagé d'installer des outils de type Unix (GNU) sur ton
Windows ? <http://www.cygwin.com/>.

Cordialement,
--
Olivier Miakinen

Olivier Miakinen

unread,
Jul 15, 2011, 5:38:33 AM7/15/11
to
Le 14/07/2011 22:19, Denis Beauregard a écrit :
>>
>>Avec un shell unix ça serait vite réglé :
>>
>>perl -pi -e 's/’/\'' *.php
>>find . -type -f -name *\.php -exec recode iso-8859-1...UTF-8
>>perl -pi -e 's/iso-8859-1/utf-8/' *.php
>
> Malheureusement, je n'arrive pas à faire communiquer mon PC avec
> Windows 7 avec mon autre PC qui a un Linux Debian mal configuré
> (et que je n'ai pas pu remplacé par un Kubuntu l'an dernier).

http://www.cygwin.com/

Pierre Goiffon

unread,
Jul 15, 2011, 6:01:35 AM7/15/11
to
On 13/07/2011 19:30, Dominique Ottello wrote:
>> J'ai identifié la page suivante par hasard et je ne sais pas comment
>> je pourrais trouver les autres pages avec des apostrophes françaises.
>
> Utiliser un éditeur de texte capable d'effectuer des recherches
> multicritères sur des fichiers multiples.
> J'utilise UltraEdit et je viens de faire un essai :

Il existe des outils de chercher/remplacer performants sur Windows en
freeware. je me souviens de BKReplaceEm, que j'avais remplacé par un
outil plus complet dont je n'arrive pas à me souvenir du nom... Euh je
regarderai à la maison et je reviens !

0 new messages