Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

problème d'encodage...

2 views
Skip to first unread message

Une Bévue

unread,
Dec 11, 2012, 11:19:07 AM12/11/12
to
J'ai un document HTML5 encodé en UTF-8, déclaré dans la balise meta
idoine, suivant :
<http://www.w3.org/International/questions/qa-html-encoding-declarations#html5charset>,
c'est à dire :
<!DOCTYPE html>
<html lang="fr">
<head>
<meta encoding="UTF-8">

l'encodage est donc bien dans les 1024 premiers caractères.

Spontanément, au lieu du o tréma ô de Möbius, Firefox Aurora et Google
Chrome m'affichent tout deux : ö.
Si je regarde côté navigateurs, effectivement, ils ont choisi de décoder
de l'ISO-8859-1.

Bon, je me dis, c'est peut-être Apache2 qui fait des siennes :
$ lynx -head -dump http://d620/X3Dom/x3dom_Inline_moeb.html
HTTP/1.1 200 OK
Date: Tue, 11 Dec 2012 16:01:52 GMT
Server: Apache/2.2.22 (Ubuntu)
Last-Modified: Tue, 11 Dec 2012 15:51:11 GMT
ETag: "541486-eca-4d095a6a7f1ff"
Accept-Ranges: bytes
Content-Length: 3786
Vary: Accept-Encoding
Connection: close
Content-Type: text/html

Est-ce que j'ai à faire qqc de spécial ?
Euh, je suis sûr de mon éditeur de texte, il enregistre toujours en UTF-8.

--
L'homme est imparfait, mais ce n'est pas étonnant
quand on pense à l'époque où il a été créé.
— Alphonse Allais

SAM

unread,
Dec 11, 2012, 11:33:36 AM12/11/12
to
Le 11/12/12 17:19, Une Bévue a écrit :
> J'ai un document HTML5 encodé en UTF-8, déclaré dans la balise meta
> idoine, suivant :
> <http://www.w3.org/International/questions/qa-html-encoding-declarations#html5charset>,
> c'est à dire :
> <!DOCTYPE html>
> <html lang="fr">
> <head>
> <meta encoding="UTF-8">

<meta encoding="UTF-8" />
???
W3SCHOOLS met un '/' sans doute à tord.

> l'encodage est donc bien dans les 1024 premiers caractères.

ce qui est curieux, c'est que le même chez Free.fr n'a pas ce blème
Möbius est correctement affiché

avec pour en-têtes :
Date: Tue, 11 Dec 2012 16:22:16 GMT
Server: Apache/ProXad [Apr 20 2012 15:06:05]
Last-Modified: Mon, 10 Dec 2012 21:22:22 GMT
Etag: "23d46e-c03-50c6528e"
Accept-Ranges: bytes
Content-Length: 3075
Content-Type: text/html

200 OK

> c'est peut-être Apache2 qui fait des siennes :
> $ lynx -head -dump http://d620/X3Dom/x3dom_Inline_moeb.html
> HTTP/1.1 200 OK
> Date: Tue, 11 Dec 2012 16:01:52 GMT
> Server: Apache/2.2.22 (Ubuntu)
> Last-Modified: Tue, 11 Dec 2012 15:51:11 GMT
> ETag: "541486-eca-4d095a6a7f1ff"
> Accept-Ranges: bytes

Ha! ce n'est pas le même fichier, il est bien plus long

> Content-Length: 3786
> Vary: Accept-Encoding

c'est quoi ce close ?

> Connection: close
> Content-Type: text/html

mets-le chez Free, pour voir...


--
Stéphane Moriaux avec/with iMac-intel

Olivier Miakinen

unread,
Dec 11, 2012, 7:12:02 PM12/11/12
to
Bonjour,

Le 11/12/2012 17:19, Une Bï¿œvue a ï¿œcrit :
> J'ai un document HTML5 encodᅵ en UTF-8, dᅵclarᅵ dans la balise meta
Puis :

> <meta encoding="UTF-8">

Relis bien attentivement ces deux choses, tu devrais bien finir par
trouver la diffï¿œrence entre les deux. ;-)

Olivier Miakinen

unread,
Dec 11, 2012, 7:18:31 PM12/11/12
to
Le 11/12/2012 17:33, SAM répondait à la Bévue (qui en l'occurrence
mérite bien le surnom qu'il s'est choisi) :
>
>> <!DOCTYPE html>
>> <html lang="fr">
>> <head>
>> <meta encoding="UTF-8">
>
> <meta encoding="UTF-8" />
> ???
> W3SCHOOLS met un '/' sans doute à tord.

Ça c'est tordu !

Si W3SCHOOLS met un '/', c'est probablement qu'il en est resté au XHTML
au lieu de passer à HTML 5, ce qui en soi est un tort...

>> c'est peut-être Apache2 qui fait des siennes :
>> $ lynx -head -dump http://d620/X3Dom/x3dom_Inline_moeb.html
>
> Ha! ce n'est pas le même fichier

En effet. C'était histoire de nous mettre sur une fausse piste, sans
doute. De toute manière, la Bévue n'a pas déclaré le jeu de caractères
conformément à la page de référence qu'il a jointe, il devrait donc
lui suffire de relire cette page et de corriger son code.

Cordialement,
--
Olivier Miakinen

SAM

unread,
Dec 11, 2012, 9:26:35 PM12/11/12
to
Le 12/12/12 01:18, Olivier Miakinen a écrit :
>
> la Bévue n'a pas déclaré le jeu de caractères
> conformément à la page de référence qu'il a jointe, il devrait donc
> lui suffire de relire cette page et de corriger son code.

C'est tellement é n o r m e que je ne l'avais pas vu !!!

Une Bévue

unread,
Dec 12, 2012, 12:26:27 AM12/12/12
to
Le 12/12/2012 01:12, Olivier Miakinen a écrit :
> Puis :
>
>> > <meta encoding="UTF-8">
> Relis bien attentivement ces deux choses, tu devrais bien finir par
> trouver la différence entre les deux.;-)
>
<meta charset="UTF-8">
______^^^^^^^_________


difficile à voir tout seul je suis passé à coté des ta s de fois.

Merci bien.

Léa Gris

unread,
Dec 12, 2012, 12:06:03 PM12/12/12
to
On 12/12/2012 01:18, Olivier Miakinen wrote:
> Si W3SCHOOLS met un '/', c'est probablement qu'il en est resté au XHTML
> au lieu de passer à HTML 5, ce qui en soi est un tort...

http://www.w3.org/QA/2008/01/html5-is-html-and-xml.html

HTML 5, un vocabulaire, deux sérialisations

Cela ne semble pas clair pour beaucoup de monde. Mettons les choses au
clair. HTML 5 peut être écrit en html et XML.

La spécification HTML 5 est la description d'un vocabulaire que vous
pouvez écrire avec deux syntaxes différentes (html et XML), selon vos
besoins en tant que programmeur, commercial ou selon les applications.
Les versions précédentes du vocabulaire HTML (HTML+, HTML 2.0, HTML 3.2)
on été écrites en utilisant les règles syntaxiques SGML. HTML 4 avait
déjà deux syntaxes : SGML (appelé HTML 4.01) et XML (appelé XHTML 1.0).

HTML 5 s'écrit selon deux syntaxes : html et XML. Comme SGML n'a jamais
été déployé dans les navigateurs et de nombreux outils de composition,
HTML 5 définit une nouvelle sérialisation appelée html, qui ressemble à
l'ancien SGML.

## Notes personnelles :
Un document HTML 5 sérialisé XML s'écrit idéalement comme suit :

<?xml version="1.0"?>
<!DOCTYPE html SYSTEM "about:legacy-compat">
<html xmlns="http://www.w3.org/1999/xhtml" lang="fr" xml:lang="fr">
<head>
<meta charset="UTF-8"/>
<title>HTML 5 sérialisé XML</title>
</head>
<body>
<p><img src="toto" alt="C'est toto"/></p>
<p>Ainsi de suite.</p>
</body>
</html>

Le prologue XML peut être omis pour compatibilité.

La sérialisation XML du html 5 est utile est indispensable si vous
effectuez des traitements XML de vos contenus.

<!DOCTYPE html SYSTEM "about:legacy-compat">
Est indispensable si vous effectuez des transformations XSLT.

C'est en particulier l'usage indispensable pour produire du html 5 avec
Symphony-CMS qui repose entièrement sur XML et les transformations XSL :
http://getsymphony.com/

--
Lea Gris

Une Bévue

unread,
Dec 12, 2012, 12:21:46 PM12/12/12
to
très intéressante cette remarque.
comme j'inclus généralement du x3d dans mes pages, j'aurais intérêt à
prendre la "version" xml de html5.

Olivier Miakinen

unread,
Dec 12, 2012, 5:14:27 PM12/12/12
to
Le 12/12/2012 18:06, Léa Gris m'a répondu :
>
>> Si W3SCHOOLS met un '/', c'est probablement qu'il en est resté au XHTML
>> au lieu de passer à HTML 5, ce qui en soi est un tort...
>
> http://www.w3.org/QA/2008/01/html5-is-html-and-xml.html
>
> HTML 5, un vocabulaire, deux sérialisations
>
> Cela ne semble pas clair pour beaucoup de monde. Mettons les choses au
> clair. HTML 5 peut être écrit en html et XML.
>
> [...]

Un grand merci pour ces précisions.

Cordialement,
--
Olivier Miakinen

Une Bévue

unread,
Dec 12, 2012, 6:05:07 PM12/12/12
to
Le 12/12/12 18:06, Léa Gris a écrit :
> On 12/12/2012 01:18, Olivier Miakinen wrote:
>> Si W3SCHOOLS met un '/', c'est probablement qu'il en est resté au XHTML
>> au lieu de passer à HTML 5, ce qui en soi est un tort...
>
> http://www.w3.org/QA/2008/01/html5-is-html-and-xml.html
>

ouais mais avec Google Chrome, ça ne marche pas correctement.
j'ai un fichier qui contient des styles css.

si je respecte la norme xml :
<style><![CDATA[ ... les styles ... ]]></style>

le seul style utilisé :
#the_element {
width: 50%;
height: 50%;
background:#000 url(/global/x3dom/starsbg.png);
}

n'est pas interprété par le navigateur.

si je ne met pas <![CDATA[...

idem

j'imagine que ce sera(it) la même chose pour le js ?

=> mettre style et js dans des fichiers externes.

SAM

unread,
Dec 14, 2012, 8:44:50 PM12/14/12
to
Le 13/12/12 00:05, Une Bévue a écrit :
>
> ouais mais avec Google Chrome, ça ne marche pas correctement.
> j'ai un fichier qui contient des styles css.
>
> si je respecte la norme xml :
> <style><![CDATA[ ... les styles ... ]]></style>

Je connais pas les "normes" mais j'ai lu qu'il fallait :

<style>/*<![CDATA[*/ ... les styles ... /*]]>*/</style>

> le seul style utilisé :
> #the_element {
> width: 50%;
> height: 50%;
> background:#000 url(/global/x3dom/starsbg.png);

Je ne sais si on peut ranger n'importe comment les trucs du background ...

'Strasbourg' ne s'écrit pas 'starsbg' ;-)

> }
>
> n'est pas interprété par le navigateur.
>
> si je ne met pas <![CDATA[...
>
> idem

alors ... peut-être :
<style type="text/css">
à l'ancienne mode ?

> j'imagine que ce sera(it) la même chose pour le js ?

Ça n'est pas certain.

> => mettre style et js dans des fichiers externes.

Il parait que c'est mieux
(surtout si c'est commun à plusieurs fichiers)

Une Bévue

unread,
Dec 16, 2012, 2:09:55 AM12/16/12
to
Le 15/12/2012 02:44, SAM a écrit :
>
> Je connais pas les "normes" mais j'ai lu qu'il fallait :
>
> <style>/*<![CDATA[*/ ... les styles ... /*]]>*/</style>

ah oui, bonne idée, amha c'est "compatible" xml, excepté que ça ajoute
un noeud texte, mais non lu dans ce cas.

>> le seul style utilisé :
>> #the_element {
>> width: 50%;
>> height: 50%;
>> background:#000 url(/global/x3dom/starsbg.png);
>
> Je ne sais si on peut ranger n'importe comment les trucs du background ...

euh, je ne pige pas à quoi tu fais allusion.

> alors ... peut-être :
> <style type="text/css">
> à l'ancienne mode ?

euh ça avait disparu ?
chez moi c'est un copié/collé (fautif?).
fotioufotipas le met' ?

>> j'imagine que ce sera(it) la même chose pour le js ?
>
> Ça n'est pas certain.
>
>> => mettre style et js dans des fichiers externes.
>
> Il parait que c'est mieux

certains prétendent qu'une partie du js doit être dans le document html,
je pense que c'est (peut-être) parce qu'il ne veulent pas utiliser
onload ???

> (surtout si c'est commun à plusieurs fichiers)

oui mais j'ai vu qu'avec WebGL, des types m'étaient du script (pas js
mais "webgl") juste avant la fermeture du body.

Pierre Goiffon

unread,
Dec 17, 2012, 4:37:10 AM12/17/12
to
Le 12/12/2012 18:06, Léa Gris a écrit :
> La sérialisation XML du html 5 est utile est indispensable si vous
> effectuez des traitements XML de vos contenus.

Associer indispensable avec cette condition trop vague ne me plait pas :
ce sont des cas très particuliers qui amènent à servir du XML aux UA !
Le XML est partout aujourd'hui, et on s'en accommode très bien sans
imposer du XML aux utilisateurs.

> C'est en particulier l'usage indispensable pour produire du html 5 avec
> Symphony-CMS qui repose entièrement sur XML et les transformations XSL :
> http://getsymphony.com/

Pourriez vous préciser ? Serait-ce les template qui sont lus par un
parser XML côté serveur ? Parce que ça n'empêche pas d'autres framework
de présentation de produire du HTML 4 (comme Wicket avec lequel les
produits de mon entreprise fonctionnent).

Léa Gris

unread,
Dec 17, 2012, 1:08:11 PM12/17/12
to
Le 17/12/2012 10:37, Pierre Goiffon a écrit :
> Pourriez vous préciser ? Serait-ce les template qui sont lus par un
> parser XML côté serveur ? Parce que ça n'empêche pas d'autres framework
> de présentation de produire du HTML 4 (comme Wicket avec lequel les
> produits de mon entreprise fonctionnent).

C'est surtout le traitement XSLT des templates effectivement qui pose
problème avec le HTML 5 sérialisé xml, surtout du fait du <DOCTYPE html>
Il y a toujours moyen de le produire ainsi :
<xsl:text disable-output-escaping='yes'>&lt;!DOCTYPE html></xsl:text>

Si vous voulez produire du html 5 sérialisé xml, le parseur XSLT par
produira par défaut un doctype pour xhtml 1.1.
Dans ce cas, l'option est d'utiliser le doctype
system="about:legacy-compat".

Ces remarques concernant en particulier la libxslt.

Pour sortir du HTML 4.01 avec la output method html ou du xhtml avec
output method xml, il n'y a effectivement pas toutes ces considérations.

--
Lea Gris
0 new messages