PdfTeX - accents

20 views
Skip to first unread message

Vincent Breton

unread,
Dec 1, 2021, 5:49:58 AM12/1/21
to
Bonjour,
J'expérimente certaines fonctionnalités de TeX. Mes lignes semblent
bient fonctionner sous XeTeX et LuaTeX mais pas sous PdfTeX. Qu'elles
sont les modifications à apporter pour que la lettre "é" soit affichée
sous PdfTeX et le source en TeX (pas en LaTeX).
Mon environnement TeXWorks est paramétré en UTF-8.

\catcode"00E9\active
\begingroup\lccode
`~="00E9\lowercase{
\endgroup
\def~}{\'e}

Test
é
été
\bye

Ulrike Fischer

unread,
Dec 1, 2021, 7:17:05 AM12/1/21
to

Vincent Belaïche

unread,
Jan 14, 2022, 6:33:24 AMJan 14
to
Ulrike Fischer <ne...@nililand.de> writes:

> Am Wed, 1 Dec 2021 11:49:56 +0100 schrieb Vincent Breton:
>
>> Bonjour,
>> J'expérimente certaines fonctionnalités de TeX. Mes lignes semblent
>> bien fonctionner sous XeTeX et LuaTeX mais pas sous PdfTeX. Quelles
>> sont les modifications à apporter pour que la lettre "é" soit affichée
>> sous PdfTeX et le source en TeX (pas en LaTeX).
>> Mon environnement TeXWorks est paramétré en UTF-8.
>>
>> \catcode"00E9\active
>> \begingroup\lccode
>> `~="00E9\lowercase{
>> \endgroup
>> \def~}{\'e}
>>
>> Test
>> é
>> été
>> \bye
>
> https://tex.stackexchange.com/a/51891/2388

Le problème de fond c'est que pdftex est un moteur 8bit, alors que UTF-8
représente les lettres accentuées sur plusieurs octets, c'est pourquoi
votre code fonctionne avec xetex/luatex qui comprennent un décodeur
UTF-8 en entrée, mais pas avec pdftex qui prend en entrée une suite
d'octets.

Sinon il y a un truc sans doute complètement obsolète, et qu'en tout cas
je n'ai jamais utilisé/essayé (car j'utilise toujours LaTeX ou Texinfo
et non TeX pour faire des documents), et que je ne conseille pas de
faire (à moins de vraiment vouloir expérimenter … ) c'est de ne pas
utiliser UTF-8 mais un codage 8bits où les caractères sont sur 1 octet
comme par ex. ISO-8859-15, et une fonte qui a un cassetin de glyphe (=
slot = № de glyphe) pour chaque caractère désiré dans le codage utilisé,
et ensuite compiler avec l'option -translate-file qui permet de rendre
des caractères représentés par les octets 127-255 imprimables (§10 du
manuel pdftex), et de mapper les numéros de caractères sur les cassetins
correspondant de la fonte utilisée.

Si vous tenez à éditer vos fichiers en UTF-8, vous pouvez rendre cette
approche encore plus indigeste en les convertissant dans le codage 8bit
que vous aurez choisi avec un utilitaire tel que iconv et compiler la
sortie de iconv avec (pdf)tex.


Une autre possibilité – toujours dans la veine des expérimentations sur
des choses obsolètes, c'est d'utiliser enctex (donc option -enc au lieu
de -translate-file à passer à pdftex), mais là non plus je n'ai jamais
essayé cela, et je ne conseille pas de le faire … là du coup vous
pourriez recoder des séquences d'octets UTF-8 en séquence de caractères
8bits et de séquences de contrôle.

M'enfin bref, serait-ce indiscret de vous demander pour quel usage vous
voulez utiliser pdftex sur du code source avec des caractères accentués
en UTF-8 ? Au risque d'être un peu brutal : quasiment personne n'écrit
de document comme cela.

V.


--
Reply all
Reply to author
Forward
0 new messages