Doug713705
unread,Jan 18, 2024, 3:23:28 AM1/18/24You do not have permission to delete messages in this group
Either email addresses are anonymous for this group or you need the view member email addresses permission to view the original message
to
Bonjour à toutes et tous,
Je suis en train de coder un petite app en Python dont l'objectif et de
traiter des mails de diverses provenances dont Usenet.
Ça fait maintenant quelques années que je me suis éloigné d'Usenet et
j'ai complètement oublié tout ce que je pouvais savoir sur les
subtilités et pièges qui se cachent derrière les notions de charset,
d'encodage et de type MIME.
En clair, je lutte pour décoder de manière fiable les articles en
provenance d'Usenet lorsque le corps d'un article est encodé en utf-8 et
publié en Quoted-Printable. Ça devient le bazar avec des "=" en fin de
ligne qui se mélangent avec ceux des caractères encodés en UTF-8.
Autre interrogation, je suppose que les entêtes (headers) d'un article
sont systématiquement en iso-8859-1 sauf le sujet qui peut être en UTF-8
Quoted-Printable. J'ai bon ?
Vous l'aurez compris, j'ai besoin qu'on me raffraichisse la mémoire sur
comment décoder tout ce fatras. Un lien vers une documentation, voire
des exemples, seraient bienvenus.
À votre bon coeur :)
XP fr.comp.usenet.serveurs et fr.comp.mail
FU2 fr.comp.usenet.lecteurs-de-news
--
Doug
Envoyé depuis mon Jacob Delafon 3000 Turbo