Bonjour,
Pour mémoire voici les deux articles en question.
Celui de Jac avec MesNews :
<news:uqm92c$3hgcf$
1...@dont-email.me>
<
http://al.howardknight.net/?ID=170819270700>
La réponse de Ruprecht avec MacCafé :
<news:uqnae6$1ct4v$4...@news.usenet.ovh>
<
http://al.howardknight.net/?ID=170819255700>
Le 17/02/2024 12:14, M.V. a écrit :
> Dans le message <uqq2v3$24ts$
1...@cabale.usenet-fr.net>, Olivier Miakinen a écrit le 17 février 2024 à 11 h 49 :
>
>> Cet entête était donc INcorrectement encodé par MesNews. En effet, le
>> « î » de « île », encodé en UTF-8 par les octets C3 et AE, a son C3 codé
>> à la fin du premier encoded-word tandis que le AE est dans le début du
>> deuxième encoded-word. C'est spécifiquement interdit par le RFC2047, et
>> il est probable que j'aie déjà signalé le problème ici-même (mais je
>> l'avais oublié, mauvaise mémoire tout ça).
>
> Oui… au moins deux fois dans fcsmc : voir <news:uqq1jm$c1gk$
1...@dont-email.me>
>
>> MacCafé a donc bien raison de ne pas décoder les deux mots qui ressemblent
>> à des encoded-words mais qui n'en sont pas. Le vrai décodage de ce titre
>> devrait en réalité contenir cinq mots :
>> 1) Re:
>> 2) =?UTF-8?B?VW5lIMOpY3JpdHVyZSBub24gZMOpY2hpZmZyw6llIGRlIGzigJnD?=
>> 3) =?UTF-8?B?rmxlIGRlIFDDonF1ZXMgcG91cnJhaXQgw6p0cmUgYW50w6lyaWV1cmUgw6AgbGEg?=
>> 4) colonisation
>> 5) européenne
>>
>> Mais du coup, le titre rendu par MacCafé lors de la réponse n'est pas correct,
>> d'une part parce que le 3e mot a disparu,
>
> Pas tout à fait : il a traité les deux premiers encoded words en les
> laissant tels quels puisqu'ils sont mal foutus comme le fait mon décodeur
> puis en raboutant les 2 résultats :
> VW5lIMOpY3JpdHVyZSBub24gZMOpY2hpZmZyw6llIGRlIGzigJnDrmxlIGRlIFDDonF1ZXMgcG91cnJhaXQgw6p0cmUgYW50w6lyaWV1cmUgw6AgbGEg
Je ne suis pas d'accord. Dans la réponse faite par Ruprecht avec MacCafé, le
titre une fois décodé ne contient plus que trois mots au lieu de cinq, le
deuxième mot étant la concaténation des 2e et 4e mots de l'article d'origine
avec disparition complète du 3e mot :
1)"Re:"
2)"=?UTF-8?B?VW5lIMOpY3JpdHVyZSBub24gZMOpY2hpZmZyw6llIGRlIGzigJnD?=colonisation"
3)"européenne"
>> et d'autre part parce que le deuxième
>> mot se retrouve collé au quatrième, chose qui n'est permise (et même obligée)
>> *que* lorsque ce sont deux vrais encoded-words qui se suivent.
>
> Même chose ici : après avoir décodé
> =?UTF-8?B?Y29sb25pc2F0aW9uIGV1cm9ww6llbm5l?=
> MacCafé a collé le résultat à ce qui précède, tout comme le fait mon décodeur.
>
> Quand tu parles de « vrais encoded-words », faudrait alors que MacCafé
> et mon décodeur soient capables de distinguer un encoded-word
> correctement foutu d'un autre mal foutu.
C'est à la fois plus radical et plus simple. Une fois récupéré tous les mots
d'un champ d'entête, le logiciel doit décider pour chaque mot si, selon lui,
c'est ou non un encoded-word MIME. Si c'en est un, alors il le décode, et les
résultats du décodage de deux encoded-words de suite devront être collés. Si
ce n'en est pas un, il ne doit pas être décodé et il ne doit pas être collé
aux éventuels mots qui l'entourent.
Prenons un exemple : =?trucA?= =?trucB?= =?trucC?=
Si on considère que "=?trucA?=" doit se décoder en "A", que "=?trucB?=" doit
se décoder en "B" et que "=?trucC?=" doit se décoder en "C", alors le résultat
doit être "ABC" tout collé.
mais si ni "=?trucA?=" ni "=?trucB?=" ne sont considérés comme des encoded-words
alors le résultat doit être "=?trucA?= =?trucB?= C" et pas "=?trucA?==?trucB?=C"
ni (comme dans le cas présent) "=?trucA?=C".
Or là, il semble que MacCafé ait considéré d'une part que c'étaient des encoded-
words d'où le collage, et d'autre part que ce n'en était pas d'où l'absence de
décodage. L'oubli de celui du milieu est assez curieux dans tout ça, mais après
tout c'est forcément dû au fait que MacCafé est tombé dans un cas non prévu.
--
Olivier Miakinen