w artykule <
news:4be2b023-2118-399...@wsisiz.edu.pl> pisze:
> On Sun, 21 Mar 2021, Andrzej P. Wozniak wrote:
>
>>> Ale skoro zmieniło się zalecenie i przestało to być obowiązujące to w
>>> nagłówku tego RFC nie powinna się znaleźć informacja: "obsoleted
>>> by..."
>> Jest też plik RFCs_for_errata.txt, gdzie jest lista dokumentów z
>> poprawkami. Są w nim RFC2045, 2046, 2047 i 2049. Poprawki z
>> wyjaśnieniem są w podkatalogu inline-errata.
>
> No dobrze, ale ja w dalszym ciągu nie rozumiem, który z ww dokumentów
> i w którym miejscu unieważnia RFC 2046 w całości lub choćby w części
> p. 4.1.2.
Nie rozumiesz słów "updates" i "errata", prawda? Nie "zastąpiony,
unieważniony", tylko "zaktualizowany, uzupełniony, poprawiony".
Przejrzałeś chociaż wszystkie wskazane RFC z tego wieku?
Nie mam teraz czasu, żeby odrabiać za kogoś lekcje, więc jakieś cytaty
mogę wrzucić najwcześniej po świętach.
Wyjaśniam sens ogólny:
1. Każdy zestaw znaków zawiera zestaw US-ASCII jako podzbiór. Dotyczy to
m.in. zestawów iso-8859-x i zestawu utf-8 (zawsze z kreską).
2. Oprócz tego cały zestaw iso-8859-1 (ale tylko ten z iso-8859-x) jest
zgodny pod względem numeracji znaków z zestawem utf-8, co daje możliwość
3. Zalecenie należy rozumieć jako zalecenie maksymalnej kompatybilności
wstecznej z pocztą sprzed MIME, a nie zalecenie minimalnego kodowania. To
samo zalecenie dotyczy też kodowania transportowego (ale to inna para
kaloszy).
Automatycznie i zawsze poprawnie można osiągnąć tylko przypadki opisane w
następnym zdaniu. Jeśli nie ma znaków 8-bitowych, tylko 7-bitowe us-ascii,
można tekst w dowolnym języku (bazującym na łacinie) wysłać bez
jakiejkolwiek deklaracji MIME. W szczególności dotyczy to przypadku
opisanego w cytowanym punkcie.
Ze względu na historię rozwoju Unikodu brak pełnej jednoznaczności
kodowania i dalej automagicznie nie da się zrobić już nic. Jeśli tekst w
UTF-8 zawiera tylko znaki z iso-8859-1, w większości przypadków można go
wysłać jako iso-8859-1 (mają zgodny początek tablicy znaków), ale nie
zawsze. W praktyce jedynym znakiem 8-bitowym może być znak "ó", który
występuje również w iso-8859-2, a wtedy automat nawala.
Oznacza to w najprostszym ujęciu, że w cytowanym punkcie zamiast
iso-8859-1 trzeba po prostu wstawić utf-8.