*Michael Bäuerle* meinte:
> Thomas Barghahn wrote:
>> *Michael Bäuerle* meinte:
>>> Bei Unicode reicht das noch nicht.
>>> Da muss man nach der Dekodierung auch noch normalisieren.
>> Bei solchen Schritten (Normalisierung) muss ich dann wirklich immer
>> ehrlich bleiben und zugeben, dass ich es (noch) nicht richtig verstanden
>> habe! Was genau passiert bei einer Normalisierung eigentlich und was ist
>> das Ziel einer solchen Normalisierung?
> Unicode erlaubt es mehrere Codepoints zu verwenden, um eine Glyphe für
> die Anzeige zu bilden. Es ist z.B. möglich einen Umlaut aus dem Basis-
> buchstabe und dem Codepoint COMBINING DIAERESIS (U+0308) zu bilden.
> Kombinierende Codepoints werden mit dem davor stehenden Basiszeichen
> verbunden, die Reihenfolge für z.B. "Ä" muss also so aussehen:
> [...]
Zunächst einmal Vielen herzlich Dank(!) für all die Beiträge, die zu
diesem Thema auch von Heiko und Marcel gepostet wurden.
Anhand all dieser Beispiele und detaillieretn Information fällt es nicht
schwer, die Problematik "Normalisierung" zu durchschauen und somit auch
letztendlich zu verstehen.
Richtig bewusst und auch klar wurde mir diese Thematik mit dem ein-
fachsten Beispiel in dieser Diskussion, dem "ö", welches Heiko zur
Veranschaulichung eingebracht hatte. Dieses "ö", welches einst ein
zusammengesetztes Zeichen war, wurde während dieser Diskussion nämlich
"normalisiert". Ein besseres Beispiel kann es also gar nicht geben, denn
so konnte man den "Vorgang" /hautnah/ miterleben. :-)
Auch wurde mir nun der Sinn jener Normalisierung erstmalig richtig be-
wusst. Ein Vergleich zweier Zeichen, welche "nur" unterschiedlich auf-
gebaut sind, für den Leser aber exakt die gleiche Bedeutung als auch ein
gleiches Aussehen haben, der sollte schon funktionieren. So wurde mir
also nun ebenfalls klar, warum ein Subjekt nach der Dekodierung zunächst
"normalisiert" werden sollte, bevor man es mit einem anderen Subjekt
vergleichen will bzw. muss.
| Ja, flnews versendet NFC gemäß RFC 5198 (Kapitel 2, Punkt 4):
|
| > <
https://www.rfc-editor.org/rfc/rfc5198#section-2>
| |
| | 4. Before transmission, all character sequences SHOULD be normalized
| | according to Unicode normalization form "NFC" (see Section 3).
Bei der "Vielzahl" von NRn, welche ich stets beobachte ;-), fällt nach
all der Lektüre nun auf, dass sich allein nur flnews an den obigen RFC
hält, was ich im Detail aber noch genauer prüfen muss und auch prüfen
werde.
Klar ist aber jetzt schon, dass der NR Dialog solch eine Normalisierung
*nicht* durchführt! Wie sollte er auch(?), wenn der Autor des Konverters
noch nicht einmal wusste, was sich hinter diesem Vorgang eigentlich ver-
birgt. ;-)
Nochmals Vielen herzlichen Dank(!) für all die Beiträge, welche mir
*alle* den Vorgang "Normalisierung" bzgl. Unicode deutlich näher gebracht
haben!
Thomas 😷
--
== S E N D E Z E I T ==============
DATUM : Montag, 03. Juli 2023
UHRZEIT: 12:39:41 UHR (MESZ)
== Heute: 'Iss Deine Bohnen' Tag ==