* Stefan Ram:
> Thomas Koenig <
tko...@netcologne.de> writes:
>>Quinn C <
lispa...@crommatograph.info> schrieb:
>>>Man sollte wohl an ein <ED><A0><B5><ED><B3><95>-Shirt denken.
>>Ich denke an ein <ED><A0><B5><ED><B3><95>-Shirt, aber irgendwie
>>will sich keine rechte Vorstellung einstellen.
>
> ED A0 B5 ED B3 95 gibt es in keiner üblichen Codierung.
>
> Es ergibt sich, wenn man die beiden Komponenten der UTF-16-
> Surrogatpaardarstellung eines Zeichens jeweils mit einer Art
> von UTF-8-Algorithmus codiert, der auf die Begrenzungen von
> UTF-8 keine Rücksicht nimmt, die eine solche UTF-8-Kodierung
> von Surrogatpaarkomponenten eigentlich nicht zulassen.
Das intendierte Zeichen (1D4D5) hat eigentlich die UTF-8-Kodierung F0 9D
93 95.
Wie gesagt, Dialog kann es selber nicht darstellen, aber wenn ich es von
Dialog zurück in andere Windows-Applikationen kopiere, funktioniert es
weiterhin.
Ich vermute mal vorsichtig, die seltsame Kodierung ist das Ergebnis der
mechanischen Anwendung des UTF-8-Algorithmus durch Dialog (das so hohe
Codepunkte nicht unterstützt) auf die Windows-interne Darstellung mit
UTF-16 und Surrogatepaaren.
[F'up2 de.comm.software.newsreader]
--
Learning the rules that govern intelligible speech is an
inculcation into normalized language, where the price of not
conforming is the loss of intelligibility itself.
-- Judith Butler