Louis Noser <
louis...@gmx.ch> writes:
> Am 08.01.2016 um 14:43 schrieb Sebastian Suchanek:
>> Du fängst schon wieder an, Zeichensatz und Schriftart
>> durcheinander zu werfen...
>
> Klar. Weil Ihr nicht sagt, wie die Zuordnung "65" gleich "A"
> abgespeichert ist.
Die Antwort ist schwierig.
Die Aussage „Im ASCII wird der Zahl 65 der Buchstabe ‚A‘
zugeordnet und umgekehrt“ meint mit „Buchstabe ‚A‘“ – wie Martin
Wohlauer geschrieben hat – keine Beschreibung der schrägen und
waagerechten Linien sondern das, was der Lehrer im
Deutschunterricht beim Diktat abfragt, also die Bedeuting dieser
drei Linien: Dem Lehrer ist es egal, ob die Schüler den
diktierten Text in Schreib‐ oder Druckschrift aufgeschrieben haben
oder ob die Schrift nun 5 oder 10 Millimeter hoch ist. Wichtig
ist für den Lehrer nur, dass er die Buchstaben, also die Bedeutung
der Linien, erkennen kann (indem die Schüler leserlich schreiben).
Die Schüler könnten ihm den Text auch als E‐Mail schicken. Und
wenn der Text dabei in ASCII kodiert ist, kommt in der
E‐Mail‐Nachricht beim Lehrer tatsächlich die Zahl 65 an. Der
Rechner entnimmt dann der Nachricht die Information, dass sie
(beispielsweise) im ASCII kodiert ist und ist dann so nett, statt
dem Lehrer die Zahl 65 über den PC‐Lautsprecher zuzumorsen, die an
der 65sten Position der Schriftart hinterlegte Beschreibung der
Linien zu befolgen und so ein „A“ in der vom Lehrer ausgewählten
Schriftart anzuzeigen.
Meines Wissens gibt es keine allgemein vereinbarte Kodierung, mit
der man diese Bedeutung der drei Linien im Rechner abspeichern
könnte: Die Rechner der Schüler können dem des Lehrers demnach
nicht die Bedeutung „A“ übermitteln. Statt dessen übermitteln sie
ihm: „In der Zeichenkodierung ASCII hat das Zeichen die Nummer
65“.
Das heißt, sie müssen eine Zeichenkodierung verwenden, die auch
dem Rechner des Lehrers bekannt ist. Dann können sie als Ersatz
für die nicht zu fassende Bedeutung „A“ die Nummer in der
bekannten Zeichenkodierung übermitteln.
> Wird dem Byte mit dem Wert "65" im Zeichensatz vielleicht die
> Position zugeordnet, an der in der Schriftart "A" definiert ist
> oder wie genau funktioniert "65 = A"? (65 als Byte ist klar,
> aber "A"? Was wird anstelle von "A" abgelegt?)
Ich vermute, die 65 ist bereits die Position in der Schriftart, an
der sich eine passende (grafische oder anders geartete)
Darstellung des Buchstabens „A“ befindet. (Aber ich kenne mich
mit Schriftarten nicht aus.)
Angenommen, es gäbe die Zeichenkodierung BSCII, ähnlich dem ASCII,
die sich vom ASCII nur darin unterscheidet, dass die
Großbuchstaben „A“ und „B“ miteinander und ebenso auch die
Kleinbuchstaben „a“ und „b“ vertauscht sind.
Und weiter angenommen, es gäbe die Schriftart Helvetib, die sich
von der Schriftart Helvetia nur dadurch unterscheidet, dass darin
ein „A“ wie ein Helvetia‐„B“ und ein „B“ wie ein Helvetia‐„A“
aussieht (und entsprechendes auch bei den Kleinbuchstaben).
Dann würde sich im Rechner die Tabelle für die Schriftart Helvetia
in der Zeichenkodierung ASCII von der Tabelle für die Schriftart
Helvetib in der Zeichenkodierung BSCII nicht unterscheiden
(allenfalls darin, dass bei der Tabelle jeweils der Name der
Schriftart und die Zeichenkodierung vermerkt ist): In beiden
Tabellen stimmten die Beschreibungen der Linien sowohl an der
Position 65 als auch an den Positionen 66, 97 und 98 überein.
Und weiter angenommen, ein Schüler würde im Diktat statt „Der Bub
schreit: "Aua!"“ „Der Aua schreit: "Bub!"“ schreiben, seinen Text
aber in der Zeichenkodierung BSCII übermitteln.
Dann würde der Lehrer, wenn sein Rechner die Zeichenkodierung
BSCII nicht beachtete, sondern einfach so täte, als wäre der Text
in ASCII kodiert, einen Text auf dem Bildschirm sehen, der genau
so aussieht wie ein in der Zeichenkodierung ASCII geschriebenes
„Der Bub schreit: "Aua!"“.
Trotzdem müsste er aber eigentlich zwei falsch geschriebene Wörter
ankreiden.
Und damit er das auch erkennt, ist sein Mailerprogramm gut
beraten, die mitgeschickte Information über die Zeichenkodierung
(„Dieser Text ist im BSCII kodiert“) zu beachten, indem es eine
Tabelle zu Rate zieht, in der beschrieben ist, wie Texte aus BSCII
in ASCII umzuwandeln sind, nämlich: „Aus Nummer 65 mach Nummer
66, aus Nummer 66 mach Nummer 65, aus Nummer 97 mach Nummer 98,
aus Nummer 98 mach Nummer 97. Alle anderen Nummern lass
unverändert.“ Anschließend kann es den Text, den es jetzt in der
Zeichenkodierung ASCII vorliegen hat, mit der Schriftart Helvetia
auf dem Bildschirm darstellen.
Beachte: In der Umsetzungstabelle von BSCII zu ASCII kommen keine
Bedeutungen „A“ oder „B“ vor. Lediglich die Nummern werden
einander zugeordnet.
Im Zeitalter von Unicode, einer Zeichenkodierung, die es sich zum
Ziel gesetzt hat, alle Zeichen aller Sprachen in einem gemeinsamen
Zeichensatz zu sammeln, kann man Unicode als eine Möglichkeit
ansehen, zu erfassen, was die waagerechte und die zwei schrägen
Linien, die an eine Bockleiter erinnern, bedeuten. Aber auch hier
wird man im Rechner nichts anderes als die Zahl 65 finden. Es
gibt keine Tabelle, in der die 65 einer irgendwie gefassten
Bedeutung dieser drei Linien zugeordnet wäre.
Der Buchstabe, bestehend aus dem Kleinbuchstaben „a“ mit zwei
Punkten darüber, wo Du Sebastian Suchanek mit
>> Du fängst
zitierst, ist in Deinem Artikel, auf den ich hier antworte, in der
Zeichenkodierung iso_8859-15 mit der Nummer 228 kodiert.
Mein Artikel wird (vermutlich) in der Zeichenkodierung utf-8
verfasst sein. Dort wird an der entsprechenden Stelle im Text
eine andere Nummer, bestehend aus mindestens zwei Bytes, stehen:
Mein Newsreader setzt die Zeichenkodierung iso_8859-15 Deines
Artikels, aus dem er das Zitat genommen hat, in utf-8 um. (Das
tut er, weil ich Zeichen verwendet habe, die in der
iso_8859‐15‐Zeichenkodierung nicht enthalten sind.)
Die Bedeutung des Zeichens bleibt gleich, die Kodierung ändert
sich.