Worin liegt eigentlich der Unterschied zwischen ISO-8859-1 und ANSI, wie
es beispielsweise in MS-Windows verwendet wird?
Sind es lediglich Zeichen wie der Halbgeviertstrich (ANSI: 150), für
dessen Code bei ISO nichts definiert ist? Oder gibt es auch noch
unterschiedliche Definitionen?
Weshalb sind bei ISO-8859-1 für einige Codes keine Zeichen definiert?
Bye,
Sven
--
Sven Christian Berger E-Mail: sv...@sven.mayday.nev.sub.de
PGP-KEY als Empfangsbestaetigung WWW: http://www.compronet.de/DaWa/sven/
Du meinst 128-159? Weil diese bei Streichen des höchsten Bits (was
mit alten Kisten durchaus vorkommt) zu Steuerzeuchen würden, und das
wäre mitunter etwas unerfreulich (wer schießt schon gerne 100 Blatt
Papier aus dem Drucker?).
Dieser Grund ist meiner Meinung nach nicht mehr ganz zeitgemäß, und
viele andere Zeichensätze nutzen diese 32 Zeichen mittlerweile.
cb
--
Chris Blum http://www.phil.uni-sb.de/~chris/ PGP encrypted mails welcome
> Worin liegt eigentlich der Unterschied zwischen ISO-8859-1 und ANSI, wie
> es beispielsweise in MS-Windows verwendet wird?
ISO-8859-1 ist eine internationale Norm, ANSI ist ein amerikanisches
Normungsgremium.
SCNR. :-)
Ich nehme an, daß irgendeine ANSI-Norm auf ISO-8859-1 verweist. ECMA-48
(euopäischer Nachfolger zu ANSI X3.64) tut das. In diesem Fall sind die
Zeichensätze identisch, und die Unterschiede von MS-Windows nicht norm-
gerecht. Es wäre eventuell hilfreich, wenn Du angeben würdest, *welche*
ANSI-Norm MS-Windows zu befolgen vorgibt.
Übrigens wird auch CP437 oftmals fälschlich als "ANSI" bezeichnet, von
den in BBS-Kreisen so beliebten "ANSI-Grafiken" her, die unweigerlich
CP437 benutzen.
> Weshalb sind bei ISO-8859-1 für einige Codes keine Zeichen definiert?
Analog zu 0x00 .. 0x1F sind die Codes 0x80 .. 0x9F für Steuerzeichen
reserviert. Ich weiß nicht, ob sie in ISO-8859-1 selbst auch belegt
sind, in ECMA-48 sind es alle außer 0x80, 0x81, 0x84, und 0x99. So ist
z.B. 0x9B CSI "control sequence introducer" (ersatzweise ESC [ in 7-bit
Umgebungen).
--
Christian 'naddy' Weisgerber na...@mips.pfalz.de
See another pointless homepage at <URL:http://home.pages.de/~naddy/>.
Was meinst Du mit ANSI? Du meinst sicher Microsoft Codepage 1252,
wie sie von Microsoft für Windows und Windows 95 z. B. in Zentraleuropa
verwendet wird.
> Sind es lediglich Zeichen wie der Halbgeviertstrich (ANSI: 150), für
> dessen Code bei ISO nichts definiert ist? Oder gibt es auch noch
> unterschiedliche Definitionen?
Die Unterschiede beginnen bei der Herkunft und enden beim Gültigkeits-
bereich. ISO 8859-1 ist ein internationaler Standard. Genaueres zu
diesem
Thema findest Du im Programmpaket
ftp://ftp.informatik.uni-erlangen.de/pub/doc/ISO/charsets/trans111.tar.gz
Dort findest eine auf ISO 10646 basierende Beschreibung einer Menge von
Zeichenkodierungen, u. a. auch ISO 8859 und Microsoft Codepages.
> Weshalb sind bei ISO-8859-1 für einige Codes keine Zeichen definiert?
Weil das bei 8-bit Terminals Steuerzeichen sind? Ich nehme doch an, Du
spielst auf die Kodes 0x80 bis 0x9F an, richtig?
Ciao
Kosta
--
kos...@acm.org, ko...@robin.de
Kosta Kostis, Talstr. 25, D-63322 Rödermark, Germany
http://ourworld.compuserve.com/homepages/kosta/
Beispielsweise ist ISO 8859-2 (deutsche und osteuropäische Zeichen)
durchgehend belegt.
Gruß - Wolfgang
--
*** This message was swisstimed by sntp://bernina.ethz.ch ***
*** Mon, 23 Dec 1996 12:37 +0100 ***
>Worin liegt eigentlich der Unterschied zwischen ISO-8859-1 und ANSI, wie
>es beispielsweise in MS-Windows verwendet wird?
Der "ANSI Zeichensatz" hiess frueher ANSI X3.134.2 und wurde inzwischen
umbenannt in ANSI/ISO 8859-1:1987.
Der "ANSI Zeichensatz" ist mit ISO 8859-1 identisch. Was MS-Windows
verwendet ist die "Code Page 1252" von Microsoft, die den
ANSI/ISO Zeichensatz im Bereich der C1 Steuerzeichen um einige
darstellbare Zeichen erweitert hat.
Code Page 1252 Tabelle mit den entsprechenden Unicode Positionen:
ftp://ftp.informatik.uni-erlangen.de/pub/doc/ISO/charsets/ucs-map-cp1252
>Weshalb sind bei ISO-8859-1 fuer einige Codes keine Zeichen definiert?
Es gibt einen Uraltstandard namens ISO 2022, der diesen Bereich fuer
weitere Steuercodes reserviert hat, und DEC VT320 Terminals benutzen das auch
intensiv.
Markus
---
Markus Kuhn, Computer Science grad student, Purdue
University, Indiana, US, email: ku...@cs.purdue.edu
: > Weshalb sind bei ISO-8859-1 für einige Codes keine Zeichen
: > definiert?
: Weil es sonst zu Problemen mit dem 8. Bit käme, wenn auf 7-Bit-
: Systemen aus Sonderzeichen zwischen 128 und 159 plötzlich
: Steuerzeichen zwischen 0 und 31 würden.
Was zu wirklich ätzenden Effekten führen kann. Ich habe irgendwann mal
aus Versehen eine Mail mit 0x80-Zeichen verschickt (das ist auf NeXT
der nbs, d.h. man merkt es nicht mal) und der Emfänger wunderte sich,
daß mache Zeilen einfach abgeschnitten waren. In den cp125x ist
wenigestens 0x80 nicht belegt.
Tschüß, Alexander
--
Alexander Lehmann, | "On the Internet,
al...@hal.rhein-main.de (MIME, NeXT) | nobody knows
leh...@mathematik.th-darmstadt.de (MIME) | you're a dog."
<URL:http://home.pages.de/~lehmann/>
Bei ISO 8859 (1-10) sind die Kode 0x80 bis 0x9F (oder 128 bis 159)
definitiv *nicht* belegt durch irgendwelche Zeichen. Das ist *Absicht*.
Die Zeichenkodierungen sind schließlich für 8-bit Terminals entwickelt
worden und diese benötigen Steuerzeichen, welche sowohl im Bereich
0x00 bis 0x1F (oder 0 bis 31) als auch im oben genannten Bereich Platz
gefunden haben.
Das gilt selbstverständlich auch für ISO 8859-2, was nicht etwa (nur)
für
"deutsche und osteuropäische" Zeichen vorgesehen ist (ich habe keine
Ahnung, wie jemand darauf kommt, daß Deutsch das Zentrum der Bemühungen
um Zeichenkodierungen sein könnte), sondern für:
ISO 8859-2 aka ECMA-94 aka LATIN ALPHABET No. 2
Albanisch, Tschechisch, Englisch, Deutsch, Ungarisch, Polnisch,
Rumänisch, Kroatisch, Slovakisch, Slovenisch und Schwedisch.
Unterschied ISO 8859-1 und ANSI?
> Du meinst sicher Microsoft-Codepage 1252
Ist das neu? Von einer CP 1252 hat man ja noch nie etwas gehört.
>oKosta
^
Sorry, aber Tabs sind nicht genormt.
Frohe Weihnachten!
Hans Fischer, Berlin
--
We do respond. Please resend unacknowledged mail.
>Übrigens wird auch CP 437 oftmals fälschlich als "ANSI" bezeichnet, von
>den in BBS-Kreisen so beliebten "ANSI-Grafiken" her, die unweigerlich
>CP 437 benutzen.
Du verwechselst Steuerbefehle für Terminals mit Zeichencodes. Beides hat
nichts miteinander zu tun - im Geigenstiel: "ANSI-Grafik" gibt es nicht
nur mit CP 437, sondern auch mit ISO 8859-1 und den verschiedensten an-
deren Zeichensätzen. In Befehlssätzen von Terminalsteuerungen kommen
keine Text- oder ähnliche Zeichen vor.
Danke für den Hinweis. Ich hatte meine Information aus der
OS/400-Dokumentation von IBM gezogen, die dort einen als ISO 8859-2
bezeichneten Zeichensatz abgedruckt haben. Dort ist z.B. 0x9D das große L
mit schrägem Querstrich, ein in Polen verwendetes Zeichen. MaW, die
abgedruckte Seite wäre komplett falsch.
> Albanisch, Tschechisch, Englisch, Deutsch, Ungarisch, Polnisch,
> Rumänisch, Kroatisch, Slovakisch, Slovenisch und Schwedisch.
Von Schwedisch abgesehen (Englisch zählt in diesem Zusammenhang nicht)
halte ich eine Beschreibung dieser Liste mit "Deutsch und Osteuropäisch"
für ziemlich treffend. Kulturimperialistische Absichten liegen mir im
übrigen ziemlich fern.
Frohe Weihnachten - Wolfgang
--
*** This message was swisstimed by sntp://bernina.ethz.ch ***
*** Wed, 25 Dec 1996 11:41 +0100 ***
> >Übrigens wird auch CP 437 oftmals fälschlich als "ANSI" bezeichnet, von
> >den in BBS-Kreisen so beliebten "ANSI-Grafiken" her, die unweigerlich
> >CP 437 benutzen.
> Du verwechselst Steuerbefehle für Terminals mit Zeichencodes. Beides hat
Im Gegenteil. Lies nochmal.
Genauer gesagt benutzen das alle 8-bit Terminals (nicht X11), die seit
dem VT320 rausgekommen sind, also auch VT340 und VT420 und wie sie alle
heißen... ;)
Oh, das werden die Albaner aber sicher nicht so gerne hören... ;)
Ich dachte mir schon, daß Du das nicht so meintest, aber es las
sich einfach ein wenig seltsam. =;^)
SB> Worin liegt eigentlich der Unterschied zwischen ISO-8859-1 und ANSI, wie
SB> es beispielsweise in MS-Windows verwendet wird?
In allen ISO-Zeichensaetzen ist der Bereich zwischen 128 und 159 leer.
Microsoft hat dort einige Zeichen untergebracht, mit der Windows Release
3.1 noch einige mehr.
SB> Weshalb sind bei ISO-8859-1 fnr einige Codes keine Zeichen definiert?
Damit hier die Steuercodes von 00 bis 31 verwendet werden koennen, ohne
dass eine Codeumschaltung bei einer nur 7 bit breiten Uebertragung gemacht
werden muss.
MfG,
Lnko Willms
/------------ L.WI...@LINK-F.rhein-main.de -- 1000...@compuserve.com
/------------ Lueko....@T-Online.de -- "Get PGP Key" im Betreff
## CrossPoint v3.11 R ##
> Ich würde das als Ostmitteleuropäisch (oder einfach nur
> Mitteleuropäisch) bezeichnen. Deutsch und Englisch sind hier
> übrigens überflüssig, für Englisch reicht eigentlich USASCII und
> für Deutsch hat sich ISO-8859-1 eingebürgert.
ich glaube es ist durchaus beabsichtigt, daß man außer mit ISO-8859-1
auch mit vielen (allen?) anderen ISO-8859-X Zeichensätzen deutsch
schreiben kann, sprich daß diese ebenfalls Ä, Ö, Ü, ä, ö, ü, ß
enthalten.
--
Georg Schwarz sch...@physik.tu-berlin.de, ku...@cs.tu-berlin.de
Institut für Theoretische Physik +49 30 314-24254, FAX -21130
Technische Universität Berlin http://home.pages.de/~schwarz/
Die Umlaute und ß gibt es bei:
ISO-8859-1/Latin 1 - West-Europa
ISO-8859-2/Latin 2 - Mittel-/Osteuropa
ISO-8859-3/Latin 3 - Türkei, Malta, Esperanto, Galizien(?)
ISO-8859-4/Latin 4 - Estland, Lettland, Litauen
ISO-8859-9/Latin 5 - wie Latin 1, wobei isländische durch türkische
Zeichen ersetzt sind
ISO-8859-10/Latin 6 - wie Latin 4, wobei grönländische und
lappische(?) Zeichen hinzukommen
Es gibt sie nicht bei den nicht-lateinischen Zeichensätzen:
ISO-8859-5 - Kyrillisch
ISO-8859-6 - Arabisch
ISO-8859-7 - Neugriechisch
ISO-8859-8 - Hebräisch
Diese Informationen sind der Webseite von Roman Czyborra entnommen
(http://user.cs.tu-berlin.de/~czyborra/charsets/).
Gruß - Wolfgang
--
*** This message was swisstimed by sntp://bernina.ethz.ch ***
*** Sat, 28 Dec 1996 16:53 +0100 ***
Braucht eigentlich nicht ungarisch zumindest das ö?
Gruß - Wolfgang
--
*** This message was swisstimed by sntp://bernina.ethz.ch ***
*** Sun, 29 Dec 1996 10:44 +0100 ***
KK> Das gilt selbstverstSndlich auch fnr ISO 8859-2, was nicht etwa (nur)
KK> fnr
KK> "deutsche und osteuropSische" Zeichen vorgesehen ist (ich habe keine
KK> Ahnung, wie jemand darauf kommt, da# Deutsch das Zentrum der Bemnhungen
KK> um Zeichenkodierungen sein k÷nnte), sondern fnr:
... tatsaechlich sind aber die sieben deutschen Sonderzeichen in allen
Varianten von ISO 8859 enthalten...
Ein in der Standardisierung aktiver Ex-Kollege wies in dem Zusammenhang
darauf hin, dass ein Deutscher (aus Hannover) in dem Normierungsgremium
sitze (vielleicht sogar als Rapporteur?).
>>Sorry, aber Tabs sind nicht genormt.
> warned that there is no standard set of positions, so tabs
> should be avoided if precise spacing is essential.
>
>Son of RfC 1036
Und wo ist der Widerspruch?
BTW: Dein Name ist plötzlich zerfleddert.
> Braucht eigentlich nicht ungarisch zumindest das ö?
So ich mich nicht irre, hat Ungarisch 'ö', 'ó', und eine Kombination
davon, also ein 'o' mit zwei länglichen Strichlein darüber. Weitere?
--
Christian 'naddy' Weisgerber na...@mips.pfalz.de
See another pointless homepage at <URL:http://home.pages.de/~naddy/>.
-- currently reading: Peter F. Hamilton, The Reality Dysfunction --
> Christian Weisgerber (na...@mips.pfalz.de) in <59jhag$4...@mips.pfalz.de>
>
> >Übrigens wird auch CP 437 oftmals fälschlich als "ANSI" bezeichnet, von
> >den in BBS-Kreisen so beliebten "ANSI-Grafiken" her, die unweigerlich
> >CP 437 benutzen.
>
> Du verwechselst Steuerbefehle für Terminals mit Zeichencodes. Beides hat
> nichts miteinander zu tun - im Geigenstiel: "ANSI-Grafik" gibt es nicht
> nur mit CP 437, sondern auch mit ISO 8859-1 und den verschiedensten an-
> deren Zeichensätzen. In Befehlssätzen von Terminalsteuerungen kommen
> keine Text- oder ähnliche Zeichen vor.
ANSI X3.64 - Befehlssatz für Terminalsteuerung - definiert zum Beispiel
"<CSI>H". Mit Deinen Worten wäre H kein Textzeichen.
Gut, man mag CP-437-Symbole und ANSI-Farbsteuersequenzen zusammen
verwenden. Aber damit müssen diese beiden Paar Schuhe noch nichts
miteinander zu tun haben. Die Bezeichnung "ANSI" ohne Spezifikation der
Norm ist ohnehin wenig aussagekräftig.
Gruß,
--
MATTHIAS ANDREE * Öffentlicher PGP-Schlüssel auf Anfrage verfügbar
Das ist nicht wahr. Sie sind nicht vorhanden bei:
ISO 8859-5 (Kyrillisch)
ISO 8859-6 (Arabisch)
ISO 8859-7 (Griechisch)
ISO 8859-8 (Hebräisch)
Wieso auch? Es gibt ja nicht nur latinische Alphabete. ;)
Sie sind allerdings bei allen LATIN Varianten mit den selben Kodes
vorhanden. Das ist zwar richtig, aber nicht, weil es *deutsche*
Sonderzeichen sind. Generell hat kein Zeichen zwei verschiedene
Kodes bei ISO 8859. Und generell wurde versucht unter möglichst
geringem Aufwand möglich viele Sprachen mit den Zeichensätzen
und -kodierungen abzudecken. Sein wir mal alle froh, daß es im
Deutschen im wesentlichen nur die oben erwähnten sieben Zeichen
gibt und nicht gleich ganze Alphabete fehlen. ;)
Guten Rutsch
> ## CrossPoint v3.11 R ##
Bitte abstellen. ("FAQ: XP in de.*" erhaeltlich in
de.newusers.questions, in de.comm.software.crosspoint,
als <URL:ftp://mvmpc9.ciw.uni-karlsruhe.de/faq/xp-faq>
oder von <faq...@flatta.in-berlin.de>, im Body "send
xp_defaq.arj" oder "send xp_defaq.zip".)