Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

kyrillische Zeichen aus Unicode in "normalen" wandeln

289 views
Skip to first unread message

Martin Ernst

unread,
Sep 26, 2002, 11:50:13 AM9/26/02
to
Hallo.

Ich habe eine Word 2000 Datei, die in kyrillischen Zeichen geschrieben ist.
Verwendet wurde der Windows 2000 Font Times New Roman (Unicode). Nun möchte
ich den Inhalt der Datei mit QUark XPress 4.11 weiter verarbeiten. Das geht
aber nicht, da Quark keine Unicode Zeichensätze unterstützt.

Ich habe auch einen ganz normalen kyrillischen Zeichensatz (nicht Unicode,
sondern so einer mit 255 Zeichen, weiß nicht, wie der name dafür ist).

Wenn ich einfach über da Zeichenformat die Schriftart ändere, gehen
sämtliche Zeichen verloren (ist ja auch klar, da sich die Codes nicht
entsprechen). Wie kann ich diese Umwandlung von Unicode in alten Font
hinbekommen?

Danke für eure Hilfe
Martin


Andreas Prilop

unread,
Sep 26, 2002, 1:33:04 PM9/26/02
to
"Martin Ernst" <m.e...@connect-wa.de> wrote:

> Ich habe eine Word 2000 Datei, die in kyrillischen Zeichen geschrieben ist.

> Verwendet wurde der Windows 2000 Font Times New Roman (Unicode). Nun m?chte


> ich den Inhalt der Datei mit QUark XPress 4.11 weiter verarbeiten. Das geht

> aber nicht, da Quark keine Unicode Zeichens?tze unterst?tzt.

Speichere die Datei im Rich Text Format (RTF). Kyrillische Zeichen werden
darin in Code Page 1251 codiert.

> Ich habe auch einen ganz normalen kyrillischen Zeichensatz (nicht Unicode,

> sondern so einer mit 255 Zeichen, wei? nicht, wie der name daf?r ist).

Das sollte nicht nötig sein. Mit Multilanguage Support
<http://www.eu.microsoft.com/typography/multilang/> erzeugt Dir das
Betriebssystem virtuelle 8-Bit-Schriften, z.B. Arial, Arial CE,
Arial Cyr, Arial Greek, Arial Baltic.

Dein Problem besteht _nicht_ in der Verwendung von unterschiedlichen
Schriften, sondern darin, dass Programme kyrillischen Text unterschied-
lich speichern, nämlich in Unicode oder in Code Page 1251.

BTW: Dein
> X-Newsreader: Microsoft Outlook Express 6.00.2600.0000
kriegt nicht mal gewöhnliche deutsche Umlaute gebacken.
<http://oe-faq.de/> erklärt, wie Du ihn richtig einstellen kannst.

--
http://www.unics.uni-hannover.de/nhtcapri/plonk.txt

Christoph Happich

unread,
Sep 27, 2002, 3:08:52 AM9/27/02
to
Andreas Prilop wrote:
> Speichere die Datei im Rich Text Format (RTF). Kyrillische Zeichen werden
> darin in Code Page 1251 codiert.

Na dass ist doch mal ein Tipp; *merk

Christoph

Martin Ernst

unread,
Sep 27, 2002, 3:35:21 AM9/27/02
to
> Speichere die Datei im Rich Text Format (RTF). Kyrillische Zeichen werden
> darin in Code Page 1251 codiert.

Das funktioniert leider nicht. Obwohl ich in den Ländereinstellungen sowohl
kyrillisch als russisches Tastaturlayout aktiviert habe.


> BTW: Dein
> > X-Newsreader: Microsoft Outlook Express 6.00.2600.0000
> kriegt nicht mal gewöhnliche deutsche Umlaute gebacken.
> <http://oe-faq.de/> erklärt, wie Du ihn richtig einstellen kannst.

Bei mir zeigt mein OE aber Umlaute an.

Danke
Martin


Andreas Prilop

unread,
Sep 27, 2002, 6:46:28 AM9/27/02
to
"Martin Ernst" <m.e...@connect-wa.de> wrote:

> > Speichere die Datei im Rich Text Format (RTF). Kyrillische Zeichen werden
> > darin in Code Page 1251 codiert.
>
> Das funktioniert leider nicht.

Was funktioniert nicht? Bitte genauer erläutern!

> Bei mir zeigt mein OE aber Umlaute an.

In Deinen Nachrichten fehlt die Zeichensatz-Deklaration
"charset=ISO-8859-1"
die festlegt, welche Bedeutung 8-Bit-Zeichen haben. Das Du selber
Deine eigenen Nachrichten lesen kannst, beweist überhaupt nichts.
Du solltest bei Dir einstellen:

Tools > Options > Send
Mail Sending Format > Plain Text Settings > Message format MIME
News Sending Format > Plain Text Settings > Message format MIME

Diese Hinweise findest Du auf <http://oe-faq.de/> oder in
<news:de.comm.software.outlook-express>
Dringend zu empfehlen für jeden OE-Benutzer.

--
http://www.unics.uni-hannover.de/nhtcapri/plonk.txt

Martin Ernst

unread,
Sep 27, 2002, 7:05:02 AM9/27/02
to
Also:

Ich habe den Text im Unicode Zeichensatz erhalten.

Das als RTF gespeicherte Dokument hat wieder den Unicode Zeichensatz. Ich
kann's nicht besser beschreiben, tut mir leid. Ich kann das Dokument öffnen.
Dann den Zeichensatz ändern in meinen kyrillischen nicht-Unicode
Zeichensatz. Und dann sehe ich wieder nur Sonderzeichen, Fragezeichen etc.
Also kann doch der Zeichensatz beim Speichern nicht umgewandelt worden sein.
Oder?

Danke
Martin

Andreas Prilop

unread,
Sep 27, 2002, 7:19:48 AM9/27/02
to
"Martin Ernst" <m.e...@connect-wa.de> wrote:

> Das als RTF gespeicherte Dokument hat wieder den Unicode Zeichensatz.

Wöhle in MS Word
Extras > Optionen > Allgemein > Konvertierung beim Öffnen bestätigen
(oder so ähnlich) Dann kannst Du eine RTF-Datei mal als TEXT öffnen
und Dir den "Quelltext" ansehen. Da findest Du irgendwo
... \fcharset204 ... Times New Roman Cyr
und weiter unter russische Buchstaben in der Form
\'e0\'e1\'e2 ...
Also in 8-Bit-Form gespeichert. \fcharset204 bedeutet Code Page 1251.

Wie heißt überhaupt Deine Schrift?

--
http://www.unics.uni-hannover.de/nhtcapri/plonk.txt

Martin Ernst

unread,
Sep 27, 2002, 7:42:43 AM9/27/02
to

> Wöhle in MS Word
> Extras > Optionen > Allgemein > Konvertierung beim Öffnen bestätigen
> (oder so ähnlich) Dann kannst Du eine RTF-Datei mal als TEXT öffnen
> und Dir den "Quelltext" ansehen. Da findest Du irgendwo
> ... \fcharset204 ... Times New Roman Cyr
> und weiter unter russische Buchstaben in der Form
> \'e0\'e1\'e2 ...
> Also in 8-Bit-Form gespeichert. \fcharset204 bedeutet Code Page 1251.

ja, das steht tatsächlich alles drin

>
> Wie heißt überhaupt Deine Schrift?

Die heißt Ladoga.

Wenn ich nun einfach im Schriftmenü Ladoga auswähle, habe ich trotz der
Konvertierung wieder nur diese Rechtecke statt richtiger Zeichen. Wie muss
ich denn vorgehen, um den Zeichensatz zu ändern?

>
> --
> http://www.unics.uni-hannover.de/nhtcapri/plonk.txt

Andreas Prilop

unread,
Sep 27, 2002, 8:28:54 AM9/27/02
to
"Martin Ernst" <m.e...@connect-wa.de> wrote:

> Die heißt Ladoga.
> Wenn ich nun einfach im Schriftmenü Ladoga auswähle, habe ich trotz der
> Konvertierung wieder nur diese Rechtecke statt richtiger Zeichen. Wie muss
> ich denn vorgehen, um den Zeichensatz zu ändern?

Öffne die RTF-Datei in MS Word als "Text". Ändere "Times New Roman Cyr"
in "Ladoga". Eventuell auch noch "Arial Cyr" u.a. in "Ladoga" ändern.
Dann öffne die RTF-Datei in Quark Xpress. Was passiert?

--
http://www.unics.uni-hannover.de/nhtcapri/plonk.txt

Rainer Strehlow

unread,
Sep 27, 2002, 4:02:20 PM9/27/02
to
"Martin Ernst" <m.e...@connect-wa.de> schrieb im Newsbeitrag
news:amvaaj$9gtor$1...@ID-78146.news.dfncis.de...

>
> Wenn ich einfach über da Zeichenformat die Schriftart ändere, gehen
> sämtliche Zeichen verloren (ist ja auch klar, da sich die Codes nicht
> entsprechen). Wie kann ich diese Umwandlung von Unicode in alten Font
> hinbekommen?

Hallo Martin

ich habe vor einem ähnlichen Problem gestanden, als ich einen russischen
Text im Word97/2000-Format (=Unicode) in Ventura weiterbearbeiten wollte
(Ventura unterstützt leider auch noch keinen Unicode).

Ich habe das Dokument in Word erstmal im Word6.0 bzw. Word95 gespeichert.
Dabei wird nämlich auch von Unicode in CodePage 1251 umkodiert. Dann habe
ich die Datei mit WordPad geöffnet und über die Zwischenablage nach Ventura
gebracht. Hat einwandfrei funktioniert!

Gruß

Rainer


Martin Ernst

unread,
Sep 28, 2002, 6:46:48 AM9/28/02
to
> Öffne die RTF-Datei in MS Word als "Text". Ändere "Times New Roman Cyr"
> in "Ladoga". Eventuell auch noch "Arial Cyr" u.a. in "Ladoga" ändern.
> Dann öffne die RTF-Datei in Quark Xpress. Was passiert?

Öffnen in Quark: Lauter Sonderzeichen, teilweise kyrillisch, aber auf keinen
Fall die richtigen.

Öffnen in Qord: Rechtecke, sieht genau so aus, als ob ich die Schrift wie
oben beschrieben direkt in Word geändert hätte.

Martin

Martin Ernst

unread,
Sep 28, 2002, 6:50:25 AM9/28/02
to
> Ich habe das Dokument in Word erstmal im Word6.0 bzw. Word95 gespeichert.
> Dabei wird nämlich auch von Unicode in CodePage 1251 umkodiert. Dann habe
> ich die Datei mit WordPad geöffnet und über die Zwischenablage nach
Ventura
> gebracht. Hat einwandfrei funktioniert!


Funktioniert bei mir auch nicht. Siehe oben in dem anderen Teilthread.
Falsche Zeichen, Rechtecke, alles was das Herz begehrt, nur nicht die
richtigen kyrillischen Zeichen.

Danke trotzdem
Martin

Andreas Prilop

unread,
Sep 28, 2002, 10:06:03 AM9/28/02
to
"Martin Ernst" <m.e...@connect-wa.de> wrote:

> Öffnen in Quark: Lauter Sonderzeichen, teilweise kyrillisch, aber auf keinen
> Fall die richtigen.

Das deutet darauf hin, dass Deine Schrift überhaupt nicht der Windows-
Codierung Code Page 1251 folgt. Sieh Dir den Quelltext von
<http://www.unics.uni-hannover.de/nhtcapri/cyrillic.win>
in Ladoga an. Ist das russische Alphabet komplett richtig lesbar?

> Öffnen in Qord: Rechtecke, sieht genau so aus, als ob ich die Schrift wie
> oben beschrieben direkt in Word geändert hätte.

Das ist klar und war zu erwarten.

--
http://www.unics.uni-hannover.de/nhtcapri/plonk.txt

Martin Ernst

unread,
Sep 28, 2002, 11:09:58 AM9/28/02
to
> Das deutet darauf hin, dass Deine Schrift überhaupt nicht der Windows-
> Codierung Code Page 1251 folgt.

Das kann möglich sein. Weißt du, wie ich das prüfen bzw. ggf. sogar
korrigieren kann?

> Sieh Dir den Quelltext von
> <http://www.unics.uni-hannover.de/nhtcapri/cyrillic.win>
> in Ladoga an. Ist das russische Alphabet komplett richtig lesbar?

Ich kann Ladoga nicht als Schriftart für Kyrillisch auswählen. Der Internet
Explorer bietet mir nur die mitgelieferten Windows Schriften an.

Vielen Dank für deine permanente Hilfe.

Martin

Andreas Prilop

unread,
Sep 28, 2002, 11:11:50 AM9/28/02
to
"Martin Ernst" <m.e...@connect-wa.de> wrote:

> > <http://www.unics.uni-hannover.de/nhtcapri/cyrillic.win>


>
> Ich kann Ladoga nicht als Schriftart für Kyrillisch auswählen. Der Internet
> Explorer bietet mir nur die mitgelieferten Windows Schriften an.

Ich meinte, den Quelltext auf Deine Platte zu speichern und dann in
WordPad (oder so) zu öffnen.

--
http://www.unics.uni-hannover.de/nhtcapri/plonk.txt

Martin Ernst

unread,
Sep 29, 2002, 8:18:38 AM9/29/02
to
> Ich meinte, den Quelltext auf Deine Platte zu speichern und dann in
> WordPad (oder so) zu öffnen.

Sorry, das hatte ich falsch verstanden. Wenn ich das jetzt so mache, wie du
meinst, passiert folgendes:

Die Kyrillischen Sonderzeichen werden wie gehabt zum größten Teil als
Rechtecke angezeigt. Aber jetzt kommts:

Die normalen Zeichen werden "korrekt" in kyrillisch angezeigt. Das klingt
jetzt falsch, ist es wahrscheinlich auch. Was ich meine ist folgendes:

Das Wort "Belarussian" zum Beispiel wird so geschrieben, wie ich es erwartet
hätte, also zum Beispiel ein Zeichen, das wie ein kleines "p" aussieht statt
"r" (wie gr. roh) oder "c" statt "s" etc.

Offensichtlich liegen die kyrillischen Zeichen in meinem Zeichensatz Lagoda
nicht dort, wo sie hingehören, sondern einfach auf irgendwelchen
lateinischen "Plätzen". Tja, da haben wir den Salat.

Kann ich damit jetzt irgendwas Anfangen, ich meine mit dem Zeichensatz,
nicht mit der Erkenntnis, dass der Zeichensatz offenbar nicht Codepage 1251
codiert ist.

Danke vielmals
Martin

Christoph Happich

unread,
Sep 30, 2002, 5:07:03 AM9/30/02
to
Martin Ernst wrote:
> Kann ich damit jetzt irgendwas Anfangen, ich meine mit dem Zeichensatz,
> nicht mit der Erkenntnis, dass der Zeichensatz offenbar nicht Codepage 1251
> codiert ist.

Ich denke nicht ... du hast einen Pseudo-Russischen Font (einen, der
Lateinische Buchstaben durch Russische ersetzt). Hol dir doch einfach
einen richtigen ...

Christoph

Martin Ernst

unread,
Sep 30, 2002, 7:23:29 AM9/30/02
to
> Hol dir doch einfach
> einen richtigen ...


Das ist wahrscheinlich die beste Möglichkeit. Gibt's solche Fonts auch auf
dem Freeware-Markt?

Martin

Andreas Prilop

unread,
Sep 30, 2002, 9:55:42 AM9/30/02
to
"Martin Ernst" <m.e...@connect-wa.de> wrote:

> Offensichtlich liegen die kyrillischen Zeichen in meinem Zeichensatz Lagoda
> nicht dort, wo sie hingehören, sondern einfach auf irgendwelchen
> lateinischen "Plätzen".

So eine Schrift ist Müll. Damit kannst Du nichts bestellen. Du brauchst
zumindest eine anständige (PostScript-)Schrift, die der Windows-Codierung
Code Page 1251 folgt. Zum Beispiel:
<http://www.fontexplorer.com/isroot/FontStore/content/02_help/content/help_03_support_f/help_03_support_lang.html>

> Kann ich damit jetzt irgendwas Anfangen, ich meine mit dem Zeichensatz,
> nicht mit der Erkenntnis, dass der Zeichensatz offenbar nicht Codepage 1251
> codiert ist.

Du meinst wahrscheinlich Deine Schrift.
Zeichensatz = character set
Schrift = font
Zu den Begriffen siehe <http://www.dodabo.de/charset/index.html>

Diese Schrift kannst du nur noch löschen. Wenn Du sie gekauft hast,
reklamiere beim Hersteller. Wenn Du sie nicht gekauft hast -
"You get what you pay for."

--
http://www.unics.uni-hannover.de/nhtcapri/plonk.txt

0 new messages