zurzeit verwende ich Linux parallel zu Windows, um ggf. umzusatteln.
Dabei fällt mir auf, dass alle unter Windows erstellten Dateien (also
quasi der Inhalt von Textdateien) keine Umlaute darstellen.
Ich habe ich Editoren kwrite, kate, kile und so schon auf Zeilenumbruch
im Windows-Stil umgestellt und als Zeichensatz "UTF-8" aktiviert.
In was speichert denn Windows? Und wie Linux?
Die Windowsplatten hab ich so eingebunden in der fstab:
/dev/hda3 /public vfat
user,iocharset=utf8,users,umask=000 0 0
(btw: ist das ok, wenn man public in den Hauptbaum packt?)
/dev/hda1 /windows/c ntfs
ro,uid=1000,umask=0002,nls=utf8 0 0
/dev/hda2 /windows/d ntfs
ro,uid=1000,umask=0002,nls=utf8 0 0
Bei der vfat kann jeder lesen und schreiben, die ntfs soll nur User 1000
(der zuerst angelegte) lesen dürfen.
Später soll halt noch ein "Gastkonto" unter Linux entstehen, welches
nicht auf die Windowsplatten zugreifen soll.
> Dabei fällt mir auf, dass alle unter Windows erstellten Dateien (also
> quasi der Inhalt von Textdateien) keine Umlaute darstellen.
Kommt vor.
> Ich habe ich Editoren kwrite, kate, kile und so schon auf Zeilenumbruch
> im Windows-Stil umgestellt und als Zeichensatz "UTF-8" aktiviert.
>
> In was speichert denn Windows?
cp1252
> Und wie Linux?
Früher bei uns meistens latin1 (iso8859-1), mittlerweile meistens utf8.
> iocharset=utf8
> [...]
> nls=utf8
Das hat nur Einfluß auf die _Namen_ der Dateien, nicht deren Inhalt.
Gruß
Henning
--
henning paul home: http://www.geocities.com/hennichodernich
PM: henni...@gmx.de , ICQ: 111044613
>> In was speichert denn Windows?
>
> cp1252
>
>> Und wie Linux?
>
> Früher bei uns meistens latin1 (iso8859-1), mittlerweile meistens utf8.
Kann ich das denn irgendwie angleichen, so dass in SuSE 10.0 und Windows
XP die Buchstaben gleich zu lesen sind?
>> iocharset=utf8
>> [...]
>> nls=utf8
>
> Das hat nur Einfluß auf die _Namen_ der Dateien, nicht deren Inhalt.
Ok, also muss man 1) in der fstab und 2) in den Editoren den Zeichensatz
in den Einklang bringen, welche Option wäre das?
Mfg
Johann Peters
> Die aktuelle Codepage von Windows kenne ich leider nicht. Linux kann
> verschiedene Formate verwenden. Was Dein System verwendet, kannst Du mit
> dem Befehl locale feststellen. Dateien von einer Codierung in eine
> andere übersetzen geht mit dem Befehl recode.
Tja, dann muss ich mal schauen, was Windows XP und SuSE 10.0
unterschiedliches einsetzt,
Aber recodieren will ich das auch nicht, denn dann kann ich das auf der
anderen Seite nicht mehr lesen.
Deshalb würde ich am liebsten für o.g. Systeme einheitliche Codepages,
Zeichensätze und Dateisystem-Zeichensätze nehmen.
In Kile und Kate kannst du zum Beispiel den Zeichensatz wählen, mit dem die
Datei angezeigt werden soll. (Beim Öffnen, rechts neben dem Dateinamen).
Ich habe noch nie ein ganzes System umgestellt die Windows-Codepage zu
verwenden. Sollte möglich sein aber das ist bei Suse sicher nicht
vorgesehen.
Du musst vermutlich irgendwo die Umgebungsvariablen
export LANG="de_DE.cp1252"
export LANGUAGE="de_DE.cp1252"
export GDM_LANG="de_DE.cp1252"
export LC_ALL="de_DE.cp1252"
setzen - in irgendeiner Datei die beim Login ausgeführt wird,
z.B. /etc/profile oder /etc/bashrc oder so.
Vielleicht hilft
http://de.gentoo-wiki.com/Deutsche_Lokalisierung
wies bei SuSE geht weis ich nicht.
--
Roman
> Tja, dann muss ich mal schauen, was Windows XP und SuSE 10.0
> unterschiedliches einsetzt,
>
> Deshalb würde ich am liebsten für o.g. Systeme einheitliche Codepages,
> Zeichensätze und Dateisystem-Zeichensätze nehmen.
Bei SuSE kannst du das einstellen mit YAST:
System/Editor für /etc/sysconfig-Dateien
Dort dann wählen: System/Environment/Language
dort die Variable RC_LANG anwählen
de_DE.ISO-8859-1 wird vermutlich passen.
Gruss von Werni
> Tja, dann muss ich mal schauen, was Windows XP und SuSE 10.0
> unterschiedliches einsetzt,
In den meisten Editoren unter Windows kann man den Zeichensatz
einstellen. Der, der auch die deutschen Umlaute kennt ist iso-8859-1.
Und das ist in Linux nicht anders. utf-8 wird immer noch nicht von allen
Programmen unterstützt. Was eigentlich auch bei normalen Schriftstücken
nicht nötig ist. Insbesondere haben noch einige Mail- Newsreader
Probleme mit utf-8.
> Deshalb würde ich am liebsten für o.g. Systeme einheitliche Codepages,
> Zeichensätze und Dateisystem-Zeichensätze nehmen.
Was steht dem im Wege?
Wolfgang
> Bei SuSE kannst du das einstellen mit YAST:
> System/Editor für /etc/sysconfig-Dateien
> Dort dann wählen: System/Environment/Language
> dort die Variable RC_LANG anwählen
> de_DE.ISO-8859-1 wird vermutlich passen.
Alles klar, muss ich mal probieren!
> Nicole Schmidt wrote:
>> Deshalb würde ich am liebsten für o.g. Systeme einheitliche Codepages,
>> Zeichensätze und Dateisystem-Zeichensätze nehmen.
>
> Was steht dem im Wege?
Tja, ich hab die Ursache noch nicht gefunden: Entweder speichert Windows
die Zeichen falsch, oder der Fehler ist bei Linux zu suchen.
Ferner sind OpenOffice-Dokumente bei beiden lesbar, Textdateien (oder
welche von Latex) haben verstümmelte Umlaute. Könnte evtl. auch am
Windows-Latex-Editor "TeXnic-Center" liegen.
> Tja, ich hab die Ursache noch nicht gefunden: Entweder speichert Windows
> die Zeichen falsch, oder der Fehler ist bei Linux zu suchen.
Sie speichern die Zeichen einfach unterschiedlich und es gibt keine
Konvention über einen gemeinsamen Standard.
> Ferner sind OpenOffice-Dokumente bei beiden lesbar,
OpenOffice hat so eine Konvention.
> Textdateien (oder
> welche von Latex) haben verstümmelte Umlaute. Könnte evtl. auch am
> Windows-Latex-Editor "TeXnic-Center" liegen.
Es liegt daran, daß Dateien als cp1252 ("windowsansi" oder so ähnlich)
deklariert sind.
Ich persönlich halte es so, daß ich LaTeX-Quelltext in 7bit-ASCII schreibe
und für Umlaute "a,"o,"u benutze. Das funktioniert immer.
Gruß
Henning
Doch, es gibt einen Standard: ISO 8859.
Kl - »und wer hält sich mal wieder nicht dran ...« - aus
> wies bei SuSE geht weis ich nicht.
Yast|System|Editor für
/etc/sysconfig-Dateien|System|Environment|Language
und da RC_LANG setzen.
(evtl. neu booten oder X-Server neu starten..)
HTH
--
NoteTab-Clips zum Erstellen von KorrNews- und Hamster-Scripte
Letzte Version vom 2002.03.04 VER: RELEASE VERSION 1.0.5
Clip fr scripte - http://home.arcor.de/k-fischer/hamclips/
NoteTab-Editor - http://www.notetab.ch
Ich würde ISO-8859-15 anstelle von ISO-8859-1 verwenden, da letzterem im
Vergleich zum ersteren das Euro-Zeichen fehlt.
Grüße
Jan
Unter LaTeX verwendest du vermutlich inputenc. Mit welchem Parameter
lädst du das Paket? Emacs mit auctex benutzt diese Angabe, um das verwendete
Encoding zu erraten.
Florian
--
Es gibt Leute, die von sich behaupten "wenn ich Kaffee trinke, kann ich
nicht schlafen!". Bei mir ist das umgekehrt: Wenn ich schlafe, kann ich
keinen Kaffee trinken. [Juergen Ilse in de.alt.folklore.urban-legends]
> Unter LaTeX verwendest du vermutlich inputenc. Mit welchem Parameter
> lädst du das Paket?
mit Latin1 dahinter.
Dann wird das wohl auch Latin-1 sein.
Werden die Dateien richtig angezeigt, wenn du sie von der Kommandozeile
aus mit
LANG=de_DE.iso88591 less dateiname
anschaust?
> Dann wird das wohl auch Latin-1 sein.
> Werden die Dateien richtig angezeigt, wenn du sie von der Kommandozeile
> aus mit
> LANG=de_DE.iso88591 less dateiname
> anschaust?
Muss ich mal probieren.
Hab nun testhalber die Linuxeditoren auf cp1252 umgestellt, dann muss
ich eben in Linux das einstellen, damit es unter Windows lesbar ist,
weil es umgekehrt wohl nicht geht.
Kile und kwrite hab ich erstmal auf cp1252 umgestellt.
> Ich würde ISO-8859-15 anstelle von ISO-8859-1 verwenden, da letzterem im
> Vergleich zum ersteren das Euro-Zeichen fehlt.
Also, fassen wir mal zusammen:
Es gibt ISO 8859-1 und -15, was auch latin1 und latin9 heißt.
Dann gibts UTF-8 und die Codepage 1252, letztere nutzt Windows.
Seit dem ich kile, kwrite & Co. unter Linux umgestellt habe, werden alle
Textdateien auch richtig angezeigt.
Ist nun also 1252 das non-plus-ultra und enthält auch alle Zeichen inkl.
Euro und deutschen Umlauten, oder ist das nur EINE Zeichencodeseite, die
Windows verwendet und es ist eher Latin oder UTF Standard?
> Doch, es gibt einen Standard: ISO 8859.
Also einfach alles auf ISO 8859 umstellen? -1 oder -15?
Beim Windows-Notepad geht das nicht, da gibts nur als
Codierung im Feld "Speichern unter" den Eintrag "ANSI". Wählbar ist
ferner Unicode, Unicode Big Endian und UTF-8, aber ANSI steht ganz oben
und wird wohl der Standard sein.
Ich hab nun eine unter Windows geschriebene Tex-Datei unter Linux
geöffnet in Kile und dort konnte man die Umlaute nicht lesen.
Dann habe ich Kile auf cp1252 eingestellt mit Windows-Zeilenumbruch und
diese Datei in Windows gelesen: Umlaute wieder nicht lesbar.
Nutzt Windows doch was anderes?!
> Beim Windows-Notepad geht das nicht, da gibts nur als
> Codierung im Feld "Speichern unter" den Eintrag "ANSI". Wählbar ist
> ferner Unicode, Unicode Big Endian und UTF-8, aber ANSI steht ganz oben
> und wird wohl der Standard sein.
Meinst Du Notepad oder Wordpad?
Bei ersterem geht das AFAIK nicht, Wordpad kann jedoch die verschiedenen
Formate sowohl lesen als auch korrekt schreiben.
Das gilt auch für alle besseren Editoren wie z.B. Ultraedit.
> Ich hab nun eine unter Windows geschriebene Tex-Datei unter Linux
> geöffnet in Kile und dort konnte man die Umlaute nicht lesen.
Das kommt wieder auf das Win-Tex-Programm an.
Schon mit kwrite/kate/kedit probiert?
Oder gar mit einem Tex-Prog?
> Dann habe ich Kile auf cp1252 eingestellt mit Windows-Zeilenumbruch und
> diese Datei in Windows gelesen: Umlaute wieder nicht lesbar.
>
> Nutzt Windows doch was anderes?!
Eigentlich schon standardmäßig cp1252.
Seit einem der neueren Servicepacks kann Windows auch in Dateinamen mit UTF
umgehen.
UTF sollte eigentlich schon längst Standard sein, weil sich damit eben fast
alle Zeichen gleichzeitig darstellen lassen und alle anderen überflüssig
werden.
Leider hat M$ Probleme damit, sich an Standards zu halten, die sie nicht
selbst gesetzt haben, siehe z.B. die nicht vorhandene Konformität von
Outkook/Excess.
Früher, als ich privat auch noch Windows parallel hatte, war unter Linux
alles auf iso gestellt, mittlerweile jedoch alles in UTF.
Anfangs hatte ich meine Kommunikationsprogramme auch auf cp/iso eingestellt,
um nervige Anfragen von Outkook-Nutzern zu vermeiden, weshalb ich ihnen
denn so komische Zeichen senden würde, aber ich bin auch dort zu UTF
gewechselt und mache bei Bedarf eben auf die Unzulänglichkeiten von
M$-Produkten aufmerksam und rate zur Installation standardkonformer
Software.
Ausnahmen mache ich lediglich bei nicht kurzfristig behebbaren Problemen auf
der Gegenseite, z.B. bei licq
Speziell bei der Erstellung von Textdokumenten sollte man sich selbst einen
Standard setzen, da man sonst schnell mal durcheinander kommt, was auf
Dauer recht nervig werden kann.
--
lg niko
icq:# 129022192
________________________________
Menschliche Reife beginnt dort, wo die Sorge um andere größer wird als um
die eigene Person
> Meinst Du Notepad oder Wordpad?
> Bei ersterem geht das AFAIK nicht, Wordpad kann jedoch die verschiedenen
> Formate sowohl lesen als auch korrekt schreiben.
> Das gilt auch für alle besseren Editoren wie z.B. Ultraedit.
Ich meinte das kleine Notepad (Editor genannt). Ich hab halt einige
einfache Textdateien, dafür reicht Notepad. Notizen, die man schnell mit
jedem Editor ansehen kann.
> Das kommt wieder auf das Win-Tex-Programm an.
> Schon mit kwrite/kate/kedit probiert?
> Oder gar mit einem Tex-Prog?
In Windows nutze ich TecniX-Center, dieser kann bei "Speichern unter"
das Format Windows und Unix wählen, bringt aber nichts.
In Linux nutze ich Kile. Aber egal wie ich speichere kann ich hinterher
nichts in Windows erkennen.
> Eigentlich schon standardmäßig cp1252.
> Seit einem der neueren Servicepacks kann Windows auch in Dateinamen mit UTF
> umgehen.
Ich meinte eher das, was IN den Dateien steht und nicht der Name selbst.
"Übersicht.tex" wird im Konqueror und Windows Explorer richtig
angezeigt, aber wenn ich die öffne, kommen statt äöüß nur Zeichensalat.
> UTF sollte eigentlich schon längst Standard sein, weil sich damit eben fast
> alle Zeichen gleichzeitig darstellen lassen und alle anderen überflüssig
> werden.
Also ist UTF-8 auf jeden Fall eher Standard (auch in Deutschland), als
es 8859-x ist?
> Leider hat M$ Probleme damit, sich an Standards zu halten, die sie nicht
> selbst gesetzt haben, siehe z.B. die nicht vorhandene Konformität von
> Outkook/Excess.
Tja, M$, ein leidiges Dauerthema diese "proprietäre" Sachen...
> Früher, als ich privat auch noch Windows parallel hatte, war unter Linux
> alles auf iso gestellt, mittlerweile jedoch alles in UTF.
Richtig, SuSE hat UTF. Das mit den DateiNAMEN klappt ja auch. Früher in
SuSE 7.1 war selbst der Dateiname nicht lesbar.
> Anfangs hatte ich meine Kommunikationsprogramme auch auf cp/iso eingestellt,
> um nervige Anfragen von Outkook-Nutzern zu vermeiden, weshalb ich ihnen
> denn so komische Zeichen senden würde, aber ich bin auch dort zu UTF
> gewechselt und mache bei Bedarf eben auf die Unzulänglichkeiten von
> M$-Produkten aufmerksam und rate zur Installation standardkonformer
> Software.
Hast du bei Thunderbird und Firefox also auch UTF-8? Ich hab da 8859-15.
> Ausnahmen mache ich lediglich bei nicht kurzfristig behebbaren Problemen auf
> der Gegenseite, z.B. bei licq
Wie wäre es mit Kopete? Finde ich besser, weil man ein Symbolicon hat
und dadurch neue Nachrichten erkennt. Oder wie macht das Licq?
> Speziell bei der Erstellung von Textdokumenten sollte man sich selbst einen
> Standard setzen, da man sonst schnell mal durcheinander kommt, was auf
> Dauer recht nervig werden kann.
Ja, deshalb will ich JETZT damit anfangen. Ich könnte auch alles auf
Linux-Standard setzen (z.B. auch die Zeilenenden im Editor), aber in
Windows hat man dann Probleme. Wordpad erkennt zwar die Umbrüche, aber
Notepad zeigt dann nur 2 senkrechte Striche an oder ähnlich.
Heiko Schlenker <hsc...@gmx.de> wrote:
> * Nicole Schmidt <nics...@yahoo.de> schrieb:
>> Ist nun also 1252 das non-plus-ultra
> Nein. Es ist eher eine Art Microsoft-Hausstandard. Ordentlich
> standardisiert ist *u.a.* die ISO-8859-Reihe[1].
Jein. Irgendwie hat es M$ geschafft, auch diesen "Hausstandard"
in die Liste der standardisierten Zeichensaetze hineinzumogeln ...
Ich wuerde aber (u.a. der hoeheren Verbreitung bei "nicht Windows"
Systemen) die ISO-Zeichensaetze vorziehen.
> Der Zeichensatzwirrwarr nervt. Deshalb haben findige Leute den
> Unicode-Standard entwickelt. UTF-8 ist eine Unicode-Kodierung.
Ja, aber auch UTF-8 ist nicht immer problemlos (besonders nicht im
Zusammenhang mit aelterer Software, die nicht mit "wide characters"
umgehen kann, aber IMHO sind auch die Mappings der Sonderzeichen
nicht in allen Implementierungen immer korrekt ...).
Tschuess,
Juergen Ilse (jue...@usenet-verwaltung.de)
Das muesste dann ISO8859-1 sein, aber vermutlich bekommst du bei
diesen Fragen in der TeX-Gruppe kompetentere Antworten, denn mit
Linux hat das eigentlich nicht *SOOO* viel zu tun ...
Tschuess,
Juergen Ilse (jue...@usenet-verwaltung.de)
> Es gibt ISO 8859-1 und -15, was auch latin1 und latin9 heißt.
> Dann gibts UTF-8 und die Codepage 1252, letztere nutzt Windows.
> Seit dem ich kile, kwrite & Co. unter Linux umgestellt habe, werden alle
> Textdateien auch richtig angezeigt.
> Ist nun also 1252 das non-plus-ultra und enthält auch alle Zeichen inkl.
> Euro und deutschen Umlauten, oder ist das nur EINE Zeichencodeseite, die
> Windows verwendet und es ist eher Latin oder UTF Standard?
CP1252 ist nur fast ISO-8859-1 und nur fast ISO-8859-15. Z.B. ist das
Euro-Zeichen bei CP1252 an Position 128, bei ISO-8859-15 an Position 164.
Genaueres siehe <http://de.wikipedia.org/wiki/CP1252>.
Unicode/UTF-8 ist die Zukunft, wenn es sich überall durchgesetzt hat,
hat die nervige Zeichensatz-Raterei ein Ende.
Aber bis es soweit ist, kann man benutzen, was man für sinnvoll hält.
Wichtig ist eigentlich nur, dass man den verwendeten Zeichensatz auch
deklariert, sofern das möglich ist (z.B. in Mails, News, auf
Web-Seiten).
Michael
> Heiko Schlenker <hsc...@gmx.de> wrote:
[...]
>> Nein. Es ist eher eine Art Microsoft-Hausstandard.
Nur für west-europäische Windows-Versionen, oder?
>> Ordentlich standardisiert ist *u.a.* die ISO-8859-Reihe[1].
>
> Jein. Irgendwie hat es M$ geschafft, auch diesen "Hausstandard"
> in die Liste der standardisierten Zeichensaetze hineinzumogeln ...
ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/MICSFT/WINDOWS/CP1252.TXT
^^^^^^^^^^^^^^
Das würde ich nicht gerade als "hineinmogeln" bezeichnen.
> Ich wuerde aber (u.a. der hoeheren Verbreitung bei "nicht Windows"
> Systemen) die ISO-Zeichensaetze vorziehen.
ACK
Gruß, Reiner.
--
,,,
(o o)
---ooO-(_)-Ooo--- | PGP key available | http://rsteib.home.pages.de/
> Das muesste dann ISO8859-1 sein, aber vermutlich bekommst du bei
> diesen Fragen in der TeX-Gruppe kompetentere Antworten, denn mit
> Linux hat das eigentlich nicht *SOOO* viel zu tun ...
Jein: Es geht mir um den "richtigen" Zeichensatz für Windows und Linux,
damit ich alle Textdateien (nicht nur TeX) richtig lesen kann, also auch
die mit dem Notepad geschriebenen.
Da ich bei Windows nichts umstellen kann, wollte ich es in Linux versuchen.