Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

Umlaute in UTF-8 mit less darstellen

444 views
Skip to first unread message

Til Schubbe

unread,
Jan 30, 2013, 4:40:02 PM1/30/13
to
Hallo,

mein /usr/bin/less in Squeeze zeigt Umlaute in UTF-8-Files nicht
korrekt an:

$ echo 'ä ö ü Ä Ö Ü ß' >w
$ cat w
ä ö ü Ä Ö Ü ß
$ hex w
0x00000000: c3 a4 20 c3 b6 20 c3 bc - 20 c3 84 20 c3 96 20 c3 ä ö ü .. .. .
0x00000010: 9c 20 c3 9f 0a - . ..J

In einem xterm zeigt less dies hier an, wobei die Punkte inverse
Fragezeichen sind:
ä ö ü .[7m204 .[7m226 .[7m234 .[7m237

Auf der Konsole sieht es so aus:
ä ö ü ■204 ■226 ■234 ■237

Warum stellt less die großen Umlaute und das sz nicht richtig dar?


Ich habe folgende Einstellungen:

$ echo $LESSCHARSET
UTF-8

$ locale
LANG=de_DE.UTF-8
LANGUAGE=de_DE.UTF-8
LC_CTYPE="de_DE.UTF-8"
LC_MESSAGES="de_DE.UTF-8"
LC_ALL=de_DE.UTF-8
[...]

# egrep -v '^#' /etc/locale.gen
de_DE@euro ISO-8859-15
de_DE ISO-8859-1
de_DE.UTF-8 UTF-8

# egrep -v '^#' /etc/default/locale
LANG=de_DE.UTF-8

Danke + Gruß
Til


--
Zum AUSTRAGEN schicken Sie eine Mail an debian-user-g...@lists.debian.org
mit dem Subject "unsubscribe". Probleme? Mail an listm...@lists.debian.org (engl)
Archive: http://lists.debian.org/20130130212...@schubbi-net.local

Andrei POPESCU

unread,
Jan 31, 2013, 5:20:02 AM1/31/13
to
On Mi, 30 ian 13, 22:24:58, Til Schubbe wrote:
> In einem xterm zeigt less dies hier an, wobei die Punkte inverse
> Fragezeichen sind:

Versuche mal 'uxterm' und benutze ein Font das UTF-8 unterstützt (z.B.
xfonts-terminus).

lG,
Andrei
--
Offtopic discussions among Debian users and developers:
http://lists.alioth.debian.org/mailman/listinfo/d-community-offtopic
signature.asc

Martin Steigerwald

unread,
Jan 31, 2013, 8:30:01 AM1/31/13
to
Am Donnerstag, 31. Januar 2013 schrieb Andrei POPESCU:
> On Mi, 30 ian 13, 22:24:58, Til Schubbe wrote:
> > In einem xterm zeigt less dies hier an, wobei die Punkte inverse
>
> > Fragezeichen sind:
> Versuche mal 'uxterm' und benutze ein Font das UTF-8 unterstützt (z.B.
> xfonts-terminus).

Also hier zeigt xterm Umlaute, Eurozeichen, Punkt-Punkt-Punkt und Listen-
Punkt etc. pp. auch an.

Kann natürlich sein, dass eben ein bestimmter Zeichensatz installiert ist,
verwendet wird. Hab aber an der Xterm-Konfiguration meines Wissens nach nix
gedreht.

--
Martin 'Helios' Steigerwald - http://www.Lichtvoll.de
GPG: 03B0 0D6C 0040 0710 4AFA B82F 991B EAAC A599 84C7


--
Zum AUSTRAGEN schicken Sie eine Mail an debian-user-g...@lists.debian.org
mit dem Subject "unsubscribe". Probleme? Mail an listm...@lists.debian.org (engl)
Archive: http://lists.debian.org/201301311429...@lichtvoll.de

Martin Steigerwald

unread,
Jan 31, 2013, 8:50:01 AM1/31/13
to
Am Donnerstag, 31. Januar 2013 schrieb Martin Steigerwald:
> Am Donnerstag, 31. Januar 2013 schrieb Andrei POPESCU:
> > On Mi, 30 ian 13, 22:24:58, Til Schubbe wrote:
> > > In einem xterm zeigt less dies hier an, wobei die Punkte inverse
> >
> > > Fragezeichen sind:
> > Versuche mal 'uxterm' und benutze ein Font das UTF-8 unterstützt (z.B.
> > xfonts-terminus).
>
> Also hier zeigt xterm Umlaute, Eurozeichen, Punkt-Punkt-Punkt und Listen-
> Punkt etc. pp. auch an.
>
> Kann natürlich sein, dass eben ein bestimmter Zeichensatz installiert
> ist, verwendet wird. Hab aber an der Xterm-Konfiguration meines Wissens
> nach nix gedreht.

Achja, das geht auch mit less (in xterm), Peter Funk fragte privat nach.

--
Martin 'Helios' Steigerwald - http://www.Lichtvoll.de
GPG: 03B0 0D6C 0040 0710 4AFA B82F 991B EAAC A599 84C7


--
Zum AUSTRAGEN schicken Sie eine Mail an debian-user-g...@lists.debian.org
mit dem Subject "unsubscribe". Probleme? Mail an listm...@lists.debian.org (engl)
Archive: http://lists.debian.org/201301311446...@lichtvoll.de

Til Schubbe

unread,
Jan 31, 2013, 12:30:02 PM1/31/13
to
* Am 31.01. meinte Andrei POPESCU:

> On Mi, 30 ian 13, 22:24:58, Til Schubbe wrote:
> > In einem xterm zeigt less dies hier an, wobei die Punkte inverse
> > Fragezeichen sind:
>
> Versuche mal 'uxterm' und benutze ein Font das UTF-8 unterstützt (z.B.
> xfonts-terminus).

Ich verwende in xterm bisher
-misc-fixed-medium-r-normal--20-200-75-75-c-100-ISO10646-1

aber auch mit
uxterm -fn -misc-fixed-medium-r-normal--20-200-75-75-c-100-ISO10646-1
oder
uxterm -fn -misc-freemono-bold-r-normal--0-0-0-0-p-0-iso10646-1
oder
uxterm -fn -xos4-terminus-bold-r-normal--12-120-72-72-c-60-iso10646-1

ist es kein Unterschied: ein UTF-8-File mit cat oder more auszugeben
ist kein Problem. Aber mit less werden nur die kleinen Umlaute
korrekt dargestellt; der Rest in dieser Art: ?[7m204, wobei das ? in
einer kleinen inversen Raute steht.

Gruß
Til


--
Zum AUSTRAGEN schicken Sie eine Mail an debian-user-g...@lists.debian.org
mit dem Subject "unsubscribe". Probleme? Mail an listm...@lists.debian.org (engl)
Archive: http://lists.debian.org/20130131172...@schubbi-net.local

Til Schubbe

unread,
Jan 31, 2013, 12:50:01 PM1/31/13
to
* Am 31.01. meinte Martin Steigerwald:

> Am Donnerstag, 31. Januar 2013 schrieb Martin Steigerwald:
> > Also hier zeigt xterm Umlaute, Eurozeichen, Punkt-Punkt-Punkt und Listen-
> > Punkt etc. pp. auch an.
> >
> > Kann natürlich sein, dass eben ein bestimmter Zeichensatz installiert
> > ist, verwendet wird. Hab aber an der Xterm-Konfiguration meines Wissens
> > nach nix gedreht.
>
> Achja, das geht auch mit less (in xterm), Peter Funk fragte privat nach.

Ich bin mir nicht sicher, ob ich ein Problem mit X bzw. xterm habe.
Denn auf der Text-Konsole habe ich das gleiche Verhalten: Umlaute
sind mit cat oder more ok. Aber mit less werden nur die kleinen
Umlaute richtig angezeigt; die großen Umlaute und das sz sehen auf
der Konsole so aus: ■204 ■226 ■234 ■237

Gruß
Til


--
Zum AUSTRAGEN schicken Sie eine Mail an debian-user-g...@lists.debian.org
mit dem Subject "unsubscribe". Probleme? Mail an listm...@lists.debian.org (engl)
Archive: http://lists.debian.org/20130131174...@schubbi-net.local

Elimar Riesebieter

unread,
Jan 31, 2013, 1:00:02 PM1/31/13
to
* Til Schubbe <li...@lists.schubbe.org> [2013-01-31 18:21 +0100]:

[...]
> ist es kein Unterschied: ein UTF-8-File mit cat oder more auszugeben
> ist kein Problem. Aber mit less werden nur die kleinen Umlaute
> korrekt dargestellt; der Rest in dieser Art: ?[7m204, wobei das ? in
> einer kleinen inversen Raute steht.

Was sagt

$ printenv | grep -i less

Elimar
--
The path to source is always uphill!
-unknown-


--
Zum AUSTRAGEN schicken Sie eine Mail an debian-user-g...@lists.debian.org
mit dem Subject "unsubscribe". Probleme? Mail an listm...@lists.debian.org (engl)
Archive: http://lists.debian.org/2013013117...@galadriel.home.lxtec.de

Andrei POPESCU

unread,
Jan 31, 2013, 1:00:02 PM1/31/13
to
On Jo, 31 ian 13, 18:21:12, Til Schubbe wrote:
>
> ist es kein Unterschied: ein UTF-8-File mit cat oder more auszugeben
> ist kein Problem. Aber mit less werden nur die kleinen Umlaute
> korrekt dargestellt; der Rest in dieser Art: ?[7m204, wobei das ? in
> einer kleinen inversen Raute steht.

Das ist aber Komisch. Ich musste bis jetzt noch nie irgendwas an less
konfigurieren solange ich das richtige Terminal Emulator + Font benutzt
habe. Könntest Du vielleicht eine solche Datei hier anhängen? Besser
gzipped, damit Email Programme/Server nicht auch ins Spiel kommen.
signature.asc

Peter Funk

unread,
Jan 31, 2013, 1:10:01 PM1/31/13
to
Andrei POPESCU schrieb am Donnerstag, den 31.01.2013 um 19:56:
> On Jo, 31 ian 13, 18:21:12, Til Schubbe wrote:
> >
> > ist es kein Unterschied: ein UTF-8-File mit cat oder more auszugeben
> > ist kein Problem. Aber mit less werden nur die kleinen Umlaute
> > korrekt dargestellt; der Rest in dieser Art: ?[7m204, wobei das ? in
> > einer kleinen inversen Raute steht.
>
> Das ist aber Komisch. Ich musste bis jetzt noch nie irgendwas an less
> konfigurieren solange ich das richtige Terminal Emulator + Font benutzt
> habe. Könntest Du vielleicht eine solche Datei hier anhängen? Besser
> gzipped, damit Email Programme/Server nicht auch ins Spiel kommen.

Der Befehl zum Erstellen einer Datei steht in Tils erstem Betrag
zu diesem Diskussionsfaden.

Mit einem Debian 5.0.7 konnte ich den Effekt reproduzieren.

Wenn stdout von "less" jedoch in eine Pipe umgelenkt wird, dann
tritt der Effekt mit den Zeichen Ä Ö Ü und ß nicht mehr auf.

Mit dem "less" unter Ubuntu 10.04 LTS tritt der Effekt
auch in einem Terminal nicht auf.

Viele Grüße, Peter Funk
--
Peter Funk, home: ✉Oldenburger Str.86, D-27777 Ganderkesee
mobile:+49-179-640-8878 phone:+49-421-20419-0 <http://www.artcom-gmbh.de/>
office: ArtCom GmbH, ✉Haferwende 2, D-28357 Bremen, Germany


--
Zum AUSTRAGEN schicken Sie eine Mail an debian-user-g...@lists.debian.org
mit dem Subject "unsubscribe". Probleme? Mail an listm...@lists.debian.org (engl)
Archive: http://lists.debian.org/2013013118...@artcom0.artcom-gmbh.de

Til Schubbe

unread,
Jan 31, 2013, 1:10:02 PM1/31/13
to
* Am 31.01. meinte Elimar Riesebieter:

> * Til Schubbe <li...@lists.schubbe.org> [2013-01-31 18:21 +0100]:
>
> [...]
> > ist es kein Unterschied: ein UTF-8-File mit cat oder more auszugeben
> > ist kein Problem. Aber mit less werden nur die kleinen Umlaute
> > korrekt dargestellt; der Rest in dieser Art: ?[7m204, wobei das ? in
> > einer kleinen inversen Raute steht.
>
> Was sagt
>
> $ printenv | grep -i less

LESSKEY=/etc/lesskey.bin
PAGER=less
LESSCHARSET=UTF-8
LESS=-M -S -I -R -#16
LESSOPEN=|/usr/bin/lesspipe %s

Gruß
Til


--
Zum AUSTRAGEN schicken Sie eine Mail an debian-user-g...@lists.debian.org
mit dem Subject "unsubscribe". Probleme? Mail an listm...@lists.debian.org (engl)
Archive: http://lists.debian.org/20130131180...@schubbi-net.local

Spiro Trikaliotis

unread,
Jan 31, 2013, 2:30:02 PM1/31/13
to
Hallo,

* On Thu, Jan 31, 2013 at 07:07:44PM +0100 Til Schubbe wrote:
> * Am 31.01. meinte Elimar Riesebieter:

> > $ printenv | grep -i less
>
> LESSKEY=/etc/lesskey.bin
> PAGER=less
> LESSCHARSET=UTF-8
> LESS=-M -S -I -R -#16
> LESSOPEN=|/usr/bin/lesspipe %s

Schon mal probiert, alle diese Variablen zu löschen? Tritt es dann immer
noch auf?

Irgendwie kommt mir -R in LESS komisch vor, allerdings habe ich es nie
benutzt.

Beste Grüße,
Spiro.

--
Spiro R. Trikaliotis
http://www.trikaliotis.net/


--
Zum AUSTRAGEN schicken Sie eine Mail an debian-user-g...@lists.debian.org
mit dem Subject "unsubscribe". Probleme? Mail an listm...@lists.debian.org (engl)
Archive: http://lists.debian.org/20130131192...@trikaliotis.net

Til Schubbe

unread,
Jan 31, 2013, 3:40:01 PM1/31/13
to
Hallo,

* Am 31.01. meinte Spiro Trikaliotis:

> * On Thu, Jan 31, 2013 at 07:07:44PM +0100 Til Schubbe wrote:
> > * Am 31.01. meinte Elimar Riesebieter:
>
> > > $ printenv | grep -i less
> >
> > LESSKEY=/etc/lesskey.bin
> > PAGER=less
> > LESSCHARSET=UTF-8
> > LESS=-M -S -I -R -#16
> > LESSOPEN=|/usr/bin/lesspipe %s
>
> Schon mal probiert, alle diese Variablen zu löschen? Tritt es dann immer
> noch auf?

Danke! Habe LESSKEY gelöscht. Nun gibt less meine paar Bytes korrekt
aus.

Hoffentlich funktioniert deswegen nicht etwas anderes nicht mehr...

> Irgendwie kommt mir -R in LESS komisch vor, allerdings habe ich es nie
> benutzt.

Hm, es steht jedenfalls nicht in der Manpage. Vielleicht eine Altlast
bei mir. ;-)

Gruß
Til


--
Zum AUSTRAGEN schicken Sie eine Mail an debian-user-g...@lists.debian.org
mit dem Subject "unsubscribe". Probleme? Mail an listm...@lists.debian.org (engl)
Archive: http://lists.debian.org/2013013120...@schubbi-net.local

Heiko Schlittermann

unread,
Jan 31, 2013, 4:20:02 PM1/31/13
to
Til Schubbe <li...@lists.schubbe.org> (Do 31 Jan 2013 21:36:54 CET):
> Hallo,
>
> * Am 31.01. meinte Spiro Trikaliotis:
>
> > * On Thu, Jan 31, 2013 at 07:07:44PM +0100 Til Schubbe wrote:
> > > * Am 31.01. meinte Elimar Riesebieter:
> >
> > > > $ printenv | grep -i less
> > >
> > > LESSKEY=/etc/lesskey.bin
> > > PAGER=less
> > > LESSCHARSET=UTF-8
> > > LESS=-M -S -I -R -#16
> > > LESSOPEN=|/usr/bin/lesspipe %s
> >
> > Schon mal probiert, alle diese Variablen zu löschen? Tritt es dann immer
> > noch auf?
>
> Danke! Habe LESSKEY gelöscht. Nun gibt less meine paar Bytes korrekt
> aus.

Aha. Toll. Was stand denn drin in LESSKEY? Also in der lesskey.bin.


> > Irgendwie kommt mir -R in LESS komisch vor, allerdings habe ich es nie
> > benutzt.
>
> Hm, es steht jedenfalls nicht in der Manpage. Vielleicht eine Altlast
> bei mir. ;-)

-R or --RAW-CONTROL-CHARS
Like -r, but only ANSI "color" escape sequences are output in
"raw" form. Unlike -r, the screen appearance is maintained cor‐
rectly in most cases. ANSI "color" escape sequences are
sequences of the form:

ESC [ ... m


... testing.

Best regards from Dresden/Germany
Viele Grüße aus Dresden
Heiko Schlittermann
--
SCHLITTERMANN.de ---------------------------- internet & unix support -
Heiko Schlittermann, Dipl.-Ing. (TU) - {fon,fax}: +49.351.802998{1,3} -
gnupg encrypted messages are welcome --------------- key ID: 7CBF764A -
gnupg fingerprint: 9288 F17D BBF9 9625 5ABC 285C 26A9 687E 7CBF 764A -
(gnupg fingerprint: 3061 CFBF 2D88 F034 E8D2 7E92 EE4E AC98 48D0 359B)-
signature.asc

Martin Steigerwald

unread,
Feb 1, 2013, 4:50:02 AM2/1/13
to
Am Donnerstag, 31. Januar 2013 schrieb Heiko Schlittermann:
> > > Irgendwie kommt mir -R in LESS komisch vor, allerdings habe ich es
> > > nie benutzt.
> >
> >
> >
> > Hm, es steht jedenfalls nicht in der Manpage. Vielleicht eine Altlast
> > bei mir. ;-)
>
> -R or --RAW-CONTROL-CHARS
> Like -r, but only ANSI "color" escape
> sequences are output in "raw" form. Unlike -r, the screen appearance
> is maintained cor‐
> rectly in most cases. ANSI "color" escape sequences are
> sequences of the form:
>
> ESC [ ... m
>
>
> ... testing.

Ich glaube das ist für die Anzeige von via script und möglicherweise auch
screen log aufgezeichneten Shell-Sitzungen, wo Cursor-Steuerzeichen usw.
drinnen sind, die less dann nicht als solche anzeigt, sondern ausführt.

Kann aber sein, dass ich das mit einer anderen Option verwechsele.

--
Martin 'Helios' Steigerwald - http://www.Lichtvoll.de
GPG: 03B0 0D6C 0040 0710 4AFA B82F 991B EAAC A599 84C7


--
Zum AUSTRAGEN schicken Sie eine Mail an debian-user-g...@lists.debian.org
mit dem Subject "unsubscribe". Probleme? Mail an listm...@lists.debian.org (engl)
Archive: http://lists.debian.org/201302011041...@lichtvoll.de

Til Schubbe

unread,
Feb 3, 2013, 9:30:02 AM2/3/13
to
* Am 31.01. meinte Heiko Schlittermann:

> Was stand denn drin in LESSKEY? Also in der lesskey.bin.

Bei mir gibt es 2 Dateien, lesskey.bin in einem unbekannten Format:

$ file lesskey.bin
lesskey.bin: data

und lesskey, beide mit demselben uralten Datum. In der Textdatei
lesskey steht neben verschiedenen Tastendefinitionen auch das hier
drin:

LESSCHARSET=latin1
LESSBINFMT=*s\%o

Beides steht auch in lesskey.bin:
$ hex lesskey.bin
[...]
1b 4f 6e 00 87 2e 00 76 - 25 00 4c 45 53 53 43 48 [On@..@v%@LESSCH
41 52 53 45 54 00 81 6c - 61 74 69 6e 31 00 4c 45 ARSET@.latin1@LE
53 53 42 49 4e 46 4d 54 - 00 81 2a 73 25 6f 00 78 SSBINFMT@.*s%o@x

Daher gehe gehe ich davon aus, daß meine lesskey.bin mit irgendeinem
Programm aus dieser lesskey erzeugt wurde (bei einem früheren
Debian-Installationsvorgang?) und der Fehler in diesem Setzen von
LESSCHARSET bestand.

Gruß
Til


--
Zum AUSTRAGEN schicken Sie eine Mail an debian-user-g...@lists.debian.org
mit dem Subject "unsubscribe". Probleme? Mail an listm...@lists.debian.org (engl)
Archive: http://lists.debian.org/2013020314...@schubbi-net.local
0 new messages