Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

Apache2: Standard charset ist nicht UTF-8

160 views
Skip to first unread message

Thomas Kuster

unread,
Jul 20, 2009, 8:30:15 AM7/20/09
to
Hallo Zusammen

Wieso ist auf meinem Debian Lenny der Apache2 standardmässig nicht auf UTF-8
eingestellt und wie ändere ich das?

Gruss
Thomas

wget -S --spider localhost/bla
Spider-Modus eingeschaltet. Prüfe ob die Datei auf dem Server existiert.
--2009-07-20 14:19:04-- http://localhost/bla
Auflösen des Hostnamen »localhost«.... 127.0.0.1, ::1
Verbindungsaufbau zu localhost|127.0.0.1|:80... verbunden.
HTTP Anforderung gesendet, warte auf Antwort...
HTTP/1.1 404 Not Found
Date: Mon, 20 Jul 2009 12:19:04 GMT
Server: Apache/2.2.9 (Debian) PHP/5.2.6-1+lenny3 with Suhosin-Patch
mod_python/3.3.1 Python/2.5.2 mod_perl/2.0.4 Perl/v5.10.0
Vary: Accept-Encoding
Keep-Alive: timeout=15, max=100
Connection: Keep-Alive
Content-Type: text/html; charset=iso-8859-1
Die Datei auf dem Server existiert nicht -- Link nicht gültig!

export
declare -x HOME="/root"
declare -x LANG="de_CH.UTF-8"
declare -x LOGNAME="root"


--
Haeufig gestellte Fragen und Antworten (FAQ):
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an debian-user-g...@lists.debian.org
mit dem Subject "unsubscribe". Probleme? Mail an listm...@lists.debian.org (engl)

Robert Grimm

unread,
Jul 20, 2009, 9:20:11 AM7/20/09
to
Thomas Kuster <deb...@fam-kuster.ch> wrote:
> Wieso ist auf meinem Debian Lenny der Apache2 standardm�ssig nicht auf UTF-8
> eingestellt und wie �ndere ich das?

Weshalb willst du das? Es ist nicht gut apache dazu zu zwingen, alles in
UTF-8 auszuliefern. Normalerweise wei� er selbst, welche Kodierung die
passende ist.

Rob
--
Netter Versuch, das Weltklima durch �berm��ige CPU-Zeit-Vergeudung zur
Erzielung von meist eingebildeten Performance-"Verbesserungen" mittels
vollkommen irrelevanter Optimierungen zu beeinflussen.
--Sven Hartge �ber Gentoo

Thomas Kuster

unread,
Jul 20, 2009, 9:40:11 AM7/20/09
to
Am Monday 20 July 2009 15.00:33 schrieb Robert Grimm:
> Thomas Kuster <deb...@fam-kuster.ch> wrote:
> > Wieso ist auf meinem Debian Lenny der Apache2 standardmässig nicht auf
> > UTF-8 eingestellt und wie ändere ich das?

>
> Weshalb willst du das? Es ist nicht gut apache dazu zu zwingen, alles in
> UTF-8 auszuliefern. Normalerweise weiß er selbst, welche Kodierung die
> passende ist.

Wie soll er dann die richtige Kodierung einer *.php oder *.html Datei
rausfinden? Er findet sie bei mir auf jedenfall nicht raus, wenn ich nun ein
Umlaut in so einer Datei haben und die UTF-8 kodiert ist sendet er die als
ISO-8859-1 raus und somit wird z.B. aus "Zähler" ein "Zähler".

Gruss
Thomas

> Rob
> --
> Netter Versuch, das Weltklima durch übermäßige CPU-Zeit-Vergeudung zur


> Erzielung von meist eingebildeten Performance-"Verbesserungen" mittels
> vollkommen irrelevanter Optimierungen zu beeinflussen.

> --Sven Hartge über Gentoo

Thomas Kuster

unread,
Jul 20, 2009, 9:50:09 AM7/20/09
to
Am Monday 20 July 2009 15.00:33 schrieb Robert Grimm:
> Thomas Kuster <deb...@fam-kuster.ch> wrote:
> > Wieso ist auf meinem Debian Lenny der Apache2 standardmässig nicht auf
> > UTF-8 eingestellt und wie ändere ich das?

>
> Weshalb willst du das? Es ist nicht gut apache dazu zu zwingen, alles in
> UTF-8 auszuliefern. Normalerweise weiß er selbst, welche Kodierung die
> passende ist.

Hab nun gefunden wo dies konfiguriert wird:
thomas@itix:/etc/apache2/conf.d$ cat charset
# Read the documentation before enabling AddDefaultCharset.
# In general, it is only a good idea if you know that all your files
# have this encoding. It will override any encoding given in the files
# in meta http-equiv or xml encoding tags.

#AddDefaultCharset UTF-8

Ich kapiere allerdings immer noch nicht wieso zum Beispiel eine Fehlermeldung
dann ISO-8859-1 ist und nicht UTF-8. Ich möchte eigentlich erreichen, dass er
UTF-8 sendet wenn nichts via http-equiv oder so gesetzt ist. Dann sollte aus
meiner Sicht auch eine Fehlermeldung UTF-8 gesendet werden bzw. eine Datei in
der die Kodierung nicht festgelegt wurde.

Alle meine alten Dateien sind reines ASCII also mit &uuml; und so. Aber dafür
bin ich inzwischen zu faul.

Gruss
Thomas

> Rob
> --
> Netter Versuch, das Weltklima durch übermäßige CPU-Zeit-Vergeudung zur


> Erzielung von meist eingebildeten Performance-"Verbesserungen" mittels
> vollkommen irrelevanter Optimierungen zu beeinflussen.

> --Sven Hartge über Gentoo

Robert Grimm

unread,
Jul 20, 2009, 10:40:12 AM7/20/09
to
Thomas Kuster <deb...@fam-kuster.ch> wrote:
> Wie soll er dann die richtige Kodierung einer *.php oder *.html Datei
> rausfinden? Er findet sie bei mir auf jedenfall nicht raus, wenn ich nun ein
> Umlaut in so einer Datei haben und die UTF-8 kodiert ist sendet er die als
> ISO-8859-1 raus und somit wird z.B. aus "Z�hler" ein "Zähler".

Ist denn das encoding in der Datei korrekt angegeben? Wenn keines
angegeben ist, ist ISO-8859-1 default.

Steht was in /etc/apache2/conf.d/charset?

Dort kannst du �brigens utf-8 erzwingen, dann hast du halt Probleme mit
Umlauten die in iso-8859-* kodiert sind.

Rob
--
> Linux is not user-friendly.
It _is_ user-friendly. It is not ignorant-friendly and idiot-friendly.
-- Seen somewhere on the net

Maik Stubbe

unread,
Jul 20, 2009, 10:50:13 AM7/20/09
to

Am 20.07.2009 um 15:34 schrieb Thomas Kuster:

> Am Monday 20 July 2009 15.00:33 schrieb Robert Grimm:
>> Thomas Kuster <deb...@fam-kuster.ch> wrote:
>>> Wieso ist auf meinem Debian Lenny der Apache2 standardmässig nicht
>>> auf
>>> UTF-8 eingestellt und wie ändere ich das?
>>
>> Weshalb willst du das? Es ist nicht gut apache dazu zu zwingen,
>> alles in
>> UTF-8 auszuliefern. Normalerweise weiß er selbst, welche Kodierung
>> die
>> passende ist.
>
> Wie soll er dann die richtige Kodierung einer *.php oder *.html Datei
> rausfinden? Er findet sie bei mir auf jedenfall nicht raus, wenn ich
> nun ein
> Umlaut in so einer Datei haben und die UTF-8 kodiert ist sendet er
> die als
> ISO-8859-1 raus und somit wird z.B. aus "Zähler" ein "Zähler".

Wenn du vernünftiges html nutzt kannst du das z.B. mit <meta http-
equiv="content-type" content="text/html; charset=ISO-8859-1"> lösen.
Nachzulesen hier: http://de.selfhtml.org/html/kopfdaten/meta.htm#zeichenkodierung

Grüße

Maik

Florian Sievers

unread,
Jul 20, 2009, 10:50:13 AM7/20/09
to
Am Montag, den 20.07.2009, 15:34 +0200 schrieb Thomas Kuster:
> Am Monday 20 July 2009 15.00:33 schrieb Robert Grimm:
> > Thomas Kuster <deb...@fam-kuster.ch> wrote:
> > > Wieso ist auf meinem Debian Lenny der Apache2 standardmässig nicht auf
> > > UTF-8 eingestellt und wie ändere ich das?
> >
> > Weshalb willst du das? Es ist nicht gut apache dazu zu zwingen, alles in
> > UTF-8 auszuliefern. Normalerweise weiß er selbst, welche Kodierung die
> > passende ist.
>
> Wie soll er dann die richtige Kodierung einer *.php oder *.html Datei
> rausfinden? Er findet sie bei mir auf jedenfall nicht raus, wenn ich nun ein
> Umlaut in so einer Datei haben und die UTF-8 kodiert ist sendet er die als
> ISO-8859-1 raus und somit wird z.B. aus "Zähler" ein "Zähler".

Hmm, schon mal in den entsprechenden Dateien geschaut, was dort
definiert ist?
Z.B. die Meta-Tags in einer HTML-Datei:
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

Damit weiß dann auch der Browser, wie er die Daten vom Server zu
interpretieren hat.

Gruß
Florian

--
Florian Sievers <flo...@dynamic-core.ath.cx>

Thomas Kuster

unread,
Jul 20, 2009, 11:50:08 AM7/20/09
to
Am Monday 20 July 2009 16.20:15 schrieb Robert Grimm:
> Thomas Kuster <deb...@fam-kuster.ch> wrote:
> > Wie soll er dann die richtige Kodierung einer *.php oder *.html Datei
> > rausfinden? Er findet sie bei mir auf jedenfall nicht raus, wenn ich nun
> > ein Umlaut in so einer Datei haben und die UTF-8 kodiert ist sendet er
> > die als ISO-8859-1 raus und somit wird z.B. aus "Zähler" ein "Zähler".

>
> Ist denn das encoding in der Datei korrekt angegeben? Wenn keines
> angegeben ist, ist ISO-8859-1 default.

Die default Einstellung möchte ich ändern

> Steht was in /etc/apache2/conf.d/charset?

Nix bzw. alles auskommentiert. Habe die zuerst nicht gefunden.

> Dort kannst du übrigens utf-8 erzwingen, dann hast du halt Probleme mit


> Umlauten die in iso-8859-* kodiert sind.

Aber die Server Einstellung also die Headerinformation bzw. ein
<?php
header('Content-type: text/html; charset=utf-8');
?>
wird doch höher gewichtet als ein:


<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

daher möchte ich dass wenn nichts gesetzt ist der Server ein charset=utf-8
raussendet, aber es trotzdem möglich wäre mit einem:
<meta http-equiv="Content-Type" content="text/html; charset=ISO-?8859-1" />
auf ISO umzuschalten.
So wie ich das verstanden habe erzwingt das setzen des charset
in /etc/apache2/conf.d/charset dann aber dieses charset. Muss das mal
ausprobieren.

Gruss
THomas

Manfred Schmitt

unread,
Jul 20, 2009, 2:20:13 PM7/20/09
to
Thomas Kuster schrieb:

>
> Ich kapiere allerdings immer noch nicht wieso zum Beispiel eine Fehlermeldung
> dann ISO-8859-1 ist und nicht UTF-8. Ich möchte eigentlich erreichen, dass er
> UTF-8 sendet wenn nichts via http-equiv oder so gesetzt ist. Dann sollte aus
> meiner Sicht auch eine Fehlermeldung UTF-8 gesendet werden bzw. eine Datei in
> der die Kodierung nicht festgelegt wurde.
>
Siehe /usr/share/apache2/error/*

Und wech,
Manne

Thomas Kuster

unread,
Jul 21, 2009, 5:50:14 AM7/21/09
to
Am Monday 20 July 2009 20.00:13 schrieb Manfred Schmitt:
> Thomas Kuster schrieb:
> > Ich kapiere allerdings immer noch nicht wieso zum Beispiel eine
> > Fehlermeldung dann ISO-8859-1 ist und nicht UTF-8. Ich möchte eigentlich
> > erreichen, dass er UTF-8 sendet wenn nichts via http-equiv oder so
> > gesetzt ist. Dann sollte aus meiner Sicht auch eine Fehlermeldung UTF-8
> > gesendet werden bzw. eine Datei in der die Kodierung nicht festgelegt
> > wurde.
>
> Siehe /usr/share/apache2/error/*

Aha auch ISO. Nun stellt sich mir noch eine Frage mehr. Wie könnte ich dem
Apache beibringen dass er die Deutsche 404 ausliefert wenn im Browser als
bevorzugte Sprache Deutsch gewählt wurde?

Gruss
Thomas

Robert Grimm

unread,
Jul 21, 2009, 6:40:20 AM7/21/09
to
Thomas Kuster <deb...@fam-kuster.ch> wrote:
> Aha auch ISO. Nun stellt sich mir noch eine Frage mehr. Wie k�nnte ich dem
> Apache beibringen dass er die Deutsche 404 ausliefert wenn im Browser als
> bevorzugte Sprache Deutsch gew�hlt wurde?

Such mal in der /etc/apache2/apache2.conf nach ErrorDocument

Rob
--
Entschuldige mal, wir sind Geeks, oder? Wenn eine Frau mit
Nachnamen nicht .jpg heisst, hat sie per se verloren.
--Urs [Ayahuasca] Traenkner in de.comp.os.unix.linux.misc

Thomas Kuster

unread,
Jul 21, 2009, 9:00:08 AM7/21/09
to
Am Tuesday 21 July 2009 12.25:24 schrieb Robert Grimm:
> Thomas Kuster <deb...@fam-kuster.ch> wrote:
> > Aha auch ISO. Nun stellt sich mir noch eine Frage mehr. Wie könnte ich

> > dem Apache beibringen dass er die Deutsche 404 ausliefert wenn im Browser
> > als bevorzugte Sprache Deutsch gewählt wurde?

>
> Such mal in der /etc/apache2/apache2.conf nach ErrorDocument

Aha, Danke. Die 30 Linien auskommentieren und noch die include.conf nach
mod-enable linken und es geht.

Dann bleibt nun nur noch die Frage offen wie ich dem Apache beibringen kann
den Header auf UTF-8 zu stellen wenn nichts angegeben ist anstelle ISO zu
setzen.

Gruss
Thomas

Manfred Schmitt

unread,
Jul 22, 2009, 9:00:20 AM7/22/09
to
Thomas Kuster schrieb:

>
> Dann bleibt nun nur noch die Frage offen wie ich dem Apache beibringen kann
> den Header auf UTF-8 zu stellen wenn nichts angegeben ist anstelle ISO zu
> setzen.
>
Aeh, das Thema hatten wir schon oder nicht?
http://httpd.apache.org/docs/2.0/mod/core.html#adddefaultcharset
Wozu ueberhaupt der ganze Aufwand, hast Du eine Iso-Allergie? ;-)

Und wech,
Manne

Hans-Dietrich Kirmse

unread,
Jul 22, 2009, 10:20:09 AM7/22/09
to
Hallo,

Da mich dieses Thema auch interessiert/betrifft, auch von mir einen
Kommentar.

Manfred Schmitt schrieb:


> Thomas Kuster schrieb:
>> Dann bleibt nun nur noch die Frage offen wie ich dem Apache beibringen kann
>> den Header auf UTF-8 zu stellen wenn nichts angegeben ist anstelle ISO zu
>> setzen.
>>
> Aeh, das Thema hatten wir schon oder nicht?
> http://httpd.apache.org/docs/2.0/mod/core.html#adddefaultcharset

Danke f�r den Hinweis.

> Wozu ueberhaupt der ganze Aufwand,

ich kann mich mal an (f�r mich unverst�ndliche) Reaktionen hier in
dieser Liste erinnern, als es um diese URL ging:

http://www.brummer.de.hm/buildpaket.html

hier wurde m.E. massiv die Meinung vertreten, Seiten die nicht richtig
codiert sind, die braucht man sich nicht anschauen. Allerdings war und
ist die aus meiner Sicht die einzige Quelle gewesen, die meinen
Anforderungen gerecht wurde. Problem ist: diese Seite verwendet(e) den
Zeichensatz utf-8. Stellte man das h�ndisch im Browser ein, gab es
�berhaupt keine Probleme. Trotzdem gab es (Akzeptanz-)Probleme, die sich
in Wohlgefallen aufgel�st h�tten, w�re der Webserver eben so pr�pariert
gewesen. Zumindest sehe ich das so.

> hast Du eine Iso-Allergie? ;-)

Ich kann nur f�r mich sprechen: es geht bei uns um ein Projekt, wo eben
grunds�tzlich alles utf-8 verwenden sollte (zumindest habe ich das so
verstanden). Dann betrifft das sicherlich auch den Apache und dann
interessiert, wie man diese Anforderung *vollst�ndig* durchsetzen kann.

Und ich habe das auch so gesehen, dass die bisherigen Antworten die
Frage noch nicht ersch�pfend beantwortet hatten. Will damit nur sagen,
das ich sehr dankbar bin, dass man dieses Thema so hartn�ckig verfolgt hat.

Mit freundlichen Gr��en
Hans-Dietrich


PS: mir ist jetzt gerade aufgefallen, dass diese "Brummer-Seite" nicht
mehr verf�gbar ist. Leider ist eine Kopie, die ich damals gemacht hatte
ebenfalls abhanden gekommen. :( Hat jemand eine Idee, wie man diese
Seite irgendwie irgendwo hervorholen kann? w�re mir sehr wichtig.

Thomas Kuster

unread,
Jul 22, 2009, 2:50:12 PM7/22/09
to
Am Wednesday 22 July 2009 14.33:17 schrieb Manfred Schmitt:
> Thomas Kuster schrieb:
> > Dann bleibt nun nur noch die Frage offen wie ich dem Apache beibringen
> > kann den Header auf UTF-8 zu stellen wenn nichts angegeben ist anstelle
> > ISO zu setzen.
>
> Aeh, das Thema hatten wir schon oder nicht?
> http://httpd.apache.org/docs/2.0/mod/core.html#adddefaultcharset

Das habe ich auch nachgelesen und das Verhalten ist auch so wie beschrieben.
Nur möchte ich etwas anderes erreichen. Schreibe mal zwischen den Text von
httpd.apache.org dazwischen:
"Die Direktive gibt einen Standardwert für den Charset-Paramter des Medientyps
(den Namen einer Zeichencodierung) an, der einer Antwort genau dann
hinzugefügt wird, wenn der Content-Type der Antwort entweder text/plain oder
text/html ist. Dies sollte jedes mittels META-Element im Datenteil der
Antwort angegebene Charset überschreiben."

Setze ich das also, wird jedes Charset das mittels META-Element gesetzt wird
überschrieben. Ich möchte aber, dass das META-Element beachtet wird. Apache
aber wenn _keines_ gesetzt ist, im Header charset=UTF-8 setzt und nicht ISO….

"Das genaue Verhalten hängt jedoch oft von der Client-Konfiguration des
Benutzers ab."

Okay gut, kann auch dann mal in die Hose gehen. Priorität hat aber wohl
meistens die Info im Header.

"Die Einstellung AddDefaultCharset Off deaktiviert diese Funktionalität.
AddDefaultCharset On aktiviert die Standard-Zeichenkodierung iso-8859-1.
Jeder andere Wert wird als die zu verwendende Zeichenkodierung aufgefaßt, die
eines der bei IANA registrierten Charset-Werte zur Verwendung in
MIME-Medientypen sein sollte.

AddDefaultCharset sollte nur verwendet werden, wenn von allen Textressourcen,
für die es gilt, bekannt ist, dass sie in dieser Zeichkodierung vorliegen,
oder wenn es zu unbequem ist, ihre Zeichenkodierung indivuell zu benennen."

Genau mir ist es zu unbequem;-). Ich habe mir angewöhnt alles in UTF-8 zu
machen und wollte das nun auch bei den HTML-Seiten machen, raus kamen dann
halt kein Umlaute, da ich vorher immer &uuml; und so Zeug verwendet habe und
mich daher auch nie um das META-Element für die Kodierung gekümmert habe.
Werde das nun aber schön brav immer notieren, macht ja auch Sinn.

> Wozu ueberhaupt der ganze Aufwand, hast Du eine Iso-Allergie? ;-)

Ja das auch:-).

> Und wech,
> Manne

Gruss
Thomas

Michael Vogt

unread,
Jul 22, 2009, 3:20:04 PM7/22/09
to
Hallo Thomas,

Thomas Kuster schrieb:


> "Die Direktive gibt einen Standardwert für den Charset-Paramter des Medientyps
> (den Namen einer Zeichencodierung) an, der einer Antwort genau dann
> hinzugefügt wird, wenn der Content-Type der Antwort entweder text/plain oder
> text/html ist. Dies sollte jedes mittels META-Element im Datenteil der
> Antwort angegebene Charset überschreiben."
>
> Setze ich das also, wird jedes Charset das mittels META-Element gesetzt wird
> überschrieben. Ich möchte aber, dass das META-Element beachtet wird. Apache
> aber wenn _keines_ gesetzt ist, im Header charset=UTF-8 setzt und nicht ISO….
>

Ich verstehe den Punkt nicht so ganz. Hier sendet apache2 wenn ich
"AddDefaultCharset Off" mache einfach kein "charset="-Anhängsel mehr
hinter dem Content-Type. Damit dürfte sich der Browser voll und ganz auf
die META-tags und die internen Präferenzen verlassen. Firefox zumindest
interpretiert bei mir eine UTF-8-Seite dann auch weiterhin als UTF-8,
obwohl es keine META-Angabe gibt. Im IE8 wird wohl ISO standardmäßig
UTF-8 vorgezogen, dort sind die Umlaute falsch.

Wenn ich dich aber richtig verstehe, willst du das apache2 zuerst im
HTML-Code nach einem META-Element sucht und, wenn nicht vorhanden, dann
einen Header sendet. Ein Modul das apache2 aber eine fertig geparste
Seite (es muss ja kein .html sein, geht ja auch .php etc) nochmals
durchchecken lässt und dann evtl. noch einen Header verändert kenne ich
aber nicht.
Anders kann ich deinen Text nicht interpretieren, da zumindest hier
apache2 bei "AddDefaultCharset Off" weder ISO, noch UTF-8 oder sonst ein
Charset gesendet hat sondern der Browser selbst entscheiden musste was
er nun dem User anzeigt. Wenn ich dich falsch verstanden haben sollte,
bitte ich um Berichtigung.
>
> Gruss
> Thomas
Grüße,
Michael

signature.asc

Robert Grimm

unread,
Jul 22, 2009, 3:30:09 PM7/22/09
to

> hier wurde m.E. massiv die Meinung vertreten, Seiten die nicht richtig
> codiert sind, die braucht man sich nicht anschauen. Allerdings war und
> ist die aus meiner Sicht die einzige Quelle gewesen, die meinen
> Anforderungen gerecht wurde. Problem ist: diese Seite verwendet(e) den
> Zeichensatz utf-8. Stellte man das h�ndisch im Browser ein, gab es
> �berhaupt keine Probleme. Trotzdem gab es (Akzeptanz-)Probleme, die sich
> in Wohlgefallen aufgel�st h�tten, w�re der Webserver eben so pr�pariert
> gewesen. Zumindest sehe ich das so.

Im Quelltext der Seite steht:
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">

Was scheinbar auch stimmt.

W�re beim ausliefernden Apachen jetzt AddDefaultCharset utf-8 gesetzt,
w�re sie kaputt.

> Ich kann nur f�r mich sprechen: es geht bei uns um ein Projekt, wo eben
> grunds�tzlich alles utf-8 verwenden sollte (zumindest habe ich das so
> verstanden). Dann betrifft das sicherlich auch den Apache und dann
> interessiert, wie man diese Anforderung *vollst�ndig* durchsetzen kann.

<meta http-equiv="Content-Type" content="text/html;charset="UTF-8">
Wenn du nicht-ASCII Zeichen in die Datei reinschreibst, solltest du das
in der Datei klar stellen.

Wenn du das nicht willst und du dir _ganz_ sicher bist, da� alles was
der Apache ausliefert UTF-8 ist, setze AddDefaultCharset UTF-8.

Ich sehe allerdings den Sinn einer solchen Anforderung nicht.

Rob
--
In Linux werden mehr Sicherheitsl�cken gefunden.
In Windows sind mehr Sicherheitsl�cken drin.
-- Lutz Donnerhacke

Hans-Dietrich Kirmse

unread,
Jul 22, 2009, 3:50:12 PM7/22/09
to
Hallo Robert,

Robert Grimm schrieb:


> Hans-Dietrich Kirmse <hd.k...@gmx.de> wrote:
>> http://www.brummer.de.hm/buildpaket.html
>
>> hier wurde m.E. massiv die Meinung vertreten, Seiten die nicht richtig
>> codiert sind, die braucht man sich nicht anschauen. Allerdings war und
>> ist die aus meiner Sicht die einzige Quelle gewesen, die meinen
>> Anforderungen gerecht wurde. Problem ist: diese Seite verwendet(e) den
>> Zeichensatz utf-8. Stellte man das h�ndisch im Browser ein, gab es
>> �berhaupt keine Probleme. Trotzdem gab es (Akzeptanz-)Probleme, die sich
>> in Wohlgefallen aufgel�st h�tten, w�re der Webserver eben so pr�pariert
>> gewesen. Zumindest sehe ich das so.
>
> Im Quelltext der Seite steht:
> <meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">

wie kommst du an die Seite (das ist das Wichtigste f�r mich ;) )?
Wenn ich die URL aufrufe kommt: Objekt nicht gefunden! ... Error 404 ...

> Was scheinbar auch stimmt.

aus der Erinnerung: die Seite ist in UTF-8. Zumindest verschwanden dann
die Hyroglyphen, wenn diese Codierung im Browser eingestellt wurde.

> W�re beim ausliefernden Apachen jetzt AddDefaultCharset utf-8 gesetzt,
> w�re sie kaputt.

kann ich nicht glauben.

> <meta http-equiv="Content-Type" content="text/html;charset="UTF-8">
> Wenn du nicht-ASCII Zeichen in die Datei reinschreibst, solltest du das
> in der Datei klar stellen.

das mag alles richtig sein, aber es geht nicht um meine Seiten, sondern
um die Konfiguration eines Servers, bei dem dann andere Seiten reinstellen.

> Wenn du das nicht willst und du dir _ganz_ sicher bist, da� alles was
> der Apache ausliefert UTF-8 ist, setze AddDefaultCharset UTF-8.

Die Situation ist etwas anders: wenn man einen Server (es geht um einen
Schulserver auf Debian-Basis) bereitstellt, dann sollte man doch dem
Admins dann angeben, wie die Seiten per Voreinstellung ausgeliefert
werden. Wenn eben (im Handbuch) angegeben wird, die werden in UTF-8
ausgeliefert, dann sollte das *standardm��ig* auch so sein - immer!
Ansonsten kann man sich doch solche Angaben schenken, oder etwa nicht?

Wenn das jemand (also der betreffende Webmaster) anders haben will, dann
muss der das eben mit einer solchen Meta-Tag-Angabe �berschreiben.

> Ich sehe allerdings den Sinn einer solchen Anforderung nicht.

Ich hoffe, der Sinn ist jetzt zu verstehen.

Trotzdem: hast du diese oben angegebene Seite zuf�llig als Kopie? es
ging darum, wie man selbst erstellte Scripte in Debian-Pakete packt.


Mit freundlichen Gr��en
Hans-Dietrich

--

Robert Grimm

unread,
Jul 22, 2009, 5:10:06 PM7/22/09
to
Hans-Dietrich Kirmse <hd.k...@gmx.de> wrote:
> wie kommst du an die Seite (das ist das Wichtigste f�r mich ;) )?
> Wenn ich die URL aufrufe kommt: Objekt nicht gefunden! ... Error 404 ...

U - Enter, kein Problem. Du suchst aber glaube ich eher
https://brain.kicks-ass.org/~hermann//buildpaket.html

Die gibts wohl nicht mehr.

> Die Situation ist etwas anders: wenn man einen Server (es geht um einen
> Schulserver auf Debian-Basis) bereitstellt, dann sollte man doch dem
> Admins dann angeben, wie die Seiten per Voreinstellung ausgeliefert
> werden. Wenn eben (im Handbuch) angegeben wird, die werden in UTF-8
> ausgeliefert, dann sollte das *standardm��ig* auch so sein - immer!
> Ansonsten kann man sich doch solche Angaben schenken, oder etwa nicht?

Die Seiten werden in Voreinstellung so ausgeliefert, wie es in
http-equiv steht. Punkt.

Macht sich doch gut in einem Handbuch?

> Wenn das jemand (also der betreffende Webmaster) anders haben will, dann
> muss der das eben mit einer solchen Meta-Tag-Angabe �berschreiben.

Dann schreib ins Handbuch, wenn er in die Datei Umlaute oder so
schreiben will, sollen die deklariert werden. Oder entities verwenden.

> Trotzdem: hast du diese oben angegebene Seite zuf�llig als Kopie? es
> ging darum, wie man selbst erstellte Scripte in Debian-Pakete packt.

Ich bekomme nur eine Einstiegsseite zu sehen, weil die weiterleitung in
elinks nicht ausgef�hrt wird.

Rob
--
If all else fails, read the manual.

Manfred Schmitt

unread,
Jul 22, 2009, 7:10:09 PM7/22/09
to
Thomas Kuster schrieb:

> Am Wednesday 22 July 2009 14.33:17 schrieb Manfred Schmitt:

> > http://httpd.apache.org/docs/2.0/mod/core.html#adddefaultcharset
>
> Das habe ich auch nachgelesen und das Verhalten ist auch so wie beschrieben.
>

> Setze ich das also, wird jedes Charset das mittels META-Element gesetzt wird
> überschrieben. Ich möchte aber, dass das META-Element beachtet wird. Apache
> aber wenn _keines_ gesetzt ist, im Header charset=UTF-8 setzt und nicht ISO….
>

Wenn Du moechtest das der Meta-Header beachtet wird darf ganz einfach kein
AddDefaultCharset gesetzt sein, das ist doch klar beschrieben? :-)
OK, ich verstehe aber schon worauf Du hinaus willst.
Nichtsdestotrotz verstehe ich nicht warum es ein Problem ist das Charset
einfach im Meta-Header (und bei dynamischen Dokumente zusaetzlich noch im
Centent-Type) zu setzen und AddDefaultCharset auf Off zu belassen.

> "Das genaue Verhalten hängt jedoch oft von der Client-Konfiguration des
> Benutzers ab."
>
> Okay gut, kann auch dann mal in die Hose gehen. Priorität hat aber wohl
> meistens die Info im Header.
>

Hm, wie das genau ist weiss ich jetzt auch nicht, konsequenterweise sollte
nach einem "Accepted Charsets us-ascii" bei AddDefaultCharset UTF-8 ja
garnichts an den client geliefert werden.
Nach einem kurzem Test mit lynx ist das aber wohl nicht so.

> > Wozu ueberhaupt der ganze Aufwand, hast Du eine Iso-Allergie? ;-)
>
> Ja das auch:-).
>

Hm, ich seh das eher umgekehrt, UTF-8 ist ja noch unlesbarer als Quoted-
Printable -- zumindest unter nicht UTF-8-Systemen ;)

Und wech,
Manne

Peter Müller

unread,
Jul 22, 2009, 7:10:10 PM7/22/09
to
Thomas Kuster schrieb am 22.07.2009 20:44:
> Am Wednesday 22 July 2009 14.33:17 schrieb Manfred Schmitt:
>> Thomas Kuster schrieb:
>>> Dann bleibt nun nur noch die Frage offen wie ich dem Apache beibringen
>>> kann den Header auf UTF-8 zu stellen wenn nichts angegeben ist anstelle
>>> ISO zu setzen.
>> Aeh, das Thema hatten wir schon oder nicht?
>> http://httpd.apache.org/docs/2.0/mod/core.html#adddefaultcharset
>
> Das habe ich auch nachgelesen und das Verhalten ist auch so wie beschrieben.
> Nur möchte ich etwas anderes erreichen. Schreibe mal zwischen den Text von
> httpd.apache.org dazwischen:
> "Die Direktive gibt einen Standardwert für den Charset-Paramter des Medientyps
> (den Namen einer Zeichencodierung) an, der einer Antwort genau dann
> hinzugefügt wird, wenn der Content-Type der Antwort entweder text/plain oder
> text/html ist. Dies sollte jedes mittels META-Element im Datenteil der
> Antwort angegebene Charset überschreiben."
>
> Setze ich das also, wird jedes Charset das mittels META-Element gesetzt wird
> überschrieben. Ich möchte aber, dass das META-Element beachtet wird. Apache
> aber wenn _keines_ gesetzt ist, im Header charset=UTF-8 setzt und nicht ISO….

Das Meta-Element (zwischen <head> und </head> im Html-Dokument) taugt
nicht zur Angabe eines Charsets. Es dient bei schlechten Browsern dazu,
die Seite mit dem richtigen Charset anzuzeigen, nachdem sie lokal
gespeichert wurde. Bessere Browser ändern das Meta-Element in der Datei
und nehmen den Charset des Http-Headers, wenn sie das Dokument speichern.

Mit anderen Worten, vergiss das Meta-Element und sorge dafür, dass die
Http-Header richtig sind.

>
> "Das genaue Verhalten hängt jedoch oft von der Client-Konfiguration des
> Benutzers ab."
>
> Okay gut, kann auch dann mal in die Hose gehen. Priorität hat aber wohl
> meistens die Info im Header.

Wichtig ist hier, welchen header du meinst (s.o.).

(...)

> AddDefaultCharset sollte nur verwendet werden, wenn von allen Textressourcen,
> für die es gilt, bekannt ist, dass sie in dieser Zeichkodierung vorliegen,
> oder wenn es zu unbequem ist, ihre Zeichenkodierung indivuell zu benennen."

Ich würde an deiner Stelle eine Direktive nehmen:
http://httpd.apache.org/docs/2.2/configuring.html und
http://httpd.apache.org/docs/2.2/mod/core.html#directory

> Genau mir ist es zu unbequem;-). Ich habe mir angewöhnt alles in UTF-8 zu
> machen und wollte das nun auch bei den HTML-Seiten machen, raus kamen dann
> halt kein Umlaute, da ich vorher immer &uuml; und so Zeug verwendet habe und
> mich daher auch nie um das META-Element für die Kodierung gekümmert habe.
> Werde das nun aber schön brav immer notieren, macht ja auch Sinn.

Nee, macht keinen Sinn.

>> Wozu ueberhaupt der ganze Aufwand, hast Du eine Iso-Allergie? ;-)
>
> Ja das auch:-).

:-)


viele Grüße,

Peter

Manfred Schmitt

unread,
Jul 22, 2009, 7:10:09 PM7/22/09
to
Hans-Dietrich Kirmse schrieb:
>
> Robert Grimm schrieb:

> > Wenn du das nicht willst und du dir _ganz_ sicher bist, daß alles was


> > der Apache ausliefert UTF-8 ist, setze AddDefaultCharset UTF-8.
>
> Die Situation ist etwas anders: wenn man einen Server (es geht um einen
> Schulserver auf Debian-Basis) bereitstellt, dann sollte man doch dem
> Admins dann angeben, wie die Seiten per Voreinstellung ausgeliefert
> werden. Wenn eben (im Handbuch) angegeben wird, die werden in UTF-8

> ausgeliefert, dann sollte das *standardmäßig* auch so sein - immer!

Ja.
Aber wer schreibt denn so einen Unsinn in ein Handbuch wenn er es nicht
garantieren kann? :-)
In was fuer einem Charset die "Apache-Dokumente" erstellt werden sollte
erst einmal auch dem Ersteller ueberlassen werden, es ist imo einfach
kontraproduktiv das Charset kuenstlich fest zu nageln.
OK, trotzdem kann es "Projekt-bezogene" Richtlinien geben. Das Charset
ergibt sich dann aber ueblicherweise schon durch das genutzte OS bzw.
dessen Konfiguration.
Und wenn dann doch ein User ein anderes Charset nutzt muss er seine
Dokumente halt durch iconv jagen. Dieser User wird das dann aber auch
meisst selber wissen.
Und das genutzte Charset gehoert dann eben in den Meta-Header, dafuer
gibt es den ja.
Eine Loesung die immer funktioniert ist es uebrigens ganz einfach
konsequent HTML-Entities zu nutzen.
Das halte ich auch immer noch fuer die sinnvollste Loesung da die
Dokumente eben in jedem Fall korrekt ausgeliefert werden.
Und jetzt sag nicht das die Nutzer das nicht hinkriegen, die Auflage
ist im Gegensatz zur Vorgabe eines bestimmten Charsets Pipifax, das
faellt unter HTML-Grundkentnisse.
Bzw. bei reinen Nutzern die nichts mit HTML zu tun haben ist das Aufgabe
des Editors.

> Ansonsten kann man sich doch solche Angaben schenken, oder etwa nicht?
>

Wenn man AddDefaultCharset auf utf-8 setzt wird der Support-Aufwand
wenn nicht 100% klar ist das nur utf-8-Dokumente eingestellt werden
ins unermessliche steigen, da kann man dann ab 10 Usern direkt eine
Person anstellen die sich nur um das Problem kuemmert.

> Wenn das jemand (also der betreffende Webmaster) anders haben will, dann

> muss der das eben mit einer solchen Meta-Tag-Angabe überschreiben.
>
Nein:
------ schnipp http://httpd.apache.org/docs/2.0/mod/core.html#adddefaultcharset


Dies sollte jedes mittels META-Element im Datenteil der Antwort angegebene

Charset überschreiben. Das genaue Verhalten hängt jedoch oft von der Client-
Konfiguration des Benutzers ab.
------ schnapp ------

Und wech,
Manne

Hans-Dietrich Kirmse

unread,
Jul 23, 2009, 9:30:13 AM7/23/09
to
Hallo,

Manfred Schmitt schrieb:


> Hans-Dietrich Kirmse schrieb:
>> Robert Grimm schrieb:
>

>>> Wenn du das nicht willst und du dir _ganz_ sicher bist, daᅵ alles was


>>> der Apache ausliefert UTF-8 ist, setze AddDefaultCharset UTF-8.
>> Die Situation ist etwas anders: wenn man einen Server (es geht um einen
>> Schulserver auf Debian-Basis) bereitstellt, dann sollte man doch dem
>> Admins dann angeben, wie die Seiten per Voreinstellung ausgeliefert
>> werden. Wenn eben (im Handbuch) angegeben wird, die werden in UTF-8

>> ausgeliefert, dann sollte das *standardmᅵᅵig* auch so sein - immer!


>
> Ja.
> Aber wer schreibt denn so einen Unsinn in ein Handbuch wenn er es nicht
> garantieren kann? :-)

ich mᅵchte dieses Thema (fᅵr mich) abkᅵrzen/beenden. Ich habe ja
(eigentlich) kein Problem gehabt, sondern fand den Thread ganz
interessant und fᅵr mich hilfreich. Mehr wollte ich nicht zum Ausdruck
bringen und mich bei allen Schreibern fᅵr die Informationen bedanken.

Unabhᅵngig davon, durch diesen Thread bin ich wieder darauf gekommen,
diese URL http://www.brummer.de.hm/buildpaket.html zu checken und
festgestellt, dass die Seite (zur *einfachen* Erstellung von
Debian-Paketen) nicht mehr verfᅵgbar ist. Leider meine damals erstellte
Kopie (durch eigenes Verschulden) auch nicht mehr.

Mein Problem besteht leider immer noch: wie kann man an eine Kopie
dieser Seite kommen. Wird nicht alles was es irgendwo gibt nicht von den
groᅵen Suchmaschinenbetreibern gesammelt? Kennt sich da keiner damit
aus, wie man deren Archive anzapft? wᅵre fᅵr jeden Hinweis dazu sehr
dankbar.

Mit freundlichen Grᅵᅵen
Hans-Dietrich

Manfred Schmitt

unread,
Jul 23, 2009, 11:50:10 AM7/23/09
to
Hans-Dietrich Kirmse schrieb:

>
> Mein Problem besteht leider immer noch: wie kann man an eine Kopie
> dieser Seite kommen. Wird nicht alles was es irgendwo gibt nicht von den
> großen Suchmaschinenbetreibern gesammelt? Kennt sich da keiner damit
> aus, wie man deren Archive anzapft? wäre für jeden Hinweis dazu sehr
> dankbar.
>
Es gibt Google-cache und archive.org, in beiden caches gibt es die Seite
aber nicht mehr.
Manch andere Suchmaschinen bieten auch caches an, mir faellt aber gerade
keine ein ;)
Warum schickst Du dem auf http://www.brummer.de.hm/buildpaket.html genanntem
webmaster nicht einfach eine mail wenn Du nun schon genau die Anleitung
suchst?
OK, vermutlich wird das nur der webmaster von brain.kicks-ass.org sein
aber vielleicht weiss der ja wo der Inhalt bzw. der Nutzer abgeblieben ist.

Und wech,
Manne

Hans-Dietrich Kirmse

unread,
Jul 23, 2009, 1:20:09 PM7/23/09
to
Hallo Manfred,

Manfred Schmitt schrieb:

> Warum schickst Du dem auf http://www.brummer.de.hm/buildpaket.html genanntem
> webmaster nicht einfach eine mail

wollte ich gerade machen, da kam per PM eine Kopie der HTML-Seite rein.

> wenn Du nun schon genau die Anleitung suchst?

Ich habe heute nochmal nach Anleitungen gesucht, um selbsterstellte
Scripte in deb-Pakete zu packen. Fᅵr Ubuntu finden sich sogar mehrere
Anleitungen, die mir aber nicht so schlᅵssig vorkamen oder die machten
mehr als ich/wir brauchen. Und von der gesuchten Anleitung weiss ich ja,
dass schon mehrere drᅵber geschaut haben, die mir bestᅵtigt haben, dass
man damit debian-konforme Pakete bauen kann. Von den anderen Anleitungen
weiss ich das leider nicht. Es gibt auch noch eine solche (einfache!)
Anleitung im Debian-Buch von Peter Ganten, aber das ist mir einfach
(dafᅵr) zu teuer.

> OK, vermutlich wird das nur der webmaster von brain.kicks-ass.org sein
> aber vielleicht weiss der ja wo der Inhalt bzw. der Nutzer abgeblieben ist.

Problem hat sich erledigt - danke fᅵrs mitdenken.

Mit freundlichen Grᅵᅵen
Hans-Dietrich

Paul Muster

unread,
Jul 24, 2009, 4:10:06 PM7/24/09
to
Hans-Dietrich Kirmse schrieb:
> Manfred Schmitt schrieb:

>> Warum schickst Du dem auf http://www.brummer.de.hm/buildpaket.html
>> genanntem
>> webmaster nicht einfach eine mail
>
> wollte ich gerade machen, da kam per PM eine Kopie der HTML-Seite rein.

Besteht vielleicht die Mᅵglichkeit, die (offenbar von einigen Leuten
recht begehrten) Inhalte - mit Quellenangabe - einfach mal hier zu posten?


mfG Paul

Hans-Dietrich Kirmse

unread,
Jul 25, 2009, 3:20:07 AM7/25/09
to
Guten Morgen,

Paul Muster schrieb:


> Hans-Dietrich Kirmse schrieb:
>> Manfred Schmitt schrieb:
>
>>> Warum schickst Du dem auf http://www.brummer.de.hm/buildpaket.html
>>> genanntem
>>> webmaster nicht einfach eine mail
>> wollte ich gerade machen, da kam per PM eine Kopie der HTML-Seite rein.
>
> Besteht vielleicht die Mᅵglichkeit, die (offenbar von einigen Leuten
> recht begehrten) Inhalte - mit Quellenangabe - einfach mal hier zu posten?

ich habe diese Kopie hier abgelegt:

http://www.arktur.th.schule.de/debian/buildpaket.html


Weiterhin hatte ich angegeben, dass ich zu dieser Seite Kommentare
erhalten habe. Diese sind hier (als "Merkzettel") abgelegt:

http://www.arktur.th.schule.de/doku/deb-pakete.txt


weitere Links:

http://gnubuntux.wordpress.com/2008/06/09/deb-paket-fur-ubuntudebian-erstellen/
http://blog.beimax.de/2008/10/27/debianubuntu-deb-pakete-selbst-erstellen/
http://www.tomprogs.at/tutorials/linux/debian-paket-tutorials-01-ein-erstes-paket.xhtml
http://wiki.wuplug.org/doku.php/tipps:debian_paket_bauen
http://wiki.ubuntuusers.de/Paketbau/Skripte_verpacken

Mit freundlichen Grᅵᅵen
Hans-Dietrich

0 new messages