Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

æ, ø og å??

4 views
Skip to first unread message

Hans Henrik Hansen

unread,
Jan 15, 2021, 6:27:04 PM1/15/21
to
Hvorfor pokker kan jeg ikke få denne side:

http://www.hansogoline.dk/slfst_test.htm

til at vise æ, ø og å??

content="text/html; charset=UTF-8", bliver tilsyneladende 'ignoreret'!?

Ikke engang i 'vis kildekode' (Firefox) vises bogstaverne korrekt!

Disclaimer: Det er en tyve år gammel side, som sjældent besøges, så ud
over karakterene vil jeg ikke 'bruge krudt' på at bringe den i mere
'civiliseret' stand! :)

--
med venlig hilsen,
Hans

Kim Ludvigsen

unread,
Jan 15, 2021, 6:46:26 PM1/15/21
to
Den 16.01.2021 kl. 00.27 skrev Hans Henrik Hansen:
> Hvorfor pokker kan jeg ikke få denne side:
>
> http://www.hansogoline.dk/slfst_test.htm
>
> til at vise æ, ø og å??
>
> content="text/html; charset=UTF-8", bliver tilsyneladende 'ignoreret'!?

Nej, tværtimod. Problemet opstår, fordi UTF-8 har effekt, og fordi din
tekst ikke er i UTF-8. Der var nu heller ikke ret mange dansk-rettede
programmer, der brugte UTF-8 dengang.

Du har to muligheder: Enten skal du ændre dine tekster til UFT-8 og så
uploade dem i stedet for de nuværende tekster. Eller også skal du ændre
charset til den reelle tegnkodning.

Jeg tør ikke sige, hvad din tegnkodning er - du kan prøve med:
ISO-8859-1

--
Mvh. Kim Ludvigsen

Hans Henrik Hansen

unread,
Jan 15, 2021, 7:18:06 PM1/15/21
to
Kim Ludvigsen <k...@kimsside.dk> wrote:

.....
> Nej, tværtimod. Problemet opstår, fordi UTF-8 har effekt, og fordi din
> tekst ikke er i UTF-8. Der var nu heller ikke ret mange dansk-rettede
> programmer, der brugte UTF-8 dengang.
>
> Du har to muligheder: Enten skal du ændre dine tekster til UFT-8 og så
> uploade dem i stedet for de nuværende tekster. Eller også skal du ændre
> charset til den reelle tegnkodning.
>
> Jeg tør ikke sige, hvad din tegnkodning er - du kan prøve med:
> ISO-8859-1


Tak for superhurtigt svar! :)

Problemet er i mellemtiden løst ved at jeg i min web-editor ('Sublime
Text') valgte 'Save with encoding' (UTF-8)

Hans Henrik Hansen

unread,
Jan 16, 2021, 4:42:00 AM1/16/21
to
Hans Henrik Hansen <h2vh...@webspeed.dk> wrote:
....
> Problemet er i mellemtiden løst ved at jeg i min web-editor ('Sublime
> Text') valgte 'Save with encoding' (UTF-8)

og nu 'virker' det så! Men jeg forstår i grunden ikke _hvorfor_?:
Hvad 'sker der' i grunden, når man vælger 'Save with Encoding'?

Mit udgangspunkt var den snart tyve år gamle side:
view-source:http://www.hansogoline.dk/slfst.htm

, hvor æ, ø og å i kildekoden er angivet som '&aelig;'...etc.

Det ville jeg ændre, så jeg tilføjede 'charset=utf-8' i headeren og
ændrede '&aelig;'...etc. i teksten til 'æ'...etc., hvilket resulterede i
at æ, ø og å blev vis som sorte rhomber med '?' i midten.

Netop da jeg havde 'affyret' mit spørgsmål, dæmrede erindringen om
tidligere succes med 'Save with Encoding'.
Da jeg valgte dette, ændrede kildekoden sig således, at der i stedet for
æ etc. stod et '?'...men ikke kun dét: Hvis der før havde stået æ eller
å, blev den _efterfølgende_ karakter samtidigt fjernet!? Havde der stået
ø, blev alene ø'et erstattet med '?'!??

Konsekvensen var, at jeg ikke kunne bruge 'find/erstat' - men i stedet
måtte 'rette igennem manuelt'!

Men nu jeg er faktsik meget interesseret i en 'forklaring' på mine
(natlige) oplevelser! :)

Bertel Lund Hansen

unread,
Jan 16, 2021, 5:12:06 AM1/16/21
to
Hans Henrik Hansen skrev:

> og nu 'virker' det så! Men jeg forstår i grunden ikke _hvorfor_?:
> Hvad 'sker der' i grunden, når man vælger 'Save with Encoding'?

Man gemmer altid med en encoding. Når man vælger den specifikt,
ved man hvilken der bliver brugt.

Den korte forklaring på dit problem er at "de gamle encodings"
(f.eks. iso-8859-1) bruger én byte til hvert tegn. UTF-8 som skal
kunne kode tusindvis af tegn (langt over 256), bruger 2, 3 eller
flere bytes til hvert tegn. Tegn med kodenummer mindre end 128
forbliver uændret, men alle de større tegn bliver så elementer i
en flerbytekode. Når utf-omkoderen så møder "æl" (f.eks. i
"ælling") så signalerer æ'et at der nu kommer en flerbytekode, så
enten findes den kode ikke hvilket udløser en firkant eller
lignende, eller også findes den, og så omsættes "æl" til et tegn
som slet ikke hører hjemme i teksten og som evt. ser underligt
ud. Derved bliver to tegn til ét, så det ser ud som om der er
forsvundet noget.

Her er en utf-tekst set i en iso-editor som omsætter hver byte
til ét tegn:

Sprognævnet har ogsaa lavet en anden Ændring. Der har nemlig
længe hersket Forvirring ved geografiske Navne som hidtil
stavedes med Bolle-aa. Det Bogstav hører nu ikke længere til
det danske Alfabet, og der er herefter ingen Tvivl om hvordan
f.eks. Grenaa, Blaavand og Aalbæk skal staves.

Så kan du se et par af de totegnskoder der står for de danske
bogstaver (æ og ø). En utf-editor vil læse "æ" og så skrive "æ"
på skærmen.


For lige at øge forvirringen: Der er tre ting der skal justeres
rigtigt hvis en hjemmeside skal vises korrekt.

1. Teksten skal være med en given encoding. Lad os kalde den X.
2. I headeren skal der være en metalinje der erklærer tegnsættet
som X.
3. Webserveren skal indstilles på at levere siden med encoding X.

--
/Bertel

Hans Henrik Hansen

unread,
Jan 16, 2021, 5:59:21 AM1/16/21
to
Bertel Lund Hansen <gade...@lundhansen.dk> wrote:
...
> For lige at øge forvirringen: Der er tre ting der skal justeres
> rigtigt hvis en hjemmeside skal vises korrekt.
>
> 1. Teksten skal være med en given encoding. Lad os kalde den X.
> 2. I headeren skal der være en metalinje der erklærer tegnsættet
> som X.
> 3. Webserveren skal indstilles på at levere siden med encoding X.

Tusidn tak for superfin 'udredning'! :)

Kan du evt. 'antyde', hvorledes man i praksis implementerer '3.'??

Bertel Lund Hansen

unread,
Jan 16, 2021, 6:09:37 AM1/16/21
to
Hans Henrik Hansen skrev:

> Kan du evt. 'antyde', hvorledes man i praksis implementerer '3.'??

På mit webhotel kan jeg logge ind og vælge et domæne (jeg har
flere samme sted). Derefter får jeg adgang til en boks hvor jeg
kan indstille flere ting, bl.a. hvilket tegnsæt der skal benyttes
på domænet.

Hvis man ikke har den adgang selv, må man kontakte adminen for
den server man benytter.

--
/Bertel

Kim Ludvigsen

unread,
Jan 16, 2021, 7:16:16 AM1/16/21
to
Den 16.01.2021 kl. 11.59 skrev Hans Henrik Hansen:

> Kan du evt. 'antyde', hvorledes man i praksis implementerer '3.'??

Bertel har fortalt dig hvordan, men det er ikke noget, du behøver at
bekymre dig om, nu hvor du har fået ændret dine tekster til UTF-8 - din
webserver er allerede indstillet til at vise sider med UTF-8.

--
Mvh. Kim Ludvigsen

Hans Henrik Hansen

unread,
Jan 16, 2021, 8:24:28 AM1/16/21
to
Kim Ludvigsen <k...@kimsside.dk> wrote:
....
> Bertel har fortalt dig hvordan, men det er ikke noget, du behøver at
> bekymre dig om, nu hvor du har fået ændret dine tekster til UTF-8 - din
> webserver er allerede indstillet til at vise sider med UTF-8.

Så er alt jo fint! Men det gælder så for hele domænet (jeg har kun ét),
kan jeg forså(?).

Af ren nysgerrighed: Hvad ville der så ske, _hvis_ jeg på samme domæne
placerede filer med anden 'indkodning'??

Jan Hansen

unread,
Jan 16, 2021, 8:36:28 AM1/16/21
to
Hans Henrik Hansen skrev:

> Af ren nysgerrighed: Hvad ville der så ske, _hvis_ jeg på samme domæne
> placerede filer med anden 'indkodning'??

Så ville det se forkert ud, med mindre du skriver den rette kodning i
filen, for eksempel <meta charset="iso-8859-1">
eller også sætter den kodning, du bruger i filen, som standard for
domænet, i en .htaccess fil med AddDefaultCharset iso-8859-1


--
mvh Jan.
Help Microsoft stamp out piracy. Give
Linux to a friend today!

Bertel Lund Hansen

unread,
Jan 16, 2021, 9:00:41 AM1/16/21
to
Jan Hansen skrev:

>> Af ren nysgerrighed: Hvad ville der så ske, _hvis_ jeg på samme domæne
>> placerede filer med anden 'indkodning'??

> Så ville det se forkert ud, med mindre du skriver den rette kodning i
> filen, for eksempel <meta charset="iso-8859-1">

Det er ikke nok. Se eksempel her:

http://temp.lundhansen.dk/

Før upload kunne jeg se siden vist korrekt i browseren. Men
serveren er stillet til utf-8, og så går det galt.

--
/Bertel

Jan Hansen

unread,
Jan 16, 2021, 9:33:44 AM1/16/21
to
Bertel Lund Hansen skrev:
Du har ret, det kan ikke lade sig gøre hos gigahost, hvor man er tvangsindlagt
til at vælge et tegnsæt. Prøv at lave en .htaccess fil med linien
AddDefaultCharset off
og så genindlæs siden. Resultatet kan ses her, http://www.sniper-pistol.com/iso.html
og med utf8 her http://www.sniper-pistol.com/utf.html

Hans Henrik Hansen

unread,
Jan 16, 2021, 3:52:32 PM1/16/21
to
Jeg har kontaktet udbyderen ('one.com'), som bekræfter, at der ikke er
behor for ændringer på server-siden.
0 new messages