Hans Henrik Hansen skrev:
> og nu 'virker' det så! Men jeg forstår i grunden ikke _hvorfor_?:
> Hvad 'sker der' i grunden, når man vælger 'Save with Encoding'?
Man gemmer altid med en encoding. Når man vælger den specifikt,
ved man hvilken der bliver brugt.
Den korte forklaring på dit problem er at "de gamle encodings"
(f.eks. iso-8859-1) bruger én byte til hvert tegn. UTF-8 som skal
kunne kode tusindvis af tegn (langt over 256), bruger 2, 3 eller
flere bytes til hvert tegn. Tegn med kodenummer mindre end 128
forbliver uændret, men alle de større tegn bliver så elementer i
en flerbytekode. Når utf-omkoderen så møder "æl" (f.eks. i
"ælling") så signalerer æ'et at der nu kommer en flerbytekode, så
enten findes den kode ikke hvilket udløser en firkant eller
lignende, eller også findes den, og så omsættes "æl" til et tegn
som slet ikke hører hjemme i teksten og som evt. ser underligt
ud. Derved bliver to tegn til ét, så det ser ud som om der er
forsvundet noget.
Her er en utf-tekst set i en iso-editor som omsætter hver byte
til ét tegn:
Sprognævnet har ogsaa lavet en anden Ændring. Der har nemlig
længe hersket Forvirring ved geografiske Navne som hidtil
stavedes med Bolle-aa. Det Bogstav hører nu ikke længere til
det danske Alfabet, og der er herefter ingen Tvivl om hvordan
f.eks. Grenaa, Blaavand og Aalbæk skal staves.
Så kan du se et par af de totegnskoder der står for de danske
bogstaver (æ og ø). En utf-editor vil læse "æ" og så skrive "æ"
på skærmen.
For lige at øge forvirringen: Der er tre ting der skal justeres
rigtigt hvis en hjemmeside skal vises korrekt.
1. Teksten skal være med en given encoding. Lad os kalde den X.
2. I headeren skal der være en metalinje der erklærer tegnsættet
som X.
3. Webserveren skal indstilles på at levere siden med encoding X.
--
/Bertel