Jeg skal bruge det engelske ord for det der sker, når man omskriver
eller ændrer et ord indeholdende et eller flere diakritiske tegn, til en
udgave kun med de "almindelige" 26 bogstaver i det engelske alfabet.
Eksempelvis at ændre "übermensch" til "ubermensch".
Jeg ved ikke bedre end at man kalder det at "defaulte", altså "Ü
defaults to U, e.g. 'übermensch' becoming 'Ubermensch'", men det er nok
forkert.
Det er til et wikiprojekt, hvor jeg vil formulere nogle generelle regler
for at sikre at alle artikelnavne er "sikre", konsekvente og
forudsigelige, altså at ü altid bliver til u, og så videre. Eller ideelt
set vil jeg helst stjæle, hvis andre allerede har formuleret sådanne
regler. (Hvilket er endnu en årsag til at jeg gerne vil vide hvad
processen hedder; så har jeg jo et søgeord jeg kan smide efter Google.)
Hensigten er at minimere potentialet for tekniske problemer, og for
grimme URL'er. Af samme årsag skal apostroffer også fjernes i
artikelnavnene, sådan at "Morrigan's Finger" bliver til "Morrigans
Finger". I brødteksten, altså selve artiklerne, skal alting selvfølgelig
skrives korrekt. Det vil så forhåbentlig også fungere som "search bait"
hvis folk søger på den korrekte stavemåde.
(I princippet burde al moderne software selvfølgelig kunne håndtere den
slags, men jeg vil hellere tage udgangspunkt i en mangfoldig verden,
hvor en del af indbyggerne bruger software og firmware der er udviklet
af idioter.)
--
Peter Knutsen
I et program står der følgende beskrivelse af en parameter for
opsætningen af full-text search:
Search is accent-insensitive:
This converts accents and umlauts to their base characters so that the
search doesn't make a difference between base characters and their
accented versions.
Og ellers "strip off diacritics and leave the base character"
finn
Det er vel lidt bredere end blot omlydstegn. Især bør nok også nævnes at
mange af ordene skrives med lille:
übermensch, doppelgänger, föhn.
Jeg lavede engang en oversigt over hvad jeg kunne finde af tyske ord i
engelsk. Mit, sikkert subjektive, indtryk var, at jo mere specialiseret
teksten var, jo mere satte man de tyske diakritiske tegn. Men jeg var mere
interesseret i klare tyske lån end i, om ordene nu også blev stavet
nøjagtigt som på tysk (fx skriver tyskerne jo ikke quartz).
Men der er vel ikke tale om en generel tendens. Det er nok også derfor der
egl. ikke findes et ord for den slags.
PS: Inden for fonetikken har man noget der hedder lydsubstitution. Det
betyder at man gengiver en fremmed lyd med noget man kender fra sit eget
sprog. Fx det franske navn Jean udtaler danskere ofte som Sjang - hvilket en
franskmand næppe vil forstå (chang?). Man kunne vel opfinde et ord i retning
af alfabetisk substitution = man gengiver et fremmed ord med de midler ens
eget alfabet nu rummer. Gengivelse af fx kinesiske navne på dansk må være
proppet med den slags.
--
Poul E. Jørgensen
Fjern de to A'er hvis du svarer per e-mail.
Remove the two A's if replying by e-mail.
- for ikke at nævne HKH Prinsens dansk, med de kraftigt stemte b, d, g og de
kun svagt "pustede" p, t, k.
Det står i ét program, skriver du.
Men jeg er ligeglad med ét program. Jeg kan kun bruge det til noget hvis
det står i *alle* programmer (herunder søgemaskine-"programmer" der
indekserer websider; Google er jo ikke den eneste søgemaskine i hele
universet), uden undtagelse, og hvis det i alle tilfælde er sådan at det
der står er sandfærdigt.
Men tak for indsparket alligevel.
--
Peter Knutsen
Jeg agter at forholde mig til "å" som om det er et diakrit-tegn, selv om
jeg jo godt ved at det ikke er det, d.v.s. reglen bliver at det
"strippes ned" (ordet "stripper" hugget fra cpeters indlæg) til "a".
"æ" og "ø" er mindre indlysende, men "ø" strippes nok ned til "o". "æ"
er ikke rigtigt strippeligt (eller stripbart, om man vil), men
traditionelt skrives det "ae", så det vil jeg nok følge.
Det er også netop min tanke at skrive et dokument, i min wiki, om emnet,
sådan at alle redaktørerne (alle tre, eller hvor mange der nu melder sig
frivilligt) ved hvad de skal (altså en formuleret politik), og sådan at
læsere der har søgeproblemer ved hvor de skal gå hen.
--
Peter Knutsen
Ja, det er måske relevant i nogle situationer. Jeg hælder dog nok mest
til at stort set alle søgemaskiner og søgefunktioner er det man kalder
case-insensitive, altså at de ikke skelner mellem store og små bogstaver.
Det vil dog alligevel være godt at formulere en politik for min wiki,
omkring brug af store og små bogstaver, og jeg er også så småt begyndt
at rette op på enkelte inkonsekventheder i nogle af mine ældre tekster
der skal wikificeres.
> Jeg lavede engang en oversigt over hvad jeg kunne finde af tyske ord i
> engelsk. Mit, sikkert subjektive, indtryk var, at jo mere specialiseret
> teksten var, jo mere satte man de tyske diakritiske tegn. Men jeg var
> mere interesseret i klare tyske lån end i, om ordene nu også blev stavet
> nøjagtigt som på tysk (fx skriver tyskerne jo ikke quartz).
Jeg læste også en rigtig god artikel i min geografibog (2g, obligatorisk
C-niveau) i gymnasiet, omkring en side lang, der gik på alle de ting i
dansk sprog og kultur (eksempelvis "kiosk") som vi er vant til, men som
har oprindelse i ofte meget fremmede lande.
Det var lærerigt og underholdende, selv om det nok har virket endnu
bedre på dem der stort set intet af det vidste i forvejen.
> Men der er vel ikke tale om en generel tendens. Det er nok også derfor
> der egl. ikke findes et ord for den slags.
>
> PS: Inden for fonetikken har man noget der hedder lydsubstitution. Det
> betyder at man gengiver en fremmed lyd med noget man kender fra sit eget
> sprog. Fx det franske navn Jean udtaler danskere ofte som Sjang -
> hvilket en franskmand næppe vil forstå (chang?). Man kunne vel opfinde
> et ord i retning af alfabetisk substitution = man gengiver et fremmed
> ord med de midler ens eget alfabet nu rummer. Gengivelse af fx kinesiske
> navne på dansk må være proppet med den slags.
Det er i hvert fald et alterativ til "umlaut stripping". Tak!
--
Peter Knutsen