> > E sad, mene zanima "gdje" se zapisuju te vrijednosti koji je encoding,
> > odnosno zar nisu slova i slova ista stvar u svim kodiranjima?
Nisu. Jer slova zapravo ne postoje.
Ono što vidiš na ekranu je kombinacija nekoliko međusobno neovisnih
stvari.
Naprimjer:
1. Binarni kod - ASCII ima različite kodne stranice od po 256
karaktera od kojih su prvih 128 karaktera isti u svim kodnim
stranicama. Različite kodne stranice postoje zato da bi se zadovoljila
specifikacija: 1 karakter = 1 bajt.
UTF napušta tu doktrinu i 1 karakter može sadržavati više bajtova.
2. Interpretacija - veza između binarnog koda i slova prikazanog na
ekranu. Razne kodne stranice sadrže iste znakove/slova, ali se nalaze
na različitim pozicijama.
3. Font - slika koju vidiš na ekranu kad otipkaš nešto na tastaturi.
npr. WINGDINGS font 'nema' slova.
>>Mislim, jasno da se ovdje radio ASCII to BIN converteru, pretpostavljam da
>>je ASCII isto tip encodinga, pa mi je recimo jasno da je UTF8 potpuno druga
>>stvar, ali i dalje mi nije jasno kako program prilikom snimanja drugacije
>>zapisuje bitove kad se u svim programima jednako pokazuju ista slova na
>>istom mjestu...
To uglavnom vrijedi samo za slova koja postoje u engleskoj abecedi jer
su zajednička svim kodnim stranicama. Karakteri koji su specifični za
druge regije ovise o odabranoj kodnoj stranici.
Ako radiš na Windowsima i imaš definiranu regiju HR onda ti izgleda da
sve štima kad tipkaš naše znakove jer Winsi pokušavaju prikazati sve u
HR kodnoj stranici.