Codificación ASCII vs Latin-1 vs UTF-8/16

35 views
Skip to first unread message

Hichokei

unread,
Nov 13, 2008, 7:40:19 AM11/13/08
to Grupo de usuarios de C++ de la UGR

Quería comentar el lío que hay con todos los caracteres en general.
Que siempre que paso de un entorno de desarrollo a otro, y ya no digo,
si los entornos están uno en windows y otro en linux, que si has
puesto algún carácter fuera del ASCII te lo releen con cualquier otra
codificación y te muestran un galimatías.

¿Cual deberíamos de usar para nuestros programas en C++ para que
fueran portables, pero que permitieran flexibilidad?

Lo digo, para, por ejemplo, usar en los comentarios un igual de esta
forma, dependiendo del tipo de letra, y si usas UTF-8 o Latin-1:

//‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾ // UTF-8 (todo seguido)
//¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯ // Latin-1 (Guioncitos)

ó
//―――――――――――――――――― // UTF-8 (seguido)
//----------------------------------------------- // Latin-1
(guioncitos)

y sólo no pasa con la barra baja _ porque está en ASCII

Además, de que algunos de estos caracteres, en algunos tipos de letra,
ocupan el espacio de dos caracteres normales.

Para la documentación del código, y para la escritura de caracteres en
otros idiomas (como documentación en japonés, por ejemplo) tendríamos
que usar UTF-8, pero aún así no me gusta la idea de que dependiendo
del tipo de letra, y del entorno, se vea de una forma u otra.

¿Que deberíamos tomar? ¿Nos quedamos con ASCII, Latin-1 (aunque las
tildes cada ide las lea como quiera), utf-8, utf-16? ¿Hay dos
lenguajes en linux y windows que tengan implemantado uft-8 de la misma
forma?

Reply all
Reply to author
Forward
0 new messages