Caracteres Latinos em Console

wishmaster_rs

unread,

May 21, 2006, 5:11:57 PM5/21/06

to ccppbrasil

Olá pessoal. Mais uma vez eu retorno aqui com um novo tópico
daqueles.

Estou tendo problemas com os caracteres dos meus programas em console.

Vamos aos dados técnicos:
Compilador: Dev CPP - Bloodsheed
Linguagem: C++

Então, quando eu escrevo palavras com acentos ou ç, a saída do
programa imprime outra coisa no lugar do caractere. O que eu posso
fazer para que uma saída tipo:

cout << "Conheçe o Mário? Mas que Mário?" << endl;

seja impressa corretamente, com os seus devidos caracteres acentuados?

Hugo Parente Lima

unread,

May 22, 2006, 11:34:16 AM5/22/06

to ccppb...@googlegroups.com

Depende da codificação default do seu SO, seu código fonte estava salvo em que
codificação? seu SO esta configurado com que codificação?

Acho que um defeito do C++ é não suportar unicode diretamente na linguagem...
existe o wstring, wchar_t, etc... mas mesmo assim eu não tenho como dizer ao
meu compilador que meu código fonte esta escrito em tal codificação e ele
automaticamente construir as strings direito como acontece em outras
linguagem que suportam unicode...

--
Hugo Parente Lima.
"Precisamos de mais gênios humildes no mundo, hoje somos poucos!"
JID: hu...@jabber.org

Thiago Adams

unread,

May 22, 2006, 2:13:06 PM5/22/06

to ccppbrasil

Hugo não entendi o que você quiz dizer com C++ não suportar unicode?
Você pode escrever string em unicode usando L"" diretamente no código
e usar qualquer caractere.

Hugo Parente Lima

unread,

May 22, 2006, 3:10:55 PM5/22/06

to ccppb...@googlegroups.com

Sim, eu posso fazer isso, mas minha string tem que estar em ASCII,
caso ela esteja em Chinês por exemplo vai dar pau, e meu código fonte
também precisa estar em ASCII ou qualquer outra codificação que
utilize apenas um byte por caracter, a não ser que haja alguma opção
do compilador para dizer qual a codificação utilizada no código fonte,
sinceramente não pesquisei se essa opção existe ou não =], mas olhando
rapidamente ainda não achei.

Ex.: escrever um Hello World que imprima em wcout alguma palavra com
acento em um arquivo codificado com UTF8, compile e execute e os
acentos sairão loucos, pois em UTF8 os caracteres com acentos que
estão na ISO-8859-1 ocupam 2 bytes ao invés de apenas 1 como em
ISO-8859-1, dai mesmo utilizando o L"", ele coloca cada byte como
sendo um caractere diferente.

--
Hugo Parente Lima

Thiago Adams

unread,

May 22, 2006, 4:35:28 PM5/22/06

to ccppbrasil

Para resolver esta questão você pode usar uma sequencia \xHEXA e
colocar o número do caractere unicode.
Por exemplo: maçã = L"ma\xE7\xE3"

int main ( )
{
const wchar_t * psz = L"ma\xE7\xE3";
::MessageBoxW(0, psz, L"", MB_OK);

const wchar_t * psz2 = L"maçã";
::MessageBoxW(0, psz2, L"", MB_OK);
}

O visual C++ 2005 aceita colocar os caracteres direto no fonte, ele
pode salvar o texto como UTF8. Assim é possível colocar direto
L"maçã" no fonte.
Não sei como é o gcc, mas a opção \x tem que funcionar para
qualquer um.
Acho que todos compiladores deveriam aceitar UTF8.

Thiago Adams

unread,

May 22, 2006, 4:54:15 PM5/22/06

to ccppbrasil

Sobre a questão do console...
O conceito de "console" não existe para o C++.
Na prática o cin e o cout representam um buffer de char. (wcout e wcin
um buffer de wchar_t.)
Você tem funções para ler este buffer, por exemplo converter texto
em número e tem opções para gravar neste buffer formatando valores
de vários tipos.

Então não é possível fazer um programa multiplataforma usando
"funções de console" definidas no C++ padrão.

É possivel usar funções do windows/linux para limpar a tela aonde o
"cout" é mostrado e outras operações.
No windows, você pode direcionar a saída para uma tela sua, por
exemplo como o visual c++ faz com as mensagens de compilação. Neste
caso seria possível usar uma outra fonte e suportar os acentos
inclusive.

Acho que para quem está iniciando deve ser um pouco frustrante essa
realidade :), de não ter como criar um pequeno programa "console"
multiplataforma.

wishmaster_rs

unread,

May 22, 2006, 10:34:31 PM5/22/06

to ccppbrasil

Hum.. a questão ainda continua sem resposta.
Meu so é Win XP PRO SP2, unicode.

Thiago Adams

unread,

May 23, 2006, 5:00:30 AM5/23/06

to ccppbrasil

O c++ pode escrever unicode no buffer wcout. Você precisa de uma fonte
no console que suporte o caractere.
Olhei no windows tinha opção de duas fontes mas nenhuma delas
suportava. Ou seja, se não for possível trocar a fonte no console do
windows, voce tem que criar seu proprio console redirecionando o wcout.

Thiago Adams

unread,

May 23, 2006, 5:08:45 AM5/23/06

to ccppbrasil

Para comprovar o que eu falei...
Crie um aplicativo console no VC++

int _tmain(int argc, _TCHAR* argv[])
{
const wchar_t *psz = L"maçã";
std::wcout << psz;
return 0;
}

Compile :)
Depois vá em Menu -> Tools -> Extenal Tools .. Adicione seu exe na
lista e marque "Use output window"
Quando você rodar o programa pelo menu "Tools" ele usa o output do
visual C++ que está usando fonte courier new. O acento vai aparecer
corretamente.

wishmaster_rs

unread,

May 23, 2006, 10:43:13 AM5/23/06

to ccppbrasil

Hum... acho que o jeito é não usar carcteres latinos em console.
Complica demais o programa por uma coisa boba.

Hugo Parente Lima

unread,

May 23, 2006, 11:51:38 AM5/23/06

to ccppb...@googlegroups.com

Procurei um pouco e finalmente achei =]

-finput-charset=charset
Set the input character set, used for translation from the character set of
the input file to the source character set used by GCC. If the locale does
not specify, or GCC cannot get this information from the locale, the default
is UTF-8. This can be overridden by either the locale or this command line
option. Currently the command line option takes precedence if there's a
conflict. charset can be any encoding supported by the system's iconv library
routine.

Consegui criar criar código fonte em UTF-8 e ISO-8859-1 e imprimindo
corretamente, inclusive em cout. =] (Meu SO esta usando UTF8)

Um único detalhe... tem que se lembrar de setar o locale no inicio do
programa, se não nada disso via dar certo.

é só chamar:

std::setlocale(LC_ALL, "");

Porém ainda não é impossível criar funções etc com nomes com acentos como em
Java por exemplo, porém eu particularmente desaprovo a criação de variaveis,
classes, etc com acentos... já que isso impossibilita que outras pessoas de
trabalharem no seu código fonte... Imagine você utilizando uma biblioteca
árabe onde o nomedas funções estejam com caracteres árabes... como diachos
você iria digitar aquilo no seu teclado ABNT2?

Continuando... se houver desejo de fazer o programa traduzivel para vários
indiomas é legal dar uma olhada na bilioteca gettext, ela permite que o
tradutor traduza seu programa sem sequer tocar no código fonte =].

--
Hugo Parente Lima.

wishmaster_rs

unread,

Jun 4, 2006, 12:54:07 PM6/4/06

to ccppbrasil

>> Imagine você utilizando uma biblioteca
>> árabe onde o nomedas funções estejam com caracteres árabes... como diachos
>> você iria digitar aquilo no seu teclado ABNT2?

Concordo.. E se for em chinês mandarim então???? Imagina!!!!
E se for em Grego??? Pior ainda, e se for em Búlgaro ou Russo que
utiliza o afabeto Cirílico?? (Aquele com letras de ponta cabeça,
letras espelhadas....)

Não ia dar certo....

Wanderley Caloni Jr

unread,

Jun 4, 2006, 3:21:52 PM6/4/06

to ccppb...@googlegroups.com

Por falar em caracteres além do inglês, alguém do mundo linux poderia
me dizer como anda o suporte a Unicode nesse sistema? Melhor dizendo:
como são implementadas as strings do kernel? O terminal console
suporta o alfabeto cirílico ou o asiático? E o ambiente gráfico,
suporta edição de texto (ou mesmo janelas) em que possam conviver
tanto o conjunto ANSI quanto um outro conjunto de caracteres?

--
Wanderley Caloni Jr
http://www.caloni.com.br

Hugo Parente Lima

unread,

Jun 4, 2006, 3:45:10 PM6/4/06

to ccppb...@googlegroups.com

Em Domingo 04 Junho 2006 16:21, Wanderley Caloni Jr escreveu:
> Por falar em caracteres além do inglês, alguém do mundo linux poderia
> me dizer como anda o suporte a Unicode nesse sistema? Melhor dizendo:
> como são implementadas as strings do kernel? O terminal console
> suporta o alfabeto cirílico ou o asiático? E o ambiente gráfico,
> suporta edição de texto (ou mesmo janelas) em que possam conviver
> tanto o conjunto ANSI quanto um outro conjunto de caracteres?

Não sei como as strings são implementadas no kernel, mas acho que devem ser
arrays de caracteres terminadas em zero. Uso UTF8 como codificação padrão
para o sistema (Unicode codificado em UTF8), como em uma string codificada
com UTF8 não existe bytes em zero no meio da cadeia de bytes o kernel
trabalha sem problemas... por conta disso até o nome dos meus arquivos estão
codificados em UTF8, uso o KDE, o KDE tem um ótimo suporte a unicode (herdado
da Qt), por isso não tenho problemas no ambiente gráfico em nenhum programa,
inclusive consigo ver arquivos de tradução escritos com caracteres em russo e
ASCII no mesmo arquivo.

O único problema que tenho aqui é no terminal puro (modo texto), os acentos
aparecem blz, mas não consigo digitar acentos... não sei se é alguma coisa
mal configurada ou sei lá o que... como shell no ambiente gráfico funciona
perfeitamente eu nunca procurei saber a causa do problema.

Otavio Rodolfo Piske

unread,

Jun 4, 2006, 4:30:02 PM6/4/06

to ccppb...@googlegroups.com

Olá,

até aonde eu sei o Unicode é completamente suportado no Linux e em boa
parte das aplicações, suportando os alfabetos cirílicos, asiáticos,
etc. Entretanto, é necessário que a shell utilizada também suporte
(geralmente o Bash, que suporta UTF-8). Nomes de arquivos/diretórios
tem suporte desde que o kernel tenha sido compilado com "NLS UTF-8
Support" (acho que vem habilitado por padrão na maioria das distros).
Todas as versões mais recentes do gnome (baseadas na GTK+ 2.x) quanto
o KDE (QT 3.x) suportam Unicode.

Atenciosamente
--
Otavio R. Piske - AngusYoung
www.angusyoung.org

Reply all

Reply to author

Forward