A seção 4.8 [1] fala sobre usar programas com codificação ASCII. Mas a
nota do tradutor comenta sobre UTF-8 ser a melhor alternativa para
nós.
Desde que iniciei com Python, uso codificação UTF-8, não tenho tido
problemas com isso, mas nunca parei para questionar. Por que UTF-8 é
melhor para nós de língua portuguesa?
[1] http://turing.com.br/pydoc/2.7/tutorial/controlflow.html#intermezzo-estilo-de-codificacao
--
Vinicius Assef
--
------------------------------------
Grupo Python-Brasil
http://www.python.org.br/wiki/AntesDePerguntar
<*> Para visitar o site do grupo na web, acesse:
http://groups.google.com/group/python-brasil
<*> Para sair deste grupo, envie um e-mail para:
python-brasi...@googlegroups.com
--
------------------------------------
Grupo Python-Brasil
http://www.python.org.br/wiki/AntesDePerguntar
<*> Para visitar o site do grupo na web, acesse:
http://groups.google.com/group/python-brasil
<*> Para sair deste grupo, envie um e-mail para:
python-brasi...@googlegroups.com
UTF-8 é o novo padrão para acentuação, já que suporta todos* idiomas.
As tabelas ISO só funcionam para um tipo de acentuação, a que foi
especificada pra ela (e em geral de forma incompleta), e é complicado
detectar qual tabela está sendo usada em um texto. Então na verdade
usar os encoding ISO é pior do que UTF-8 ou até mesmo ASCII.
--
Paul Eipper
Se voc� n�o precisa, ou nunca vai precisar que se seu sistema se
interligue com outros sistemas, e se ele n�o use nem nunca v� usar
outros idiomas est� tudo bem.
Eu sempre utilizo UTF-8 para n�o ter problemas com acentua��o, com
outras bibliotecas, com Python 3, com bancos de dados, com m�ltiplos
idiomas, com m�ltiplos sistemas operacionais, etc...
Abra�o,
--
Shander Lyrio
http://about.me/shander
Na verdade UTF-8 usa um número variável de bytes, e é isso que faz ele
ser compatível com ASCII e suportar qualquer idioma ao mesmo tempo.
--
Paul Eipper
O UTF-8 utiliza de 1 at� 4 bytes para representar um caracter, n�o 2.
Desta forma ele pode suportar todos os caracteres poss�veis do padr�o
Unicode, mas economizando espa�o em disco para os caracteres que n�o
necessitam de tantos bytes para serem representados.
Letras comuns do nosso idioma s�o representadas com 1 byte, acentos com
2 bytes e a medida que voc� vai complicando ele pode utilizar at� 4
bytes para representar qualquer tipo de caracter incluindo chineses,
japoneses, �rabes, etc...
O "Internet Engineering Task Force" (IETF) requer que todos os
protocolos utilizados na Internet suportem, pelo menos, o UTF-8. O
"Internet Mail Consortium" (IMC) [1] recomenda que todos os clientes de
email consigam ler e criar mails usando o UTF-8.
Em 17/02/2012 13:25, jeferson perito escreveu:
Então eles criaram o utf-8 para padrozinar e tornar uma codificação de
caracter única, utf-8 utiliza 2 bytes de armazenamento para comportar
todos os tipos de caracteres.
O UTF-8 utiliza de 1 até 4 bytes para representar um caracter, não 2. Desta forma ele pode suportar todos os caracteres possíveis do padrão Unicode, mas economizando espaço em disco para os caracteres que não necessitam de tantos bytes para serem representados.
Letras comuns do nosso idioma são representadas com 1 byte, acentos com 2 bytes e a medida que você vai complicando ele pode utilizar até 4 bytes para representar qualquer tipo de caracter incluindo chineses, japoneses, árabes, etc...
O "Internet Engineering Task Force" (IETF) requer que todos os protocolos utilizados na Internet suportem, pelo menos, o UTF-8. O "Internet Mail Consortium" (IMC) [1] recomenda que todos os clientes de email consigam ler e criar mails usando o UTF-8.
--
------------------------------------
Grupo Python-Brasil
http://www.python.org.br/wiki/AntesDePerguntar
<*> Para visitar o site do grupo na web, acesse:
http://groups.google.com/group/python-brasil
<*> Para sair deste grupo, envie um e-mail para:
N�o � melhor apenas para n�s, � melhor para toda a internet. Quem me
dera que todos os clientes de meus clientes utilizassem um �nico
encoding e eu n�o precisasse converter, para cada arquivo, o tipo de
codifica��o.
"UTF-8 (UCS Transformation Format � 8-bit) is a variable-width encoding
that can represent every character in the Unicode character set. It was
designed for backward compatibility with ASCII and to avoid the
complications of endianness and byte order marks in UTF-16 and UTF-32.
UTF-8 has become the dominant character encoding for the World-Wide
Web, accounting for more than half of all Web pages.The Internet
Engineering Task Force (IETF) requires all Internet protocols to
identify the encoding used for character data, and the supported
character encodings must include UTF-8. The Internet Mail Consortium
(IMC) recommends that all e-mail programs be able to display and create
mail using UTF-8. UTF-8 is also increasingly being used as the default
character encoding in operating systems, programming languages, APIs,
and software applications." - Wikip�dia
Abra�os,
Desde que iniciei com Python, uso codificação UTF-8, não tenho tido
problemas com isso, mas nunca parei para questionar. Por que UTF-8 é
melhor para nós de língua portuguesa?
Já corrigiram bastante coisas desse email, só queria complementar que
a história não foi assim também. A história do utf-8 em particular é
bem legal http://www.cl.cam.ac.uk/~mgk25/ucs/utf-8-history.txt
--
Leonardo Santagada
Não. ASCII dá para representar um monte de coisa, e o utf-8 não é um
extensão do ascii, ele só mantém o mesmo mapeamento do ASCII para os
primeiros 127 caracteres.
Tá pessoal, se alguém quiser saber tudo de utf-8 eu realmente
recomendo começar lendo http://en.wikipedia.org/wiki/UTF-8
--
Leonardo Santagada
--
------------------------------------
Grupo Python-Brasil
http://www.python.org.br/wiki/AntesDePerguntar
<*> Para visitar o site do grupo na web, acesse:
http://groups.google.com/group/python-brasil
<*> Para sair deste grupo, envie um e-mail para:
python-brasi...@googlegroups.com
Do ponto de vista do Python, nenhuma. Eu inclusive escrevo assim, mais
simples ainda:
# coding: utf-8
O sinais -*- (que eu chamo de aviões) servem para configurar o editor
Emacs. O Python ignora, usa uma expressão regular que procura por
"coding" "dois pontos" e algo que seja o nome de um encoding.
[ ]s
Luciano
--
Luciano Ramalho
Twitter: @luciano
Autor e instrutor da Academia Python na Globalcode
http://python.globalcode.com.br
Para ser mais preciso, a expressão regular é esta:
"coding[:=]\s*([-\w.]+)"
Conforme o PEP-0263, "Defining Python Source Code Encodings"
http://www.python.org/dev/peps/pep-0263/
2012/2/17 Carlos Ribeiro <carri...@gmail.com>:
> UTF8 é uma extensão do ASCII que permite representar qualquer caractereNão. ASCII dá para representar um monte de coisa, e o utf-8 não é um
> UNICODE. Usando ASCII você só pode representar as letras maiúsculas e
> minúsculas normais.
extensão do ascii, ele só mantém o mesmo mapeamento do ASCII para os
primeiros 127 caracteres.
Ent�o n�o adianta colocar "# coding: utf-8" se o seu arquivo estiver em
"iso-8859-1".
[]'s
On 17/02/2012 14:45, victo...@gmail.com wrote:
> Quando eu crio um arquivo teste.py, com o seguinte conte�do:
>
> print 'abra��o'
>
> apresenta o seguinte erro:
>
> victor@victor-desktop:~/Desktop$ python teste.py
> File "teste.py", line 1
> SyntaxError: Non-ASCII character '\xc3' in file teste.py on line 1, but
> no encoding declared; see http://www.python.org/peps/pep-0263.html for
> details
>
> O meu ubuntu utiliza utf-8 por default (idioma ingl�s)
>
> Porque deu esse erro ?
>
> S� funciona quando eu coloco esse header no arquivo:
>
> #! /usr/bin/python
> # -*- coding: iso-8859-1 -*-
>
> Porque o utf-8 d� erro neste caso ?
>
> Abra�os,
> victor jabur
>
>
> Em 17 de fevereiro de 2012 14:04, Carlos Ribeiro <carri...@gmail.com
> <mailto:carri...@gmail.com>> escreveu:
>
> 2012/2/17 Vinicius Assef <vinic...@gmail.com
> <mailto:vinic...@gmail.com>>
>
> Desde que iniciei com Python, uso codifica��o UTF-8, n�o tenho tido
> problemas com isso, mas nunca parei para questionar. Por que UTF-8 �
> melhor para n�s de l�ngua portuguesa?
>
>
> UTF8 � uma extens�o do ASCII que permite representar qualquer
> caractere UNICODE. Usando ASCII voc� s� pode representar as letras
> mai�sculas e min�sculas normais.
>
> O que pode estar te confundindo � que antigamente (nos tempos do
> DOS, e at� na linha de comando do Windows) era poss�vel usar
> caracteres acentuados usando algumas "codifica��es" especiais, sendo
> que a principal era a "code page 850". Mas isso n�o era um padr�o
> aberto de verdade; era um padr�o propriet�rio da Microsoft, que
> utilizava em cada pa�s uma codifica��o diferente. Com isso as
> aplica��es rodavam localmente mas era muito complicado trocar
> arquivos de pa�s para pa�s, os caracteres chegavam todos desformatados.
>
> OT: esse tipo de pergunta ficaria muito bem num site tipo Quora ou
> Stack Exchange, um monte de gente respondeu, as respostas poderiam
> ser votadas e priorizadas. Faz falta um BOM site assim em
> portugu�s... Se tem algum (e eu acho que deve existir) � pouco
> conhecido utilizado, o que � uma pena.
>
> --
> Carlos Ribeiro
> Consultoria em Projetos
> twitter: http://twitter.com/carribeiro
> blog: http://rascunhosrotos.blogspot.com
> mail: carri...@gmail.com <mailto:carri...@gmail.com>
>
> --
> ------------------------------------
> Grupo Python-Brasil
> http://www.python.org.br/wiki/AntesDePerguntar
>
> <*> Para visitar o site do grupo na web, acesse:
> http://groups.google.com/group/python-brasil
>
> <*> Para sair deste grupo, envie um e-mail para:
> python-brasi...@googlegroups.com
> <mailto:python-brasil%2Bunsu...@googlegroups.com>
>
>
>
>
> --
> ------------------------------------
> Grupo Python-Brasil
> http://www.python.org.br/wiki/AntesDePerguntar
>
> <*> Para visitar o site do grupo na web, acesse:
> http://groups.google.com/group/python-brasil
>
> <*> Para sair deste grupo, envie um e-mail para:
> python-brasi...@googlegroups.com
--
==============================================
Renato de Pontes Pereira (renatopp)
- http://renatopp.com
- Mestrando em Ci�ncia da Computa��o - UFRGS
- OpenSUSE Member
- rppereira at inf.ufrgs.br
- renato.ppontes at gmail.com
A codificação que você declara no cabeçalho do arquivo deve ser a mesma do arquivo em si. Praticamente todos editores tem a opção de codificação do arquivo.
Então não adianta colocar "# coding: utf-8" se o seu arquivo estiver em "iso-8859-1".
[]'s
Quando eu crio um arquivo teste.py, com o seguinte conteúdo:
print 'abração'
apresenta o seguinte erro:
victor@victor-desktop:~/Desktop$ python teste.py
File "teste.py", line 1
SyntaxError: Non-ASCII character '\xc3' in file teste.py on line 1, but
no encoding declared; see http://www.python.org/peps/pep-0263.html for
details
O meu ubuntu utiliza utf-8 por default (idioma inglês)
Porque deu esse erro ?
Só funciona quando eu coloco esse header no arquivo:
#! /usr/bin/python
# -*- coding: iso-8859-1 -*-
Porque o utf-8 dá erro neste caso ?
Abraços,
<mailto:carri...@gmail.com>> escreveu:
2012/2/17 Vinicius Assef <vinic...@gmail.com
<mailto:vinic...@gmail.com>>
Desde que iniciei com Python, uso codificação UTF-8, não tenho tido
problemas com isso, mas nunca parei para questionar. Por que UTF-8 é
melhor para nós de língua portuguesa?
UTF8 é uma extensão do ASCII que permite representar qualquer
caractere UNICODE. Usando ASCII você só pode representar as letras
maiúsculas e minúsculas normais.
O que pode estar te confundindo é que antigamente (nos tempos do
DOS, e até na linha de comando do Windows) era possível usar
caracteres acentuados usando algumas "codificações" especiais, sendo
que a principal era a "code page 850". Mas isso não era um padrão
aberto de verdade; era um padrão proprietário da Microsoft, que
utilizava em cada país uma codificação diferente. Com isso as
aplicações rodavam localmente mas era muito complicado trocar
arquivos de país para país, os caracteres chegavam todos desformatados.
OT: esse tipo de pergunta ficaria muito bem num site tipo Quora ou
Stack Exchange, um monte de gente respondeu, as respostas poderiam
ser votadas e priorizadas. Faz falta um BOM site assim em
português... Se tem algum (e eu acho que deve existir) é pouco
conhecido utilizado, o que é uma pena.
--
Carlos Ribeiro
Consultoria em Projetos
twitter: http://twitter.com/carribeiro
blog: http://rascunhosrotos.blogspot.com
mail: carri...@gmail.com <mailto:carri...@gmail.com>
--
------------------------------------
Grupo Python-Brasil
http://www.python.org.br/wiki/AntesDePerguntar
<*> Para visitar o site do grupo na web, acesse:
http://groups.google.com/group/python-brasil
<*> Para sair deste grupo, envie um e-mail para:
--
------------------------------------
Grupo Python-Brasil
http://www.python.org.br/wiki/AntesDePerguntar
<*> Para visitar o site do grupo na web, acesse:
http://groups.google.com/group/python-brasil
<*> Para sair deste grupo, envie um e-mail para:
--
==============================================
Renato de Pontes Pereira (renatopp)
- http://renatopp.com
- Mestrando em Ciência da Computação - UFRGS
- OpenSUSE Member
- rppereira at inf.ufrgs.br
- renato.ppontes at gmail.com
--
------------------------------------
Grupo Python-Brasil
http://www.python.org.br/wiki/AntesDePerguntar
<*> Para visitar o site do grupo na web, acesse:
http://groups.google.com/group/python-brasil
<*> Para sair deste grupo, envie um e-mail para:
Files opened as text files (still the default mode for open()) always use an encoding to map between strings (in memory) and bytes (on disk). Binary files (opened with a b in the mode argument) always use bytes in memory. This means that if a file is opened using an incorrect mode or encoding, I/O will likely fail loudly, instead of silently producing incorrect data. It also means that even Unix users will have to specify the correct mode (text or binary) when opening a file. There is a platform-dependent default encoding, which on Unixy platforms can be set with the LANG environment variable (and sometimes also with some other platform-specific locale-related environment variables). In many cases, but not all, the system default is UTF-8; you should never count on this default. Any application reading or writing more than pure ASCII text should probably have a way to override the encoding. There is no longer any need for using the encoding-aware streams in the codecs module.
Pessoal, lendo um trecho da documentação que está sendo bravamente traduzida por nossos colegas, encontrei um trecho que me causou certa dúvida. A seção 4.8 [1] fala sobre usar programas com codificação ASCII. Mas a nota do tradutor comenta sobre UTF-8 ser a melhor alternativa para nós. Desde que iniciei com Python, uso codificação UTF-8, não tenho tido problemas com isso, mas nunca parei para questionar. Por que UTF-8 é melhor para nós de língua portuguesa? [1] http://turing.com.br/pydoc/2.7/tutorial/controlflow.html#intermezzo-estilo-de-codificacao -- Vinicius Assef
-- ---------------------------------------- Nilo Menezes ---------------------------------------- Livro: http://www.nilo.pro.br/iprog/ Blog: http://junglecoders.blogspot.com Home Page: http://www.nilo.pro.br Hobby: http://invasores.sourceforge.net ----------------------------------------
Aparentemente é um bug do Python no Windows:
http://bugs.python.org/issue1602
Para trocar a página no console:
chcp 65001
Testei com o Python 2.7 e não funciona :-( como previsto.
Com o Python 3.2 foi pior ainda :-(
Detalhes aqui:
http://stackoverflow.com/questions/878972/windows-cmd-encoding-change-causes-python-crash
http://stackoverflow.com/questions/1259084/what-encoding-code-page-is-cmd-exe-using
A prova que deveria funcionar:
http://illegalargumentexception.blogspot.com/2009/04/i18n-unicode-at-windows-command-prompt.html
[]
Nilo
On 17/02/2012 22:13, tems wrote:
> Galera, não tinha visto o comentário do grande Nilo (aliás, aprendi
> muito com o uso do colorconsole).
>
> Realmente estava editando meus arquivos com o Notepad+ e não estava
> configurado com o UTF-8. Já configurei, mas não resolveu nada... como
> o Nilo disse, deve ser a codificação do console(prompot de comando do
> windos. Não encontrei onde alterálá (até fui em propriedades, mas não
> encontrei).
>
> Alguém pode me ajudar???
>
> Tomaz Edson
>
Tu precisa usar unicode, assim o python transforma automaticamente para
o encoding do console.
ex. print u'���'
No linux funciona legal porque o terminal � em utf-8.
[]'s
On 17/02/2012 19:49, tems wrote:
> � meu caro Nilo... nada certo... (rodei o chcp65001 e nada resolveu).
> No Python3.2 j� estava tudo ok. sem problema..
> Quer dizer ent�o que nem pensar em usar programas (scripts), em modo
> texto, em python27 no windows?
> Bom, ent�o terei que me acostumar mesmo com o 3.2 j� que � o futuro
> mesmo, n�o �?
>
> Abra�os em muito obirigado!
>
> Tomaz Edson
>
> On 17 fev, 18:41, LSKBR<ls...@yahoo.com.br> wrote:
>> Ol� Tomaz,
>>
>> Aparentemente � um bug do Python no Windows:http://bugs.python.org/issue1602
>>
>> Para trocar a p�gina no console:
>> chcp 65001
>> Testei com o Python 2.7 e n�o funciona :-( como previsto.
>> Com o Python 3.2 foi pior ainda :-(
>>
>> Detalhes aqui:http://stackoverflow.com/questions/878972/windows-cmd-encoding-change...http://stackoverflow.com/questions/1259084/what-encoding-code-page-is...
>>
>> A prova que deveria funcionar:http://illegalargumentexception.blogspot.com/2009/04/i18n-unicode-at-...
>>
>> []
>>
>> Nilo
>>
>> On 17/02/2012 22:13, tems wrote:
>>
>>> Galera, n�o tinha visto o coment�rio do grande Nilo (ali�s, aprendi
>>> muito com o uso do colorconsole).
>>
>>> Realmente estava editando meus arquivos com o Notepad+ e n�o estava
>>> configurado com o UTF-8. J� configurei, mas n�o resolveu nada... como
>>> o Nilo disse, deve ser a codifica��o do console(prompot de comando do
>>> windos. N�o encontrei onde alter�l� (at� fui em propriedades, mas n�o
>>> encontrei).
>>
>>> Algu�m pode me ajudar???
>>
>>> Tomaz Edson
>>
>> --
>>
>> ----------------------------------------
>> Nilo Menezes
>> ----------------------------------------
>> Livro:http://www.nilo.pro.br/iprog/
>> Blog:http://junglecoders.blogspot.com
>> Home Page:http://www.nilo.pro.br
>> Hobby:http://invasores.sourceforge.net
>> ----------------------------------------
>
--
==============================================
Renato de Pontes Pereira (renatopp)
O bug que falamos é do Python com um console Windows configurado para
página 65001.
É um bug aberto no Python.org... então é bug até ser fechado ;-)
[]
Nilo
On 17/02/2012 22:52, Renato Pereira wrote:
> Não é bug (até onde eu sei), o console do windows tem uma codificação
> maluca, se tu de print em uma string em utf-8 (python 2.x), o python
> vai tentar escrever no console com codificação diferente.
>
> Tu precisa usar unicode, assim o python transforma automaticamente
> para o encoding do console.
>
> ex. print u'çãó'
>
> No linux funciona legal porque o terminal é em utf-8.
>
> []'s
>
> On 17/02/2012 19:49, tems wrote:
>> É meu caro Nilo... nada certo... (rodei o chcp65001 e nada resolveu).
>> No Python3.2 já estava tudo ok. sem problema..
>> Quer dizer então que nem pensar em usar programas (scripts), em modo
>> texto, em python27 no windows?
>> Bom, então terei que me acostumar mesmo com o 3.2 já que é o futuro
>> mesmo, não é?
>>
>> Abraços em muito obirigado!
>>
>> Tomaz Edson
>>
>> On 17 fev, 18:41, LSKBR<ls...@yahoo.com.br> wrote:
>>> Olá Tomaz,
>>>
>>> Aparentemente é um bug do Python no
>>> Windows:http://bugs.python.org/issue1602
>>>
>>> Para trocar a página no console:
>>> chcp 65001
>>> Testei com o Python 2.7 e não funciona :-( como previsto.
>>> Com o Python 3.2 foi pior ainda :-(
>>>
>>> Detalhes
>>> aqui:http://stackoverflow.com/questions/878972/windows-cmd-encoding-change...http://stackoverflow.com/questions/1259084/what-encoding-code-page-is...
>>>
>>> A prova que deveria
>>> funcionar:http://illegalargumentexception.blogspot.com/2009/04/i18n-unicode-at-...
>>>
>>> []
>>>
>>> Nilo
>>>
>>> On 17/02/2012 22:13, tems wrote:
>>>
>>>> Galera, não tinha visto o comentário do grande Nilo (aliás, aprendi
>>>> muito com o uso do colorconsole).
>>>
>>>> Realmente estava editando meus arquivos com o Notepad+ e não estava
>>>> configurado com o UTF-8. Já configurei, mas não resolveu nada... como
>>>> o Nilo disse, deve ser a codificação do console(prompot de comando do
>>>> windos. Não encontrei onde alterálá (até fui em propriedades, mas não
>>>> encontrei).
>>>
>>>> Alguém pode me ajudar???
Nilo
Dura lex sed lex
Você coloca # coding: utf-8 no topo do seu arquivo apenas para
informar o interpretador Python de que os caracteres não ASCII do seu
código-fonte estão codificados desta maneira.
Isso não tem nenhuma relação com a capacidade do seu programa de gerar
saídas, na tela ou em arquivos, contendo caracteres não-ASCII.
Como explicar isso melhor? Se alguém souber, ajude!
[ ]s
Luciano
2012/2/17 tems <toma...@gmail.com>:
--
Ent�o primeiro, quando voc� manda um print "e��" e n�o diz nada a
respeito de codifica��o: o python reclama porque quando voc� n�o diz
nada, no python 2.x ele acha que voc� est� escrevendo em ascii. Como n�o
� ascii, d� zica.
Depois, quando voc� diz que � utf-8 e quebra dizendo que n�o pode
decodificar tal coisa: isso acontece porque como voc� disse que o
arquivo est� em utf-8, o interpretador vai tentar decodificar isso
usando utf-8. A� ele quebrou porque o arquivo n�o est� realmente salvo
em utf-8 e a� d� zica tamb�m.
A� a parada � a seguinte: O que voc� declara l�, n�o vai fazer seu
arquivo ser salvo em utf-8, iso8859-1 ou sei l� o que. Ele vai se salvo
com a codifica��o que seu editor de texto mandar. Ent�o, o que voc�
declara tem que ser a mesma codifica��o que o seu editor de texto salva.
No seu caso, parece que o editor t� salvando com iso8859-1, ent�o tem
dois jeitos. Ou voc� declara isso ou manda seu editor de texto salvar em
utf-8. Como disse o pessoal, mandar o editor de texto salvar em utf-8 �
o melhor.
E por fim tem o problema do que voc� escreve sair zuado no shell do
windows. O que pega (acho eu) � mais ou menos o seguinte: Voc� manda seu
programa imprimir uma string em utf-8, a� o python vai e manda uns bytes
l�. Pelo que o pessoal disse, o shell do windows tem uma codifica��o
esquisita, ent�o ele pega l� o que o python mandou e tenta decodificar
isso usando a codifica��o dele. Como o python mandou utf-8, o shell n�o
sabe como ler isso, ent�o aparecem as coisas estranhas.
O que voc� tem a fazer a�, � ajustar o seu shell pra ele usar utf-8.
Não tem um focado em Python, mas eu sugeri a criação de uma rede social em python.org.br que além de artigos, wiki e intetações. teria também uma parte de questões nestes moldes.
a app está pronta e o tema já está sendo discutido.
OT: esse tipo de pergunta ficaria muito bem num site tipo Quora ou Stack Exchange, um monte de gente respondeu, as respostas poderiam ser votadas e priorizadas. Faz falta um BOM site assim em português... Se tem algum (e eu acho que deve existir) é pouco conhecido utilizado, o que é uma pena.
2012/2/17 Vinicius Assef <vinic...@gmail.com>Desde que iniciei com Python, uso codificação UTF-8, não tenho tido
problemas com isso, mas nunca parei para questionar. Por que UTF-8 é
melhor para nós de língua portuguesa?
OT: esse tipo de pergunta ficaria muito bem num site tipo Quora ou Stack Exchange, um monte de gente respondeu, as respostas poderiam ser votadas e priorizadas. Faz falta um BOM site assim em português... Se tem algum (e eu acho que deve existir) é pouco conhecido utilizado, o que é uma pena.
UTF8 é uma extensão do ASCII que permite representar qualquer caractere UNICODE. Usando ASCII você só pode representar as letras maiúsculas e minúsculas normais.
O que pode estar te confundindo é que antigamente (nos tempos do DOS, e até na linha de comando do Windows) era possível usar caracteres acentuados usando algumas "codificações" especiais, sendo que a principal era a "code page 850". Mas isso não era um padrão aberto de verdade; era um padrão proprietário da Microsoft, que utilizava em cada país uma codificação diferente. Com isso as aplicações rodavam localmente mas era muito complicado trocar arquivos de país para país, os caracteres chegavam todos desformatados.
--
Carlos Ribeiro
Consultoria em Projetos
twitter: http://twitter.com/carribeiro
blog: http://rascunhosrotos.blogspot.com
mail: carri...@gmail.com
Indiscutivelmente, a de melhor qualidade técnica que já frequentei.
--
Vinicius Assef.
2012/2/18 LSKBR <ls...@yahoo.com.br>:
Nada contra desenvolver pra windows, mas honestamente o cmd do windows
é uma ferramenta legada dentro do próprio sistema.
obs: O windows é o unico os que adotou como padrão utf-16 (argh, mas é
porque eles usavam ucs-2 a muito tempo no cifs/smb).
--
Leonardo Santagada
Outro console legal para Windows é o git-bash, um shell bash que vem
junto com a distriução do git para Windows. Bem mais leve e simples
que o cygwin.
[ ]s
Luciano