Re em python

Ademir Francisco da Silva

unread,

Aug 27, 2009, 12:58:59 AM8/27/09

to Expressões regulares

Olá pessoal,

Estou aprendendo re contudo tenho uma duvida básica que não consegui
entender... bom vamos lá...

Eu preciso casar letras acentuadas ( Ex. em Maçã ) e estou utilizando
o \w para isto contudo não estou obtendo sucesso. alguém pode me
esclarecer o porque?

Estou utilizando o Python 2.6.2.

1[]

Ademir

Thalles Robson

unread,

Aug 27, 2009, 5:03:28 PM8/27/09

to expressoes...@googlegroups.com

Olá Ademir.

Deveria estar funcionando, pelo menos é que diz no livro do Aurélio.

Entretanto, você pode usar um "remendo"

tente usar [a-zà-ú] e [A-ZÀ-Ú] , mas assim você ganha alguns lixos como ä e outros que não consegui digitar

2009/8/27 Ademir Francisco da Silva <ademir...@gmail.com>

--
Thalles Robson

"Um plano só é bom nas mãos de quem pode executá-lo"

Starwars

----

thalle...@yahoo.co.uk
thal...@gmail.com
thalle...@yahoo.com.br

Ademir Francisco da Silva

unread,

Aug 30, 2009, 10:37:24 AM8/30/09

to expressoes...@googlegroups.com

Ola Thalles ...

Obrigado pela pronta resposta ...

Eu sei que fui muito suscinto em minha dúvida e que não esclareceu muito, contudo veja abaixo o que esta acontecendo de fato.... ( É verdade deveria funcionar, será que tem a ver com o modulo locale do Python se bem que eu já olhei e o mesmo retorna Pt-br Utf8 que é o padrão ) Enfim o mistério a se desvendar é este... se alguém já passou por este mistério e puder me ajudar eu agradeço e se eu descobrir vou postar aqui na lista pois acredito ser algo atípico ). Eu sei que posso fazer isto com o Puro Python mas fazer o que se eu gosto da RE...

txt = "Maçã"
print search( r"\w", txt, L|I ).group() # \w Matches any alphanumeric character; equivalent to [a-zA-Z0-9_]

1[]

Ademir Francisco da Silva

2009/8/27 Thalles Robson <thal...@gmail.com>

--
Ademir Francisco da Silva

Felipe Pena

unread,

Aug 30, 2009, 12:22:59 PM8/30/09

to Expressões regulares

Usando da seguinte forma, funciona como esperado:

# -*- coding: UTF-8 -*-

import re
reg = re.compile(r"\w+", re.UNICODE)
print reg.findall(u"não")

On 30 ago, 11:37, Ademir Francisco da Silva <ademirfs....@gmail.com>
wrote:

> Ola Thalles ...
>
> Obrigado pela pronta resposta ...
>
> Eu sei que fui muito suscinto em minha dúvida e que não esclareceu muito,
> contudo veja abaixo o que esta acontecendo de fato.... ( É verdade deveria
> funcionar, será que tem a ver com o modulo locale do Python se bem que eu já
> olhei e o mesmo retorna Pt-br Utf8 que é o padrão ) Enfim o mistério a se
> desvendar é este... se alguém já passou por este mistério e puder me
> ajudar eu agradeço e se eu descobrir vou postar aqui na lista pois acredito
> ser algo atípico ). Eu sei que posso fazer isto com o Puro Python mas fazer
> o que se eu gosto da RE...
>
> txt = "Maçã"
> print search( r"\w", txt, L|I ).group() # \w Matches any alphanumeric
> character; equivalent to [a-zA-Z0-9_]
>
> 1[]
>
> Ademir Francisco da Silva
>

> 2009/8/27 Thalles Robson <thall...@gmail.com>

>
>
>
>
>
> > Olá Ademir.
>
> > Deveria estar funcionando, pelo menos é que diz no livro do Aurélio.
>
> > Entretanto, você pode usar um "remendo"
>
> > tente usar [a-zà-ú] e [A-ZÀ-Ú] , mas assim você ganha alguns lixos como ä e

> > outros que não consegui digitar [?]
>
> > 2009/8/27 Ademir Francisco da Silva <ademirfs....@gmail.com>

>
> >> Olá pessoal,
>
> >> Estou aprendendo re contudo tenho uma duvida básica que não consegui
> >> entender... bom vamos lá...
>
> >> Eu preciso casar letras acentuadas ( Ex. em Maçã ) e estou utilizando
> >> o \w para isto contudo não estou obtendo sucesso. alguém pode me
> >> esclarecer o porque?
>
> >> Estou utilizando o Python 2.6.2.
>
> >> 1[]
>
> >> Ademir
>
> > --
> > Thalles Robson
>
> > "Um plano só é bom nas mãos de quem pode executá-lo"
>
> > Starwars
>
> > ----
>

> > thalles.r...@yahoo.co.uk
> > thall...@gmail.com
> > thallesrob...@yahoo.com.br