NLTK etiquetação de classes gramaticais em português

Arnoldo Nunes

unread,

Oct 24, 2016, 9:27:54 PM10/24/16

to Python Brasil

Prezados amigos,

A sequência de comandos abaixo permite etiquetar uma frase em inglês

import nltk
texto = "Mr. Green killed Colonel Mustard in the study with the candlestick."
frases = nltk.tokenize.sent_tokenize(texto)
tokens = nltk.word_tokenize(texto)
classes = nltk.pos_tag(tokens)
('Mr.', 'NNP'), ('Green', 'NNP'), ('killed', 'VBD'), ('Colonel', 'NNP'), ('Mustard', 'NNP'), ('in', 'IN'), ('the', 'DT'), ('study', 'NN'), ('with', 'IN'), ('the', 'DT'), ('candlestick', 'NN'), ('.', '.')]

Qual a sequencia de comandos que permitiria a etiquetação de classes gramaticais para uma frase em português?

Agradecendo antecipadamente pela ajuda,
Arnoldo.

George Silva

unread,

Oct 25, 2016, 6:48:52 AM10/25/16

to Python Brasil

Não conheço muito o NLTK, mas achei uma lista de exemplos em pt-br.

Veja se ajuda.

http://www.nltk.org/howto/portuguese_en.html

--
--
------------------------------------
Grupo Python-Brasil
http://www.python.org.br/wiki/AntesDePerguntar

<*> Para visitar o site do grupo na web, acesse:
http://groups.google.com/group/python-brasil

<*> Para sair deste grupo, envie um e-mail para:
python-brasil+unsubscribe@googlegroups.com

---
Você recebeu essa mensagem porque está inscrito no grupo "Python Brasil" dos Grupos do Google.
Para cancelar inscrição nesse grupo e parar de receber e-mails dele, envie um e-mail para python-brasil+unsubscribe@googlegroups.com.
Para mais opções, acesse https://groups.google.com/d/optout.

--

George R. C. Silva
Sigma Geosistemas LTDA

----------------------------

http://www.sigmageosistemas.com.br/

Arnoldo Nunes

unread,

Oct 25, 2016, 7:30:51 AM10/25/16

to python...@googlegroups.com

Já conhecia essa lista, mas fica muito claro a parte do treinamento. Eu os passos sugeridos, mas ao colocar uma frase em português, a etiquetação continuou tratando como se fosse termos ingleses.

Atenciosamente,

Arnoldo Nunes da Silva

Professor Assistente
Depto. de Ciência da Informação
Fone: (85) 3366 7952

George Silva

unread,

Oct 25, 2016, 8:58:00 AM10/25/16

to Python Brasil

Era isso que ia falar, a parte do treinamento precisa existir.

Alguém aí é especialista no NLTK?

Abraços

Liandro Bulegon

unread,

Oct 25, 2016, 12:57:48 PM10/25/16

to python...@googlegroups.com

Pelo que eu entendi, a biblioteca não está preparada para tratar o idioma Português. Este foi um dos motivos de eu parar de estudar ela, e ficar Órfão de pai e mãe....

Mitomed - Data take care health.
Liandro J. Bulegon
051-91667762
wwww.mitomed.com.br

Abelardo Mota

unread,

Oct 25, 2016, 3:21:25 PM10/25/16

to Python Brasil

Aqui há alguns taggers para português: https://github.com/fmaruki/Nltk-Tagger-Portuguese

ViniciusY.

unread,

Dec 24, 2019, 6:22:04 PM12/24/19

to Python Brasil

Eu não tive muito exito com o NLTK em portgugues então usei o polyglot para lidar com isso, e mesmo assim ainda tiver que me virar um pouco mas ao menos conseguio que queria.

Reply all

Reply to author

Forward