NLTK etiquetação de classes gramaticais em português

2,459 views
Skip to first unread message

Arnoldo Nunes

unread,
Oct 24, 2016, 9:27:54 PM10/24/16
to Python Brasil
Prezados amigos,

A sequência de comandos abaixo permite etiquetar uma frase em inglês

import nltk
texto = "Mr. Green killed Colonel Mustard in the study with the candlestick."
frases = nltk.tokenize.sent_tokenize(texto)
tokens = nltk.word_tokenize(texto)
classes = nltk.pos_tag(tokens)
('Mr.', 'NNP'), ('Green', 'NNP'), ('killed', 'VBD'), ('Colonel', 'NNP'), ('Mustard', 'NNP'), ('in', 'IN'), ('the', 'DT'), ('study', 'NN'), ('with', 'IN'), ('the', 'DT'), ('candlestick', 'NN'), ('.', '.')]


Qual a sequencia de comandos que permitiria a etiquetação de classes gramaticais para uma frase em português?

Agradecendo antecipadamente pela ajuda,
Arnoldo.

George Silva

unread,
Oct 25, 2016, 6:48:52 AM10/25/16
to Python Brasil
Não conheço muito o NLTK, mas achei uma lista de exemplos em pt-br.

Veja se ajuda.

http://www.nltk.org/howto/portuguese_en.html

--
--
------------------------------------
Grupo Python-Brasil
http://www.python.org.br/wiki/AntesDePerguntar
 
<*> Para visitar o site do grupo na web, acesse:
http://groups.google.com/group/python-brasil
 
<*> Para sair deste grupo, envie um e-mail para:
python-brasil+unsubscribe@googlegroups.com

---
Você recebeu essa mensagem porque está inscrito no grupo "Python Brasil" dos Grupos do Google.
Para cancelar inscrição nesse grupo e parar de receber e-mails dele, envie um e-mail para python-brasil+unsubscribe@googlegroups.com.
Para mais opções, acesse https://groups.google.com/d/optout.



--
George R. C. Silva
Sigma Geosistemas LTDA
----------------------------

Arnoldo Nunes

unread,
Oct 25, 2016, 7:30:51 AM10/25/16
to python...@googlegroups.com
Já conhecia essa lista, mas fica muito claro a parte do treinamento. Eu os passos sugeridos, mas ao colocar uma frase em português, a etiquetação continuou tratando como se fosse termos ingleses.
Atenciosamente,

Arnoldo Nunes da Silva



Professor Assistente
Depto. de Ciência da Informação
Fone: (85) 3366 7952

George Silva

unread,
Oct 25, 2016, 8:58:00 AM10/25/16
to Python Brasil
Era isso que ia falar, a parte do treinamento precisa existir.

Alguém aí é especialista no NLTK?

Abraços

Liandro Bulegon

unread,
Oct 25, 2016, 12:57:48 PM10/25/16
to python...@googlegroups.com
Pelo que eu entendi, a biblioteca não está preparada para tratar o idioma Português. Este foi um dos motivos de eu parar de estudar ela, e ficar Órfão de pai e mãe....

Mitomed - Data take care health.

Liandro J. Bulegon

051-91667762

Abelardo Mota

unread,
Oct 25, 2016, 3:21:25 PM10/25/16
to Python Brasil
Aqui há alguns taggers para português: https://github.com/fmaruki/Nltk-Tagger-Portuguese

ViniciusY.

unread,
Dec 24, 2019, 6:22:04 PM12/24/19
to Python Brasil
Eu não tive muito exito com o NLTK em portgugues então usei o polyglot para lidar com isso, e mesmo assim ainda tiver que me virar um pouco mas ao menos conseguio que queria.
Reply all
Reply to author
Forward
0 new messages