Prezados amigos,
A sequência de comandos abaixo permite etiquetar uma frase em inglês
import nltk
texto = "Mr. Green killed Colonel Mustard in the study with the candlestick."
frases = nltk.tokenize.sent_tokenize(texto)
tokens = nltk.word_tokenize(texto)
classes = nltk.pos_tag(tokens)
('Mr.', 'NNP'), ('Green', 'NNP'), ('killed', 'VBD'), ('Colonel', 'NNP'), ('Mustard', 'NNP'), ('in', 'IN'), ('the', 'DT'), ('study', 'NN'), ('with', 'IN'), ('the', 'DT'), ('candlestick', 'NN'), ('.', '.')]
Qual a sequencia de comandos que permitiria a etiquetação de classes gramaticais para uma frase em português?
Agradecendo antecipadamente pela ajuda,
Arnoldo.