Английский, итальнский, француский?

114 views
Skip to first unread message

asia.bar...@gmail.com

unread,
Mar 10, 2015, 9:31:42 PM3/10/15
to pymo...@googlegroups.com
Здравствуйте!

Pymorphy2 работает прекрасно с русским языком. Огромное спасибо за разработку, обязательно на вас сошлемся в нашем проекте. А знаете ли вы о похожих анализаторах для других европейских языков? Среди предыдущих постов нашла Pystemmer, это здорово, но есть ли еще что-то?

Спасибо!

Ася

Mikhail Korobov

unread,
Mar 15, 2015, 5:15:35 PM3/15/15
to pymo...@googlegroups.com, asia.bar...@gmail.com
Доброй ночи.
Спасибо!

В NLTK есть стеммеры для нескольких языков - см., например, http://textminingonline.com/dive-into-nltk-part-iv-stemming-and-lemmatization.
Но я сильно с другими европейскими языками не работал. Для английского nltk.stem.WordNetLemmatizer более-менее нормально работает.


среда, 11 марта 2015 г., 6:31:42 UTC+5 пользователь asia.bar...@gmail.com написал:

kura...@mail.ru

unread,
Apr 21, 2016, 5:32:49 AM4/21/16
to pymorphy, asia.bar...@gmail.com
А вообще, pymorphy2 нельзя расширить на другие языки? pymorphy ведь мог английский... Или pymorphy2 структурно заточен под русский?



понедельник, 16 марта 2015 г., 0:15:35 UTC+3 пользователь Mikhail Korobov написал:

Mikhail Korobov

unread,
Apr 21, 2016, 6:34:33 AM4/21/16
to pymorphy, asia.bar...@gmail.com
Английский можно вроде сделать, из ворднета. Там просто проблема не так остро стоит - инструментов больше (лемматайзеры, POS-теггеры), а морфологии гораздо меньше - формы глаголов да множественное число. Да и по форме слова меньше всего понять можно (почти всегда существительное может выступать в роли глагола).

четверг, 21 апреля 2016 г., 14:32:49 UTC+5 пользователь kura...@mail.ru написал:
Reply all
Reply to author
Forward
0 new messages