pymorphy2 как интерфейс к OpenCorpora

72 views
Skip to first unread message

Evgenii Kalenkovich

unread,
Aug 9, 2018, 7:33:19 AM8/9/18
to pymorphy
Добрый день.

Мне нужно решить несколько задач типа "найти 100 самых частотных существительных мужского рода именительного падежа, в которых не более трех букв". Можно, конечно, напрямую лезть в файлы OpenCorpora, но не хочется изобретать велосипед. Подскажите, пожалуйста, можно ли как-то на это дело натравить pymorphy2?

Женя

Mikhail Korobov

unread,
Aug 9, 2018, 7:56:05 AM8/9/18
to pymo...@googlegroups.com
Добрый день. Абсолютные частоты слов в pymorphy2 не используются (сохраняются только относительные частоты возможных разборов, когда их несколько для одной словоформы), но на http://opencorpora.org/?page=downloads доступны частотные списки для скачивания, их должно быть достаточно просто использовать. Все формы всех слов можно получить через morph.iter_known_word_parses.Или можно просто прогнать pymorphy2 на словах из top частотного списка.

чт, 9 авг. 2018 г. в 16:33, Evgenii Kalenkovich <e.kale...@gmail.com>:
Добрый день.

Мне нужно решить несколько задач типа "найти 100 самых частотных существительных мужского рода именительного падежа, в которых не более трех букв". Можно, конечно, напрямую лезть в файлы OpenCorpora, но не хочется изобретать велосипед. Подскажите, пожалуйста, можно ли как-то на это дело натравить pymorphy2?

Женя

--
Вы получили это сообщение, поскольку подписаны на группу "pymorphy".
Чтобы отменить подписку на эту группу и больше не получать от нее сообщения, отправьте письмо на электронный адрес pymorphy+u...@googlegroups.com.
Чтобы настроить другие параметры, перейдите по ссылке https://groups.google.com/d/optout.

Evgenii Kalenkovich

unread,
Aug 9, 2018, 8:32:38 AM8/9/18
to pymorphy
Спасибо.
Reply all
Reply to author
Forward
0 new messages