'Новости' и 'новости'

42 views
Skip to first unread message

hro...@gmail.com

unread,
May 16, 2016, 6:57:23 AM5/16/16
to pymorphy
Коллеги, добрый день. Вопрос такой.
Для слова "новости" наиболее вероятный результат разбора: ед. число, родительный падеж. Ожидаемый результат (по ситуации по крайне мере) -  это именительный падеж мн. число.  Подскажите как быть в такой ситуации, совет анализировать соседние слова я видел? Можно ли изменять оценку (score) в модели на некотором этапе "Обучения"?
Спасибо.

Yuri Baburov

unread,
May 16, 2016, 7:08:35 AM5/16/16
to pymo...@googlegroups.com
Как я понимаю, на настоящий момент, вероятность разбора присваивается только леммам. Оба варианта поэтому будут с одинаковым score.
Проще всего, наверное, такие специальные случаи обработать отдельно, не полагаясь на pymorphy (если таких случаев мало).
Или взять какую-нибудь утилиту для синтаксического разбора, если таких случаев много -- потому что в рамках морфологического разбора всё корректно.


--
Вы получили это сообщение, поскольку подписаны на группу "pymorphy".
Чтобы отменить подписку на эту группу и больше не получать от нее сообщения, отправьте письмо на электронный адрес pymorphy+u...@googlegroups.com.
Чтобы настроить другие параметры, перейдите по ссылке https://groups.google.com/d/optout.



--
Best regards, Yuri V. Baburov, Skype: yuri.baburov
Reply all
Reply to author
Forward
0 new messages