Нормализ

79 views
Skip to first unread message

dead...@gmail.com

unread,
Apr 3, 2017, 4:48:07 AM4/3/17
to pymorphy
Доброго времени суток. Интересуюсь есть ли возможность с помощью pymorphy2 нормализовать имена например так parse("Сашенька", "female") => Александра. И, если нет такой возможности, буду очень благодарен за подсказки в какую сторону гуглить. Спасибо.

Mikhail Korobov

unread,
Apr 3, 2017, 5:24:11 AM4/3/17
to pymorphy, dead...@gmail.com
Добрый день. Такой возможности сейчас нет, т.к. 1) в словаре OpenCorpora не проставлены соответствующие связи, и 2) в этом словаре довольно многие имена в уменьшительно-ласкательной форме отсутствуют - "Сашеньки" там нет, например (pymorphy2 вроде должен справиться через предсказатели, но ошибки могут быть).

См., например, https://github.com/OpenCorpora/opencorpora/issues/804.

В идеале это бы в OpenCorpora починить; можно там тикет завести и, если время есть, свою помощь предложить :)
Как обходной путь - поискать где-то такой словарь таких имен.

понедельник, 3 апреля 2017 г., 13:48:07 UTC+5 пользователь dead...@gmail.com написал:

Eugene Pivnev

unread,
Apr 3, 2017, 5:31:20 AM4/3/17
to pymo...@googlegroups.com
Хуже того.
* Некоторые "Лены" предпочитают, чтобы к ним обращались строго "Алёна",
и никак иначе
* Почти все "Оксаны" сейчас перепиливаются на "Ксении"
* Про "Вика" и "Вита" (которые "Виктория") вообще молчим
* "Артемий Лебедев" слышали?

03.04.2017 12:24, Mikhail Korobov пишет:
> --
> Вы получили это сообщение, поскольку подписаны на группу "pymorphy".
> Чтобы отменить подписку на эту группу и больше не получать от нее
> сообщения, отправьте письмо на электронный адрес
> pymorphy+u...@googlegroups.com
> <mailto:pymorphy+u...@googlegroups.com>.
> Чтобы настроить другие параметры, перейдите по ссылке
> https://groups.google.com/d/optout.


dead...@gmail.com

unread,
Apr 3, 2017, 2:29:45 PM4/3/17
to pymorphy, dead...@gmail.com
Благодарю вас за ответы, будем посмотреть :)
Reply all
Reply to author
Forward
0 new messages