Классификация профессиональных текстов на русском

708 views
Skip to first unread message

Эдуард Мартыненко

unread,
Oct 6, 2017, 1:54:23 PM10/6/17
to nltk-russian
Привет! братья по языку! Подскажите - есть ли какой нибудь внятный и понятный гайд по классификации текстов.
Задача - какая - сделать классификатор текста (где то 500 слов и где то 15 классов)
Какие проблемы - 1) Язык русский и он немного профессиональный т.к. это для ментовки делается и будет спец формулировки использоваться.
2) В инете все гайды используя готовые вектора и почти все для классификации отзывов по фильмам и нигде не описывается поробно как использовать произвольные тексты
Ну и может кто сталкивался с подробным и знает хорошие примеры на гихабе.

Алексей Басков

unread,
Jun 14, 2018, 2:10:23 PM6/14/18
to nltk-russian
Есть такой ресурс http://www.machinelearning.ru/ на нем можно найти много интересного. Прямо ответ на ваш вопрос:

http://www.machinelearning.ru/wiki/index.php?title=Вероятностные_тематические_модели_%28курс_лекций%2C_К.В.Воронцов%29

пятница, 6 октября 2017 г., 22:54:23 UTC+5 пользователь Эдуард Мартыненко написал:

Niko

unread,
Jun 16, 2018, 8:19:58 AM6/16/18
to nltk-russian
fastText от фейсбука как раз решает задачу классификации, и хорошо подходит для языков с богатой морфологией, так как использует кроме строк ище и подстроки.
Reply all
Reply to author
Forward
0 new messages