Требуется произвести анализ тональности текста на множестве пользовательских комментариев определенной тематики. На данный момент принято решение проводить классификацию по трем классам — негативной, нейтральной и позитивной тональности. Для исследования алгоритмов вручную размечено 1500 комментариев. Размеры классов в тестовой выборке отличаются не более, чем в два раза. По примеру зарубежных коллег был применен метод опорных векторов в пространстве бинарных признаков, обозначающих наличие слов в комментариях. Правильность классификации составляет менее 60%. Анализ тональности английских текстов показывал эффективность в 80%.
--
You received this message because you are subscribed to a topic in the Google Groups "nltk-russian" group.
To unsubscribe from this topic, visit https://groups.google.com/d/topic/nltk-russian/cYZQK-6Rjp8/unsubscribe?hl=en.
To unsubscribe from this group and all its topics, send an email to nltk-russian...@googlegroups.com.
For more options, visit https://groups.google.com/groups/opt_out.
To unsubscribe from this topic, visit https://groups.google.com/d/topic/nltk-russian/cYZQK-6Rjp8/unsubscribe.