Re: ir_spb

30 views
Skip to first unread message

Pavel Braslavski

unread,
Apr 16, 2015, 1:46:50 PM4/16/15
to Vladimir Nazarenko, iir...@googlegroups.com
+рассылка

Добрый день,

1. жаль, что ИМАТ2009 сломался - по рейтингу видно, что еще месяц назад все
работало.
Если проблема повторится, то предлагаю разделить размеченную выборку на обучение
и тест по запросам (например, 70/30) и самостоятельно посчитать метрики.

2. я предлагаю вам самостоятельно решить, сколько признаков вычислять. самый
лучши способ, на мой взгляд, -- добавлять по одному: посмотреть на релевантные
документы, которые текущим алгоритмом ранжируются низко, придумать полезные
признаки, добавить, обучиться, посмотреть на результат. Напомню, что значения
части стандартных признаков можно "вытащить" из lucene.

16.04.2015 15:09, Vladimir Nazarenko пишет:
> Здравствуйте, Павел,
>
> в процессе выполнения 5-го задания возникла проблема -- сайт интернет-математики
> 2009 не работает, пишет "An unhandled exception was thrown by the application."
> -- посмотреть задание и скачать датасеты у меня вышло, а отправить результаты на
> проверку не получается. Может, я что-то упустил на лекции и так должно быть?
>
> И ещё вопрос к шестому заданию -- в коллекции LETOR, если не ошибаюсь, указаны
> 64 признака. Сколько ориентировочно признаков стоит вычислять при выполнении
> задания? Особенно интересует, стоит ли вычислять признаки, основанные на
> структуре документа, например, TF для заголовка.
>
> Заранее спасибо за ответы.
> --
> /С уважением,/
> /Владимир Назаренко./


--
Pavel Braslavski
+79122271020
skype: pbraslavski
Reply all
Reply to author
Forward
0 new messages