+рассылка
Добрый день,
21.03.2015 15:36, Vladimir Nazarenko пишет:
> Павел, добрый день,
>
> у меня возникли вопросы по второму заданию(имеется ввиду задание 3-4) и я был бы
> рад, если бы у Вас нашлось время на них ответить.
> Мне непонятно, как использовать таблицы релевантности для вычисления метрик.
> Проблема в том, что, во-первых, оценки асессоров для запроса иногда вообще не
> содержат релевантных документов, а во-вторых, у меня так выходит, что для
> некоторых запросов выдача Sphinx и документы, для которых есть оценки
> релевантности в таблицах, не пересекаются. Короче говоря, у меня так и не вышло
> получить p@10 больше нуля хотя бы для какого-нибудь запроса. Наверное, я что-то
> упустил на лекциях, но я не могу понять, что.
то, что могут быть запросы без релевантных документов - ОК
то, что sphinx не находит ничего - немного странно. попробуйте увеличить глубину
до 20
Прикладываю результаты поиска по коллекции стандартным Lucene (с/без русской
морфологии) из отчета Дениса Антипова (ИТМО). У других студентов результаты с
использованием lucene были похожие.
Еще можно посмотреть результаты участников РОМИП 2010:
http://romip.ru/romip2010/09_yandex_adhoc.pdf
>
> Ещё вот такой вопрос -- в задании требуется проиндексировать и вычислить
> метрики, но ничего не говорится про улучшение результатов поиска -- стоит ли
> этим заниматься?
пока нет )
> И вопрос, возможно, наивный, относящийся не к домашним заданиям, а к тематике
> RuSSIR. Скажем так, стоит ли туда идти после Вашего курса, то есть не будет ли
> там представлен тот же материал, что и на Ваших лекциях?
На школе материал будет намного более разнообразный и глубокий, так что
настоятельно рекомендую )
--
Pavel Braslavski
+79122271020
skype: pbraslavski