Семинар 23 марта

1 view
Skip to first unread message

Danil Nemirovsky

unread,
Mar 19, 2009, 4:53:33 AM3/19/09
to ir-wo...@googlegroups.com
Привет всем,

23 марта (понедельник) в 17.20 состоится доклад Данила Немировского.

Тема: Метод кластеризации гипертекстовых коллекций документов основанный на PageRank.

Кластеризация коллекций гипертестовых документов - это одна из важных задач информационного поиска. Многие методы кластеризации основаны на текстовом содержимом документов и не принимают во внимание их гипертекстовые ссылки. Мы предлагаем новый алгоритм (PageRank based clustering algorithm, PRC), который использует гипертекстовую структура коллекции документов и кластеризует графы в набор кластеров с высокой модулярностью. Эксперименты с PRC выявили хорошое совпадение между кластеризациями полученными с помощью PRC и с помощью методов, основанных на текстовом содержимом документа.
Reply all
Reply to author
Forward
0 new messages