Danil Nemirovsky
unread,Mar 19, 2009, 4:53:33 AM3/19/09Sign in to reply to author
Sign in to forward
You do not have permission to delete messages in this group
Either email addresses are anonymous for this group or you need the view member email addresses permission to view the original message
to ir-wo...@googlegroups.com
Привет всем,
23 марта (понедельник) в 17.20 состоится доклад Данила Немировского.
Тема: Метод кластеризации гипертекстовых коллекций документов основанный на PageRank.
Кластеризация коллекций гипертестовых документов - это одна из важных задач информационного поиска. Многие методы кластеризации основаны на текстовом содержимом документов и не принимают во внимание их гипертекстовые ссылки. Мы предлагаем новый алгоритм (PageRank based clustering algorithm, PRC), который использует гипертекстовую структура коллекции документов и кластеризует графы в набор кластеров с высокой модулярностью. Эксперименты с PRC выявили хорошое совпадение между кластеризациями полученными с помощью PRC и с помощью методов, основанных на текстовом содержимом документа.