Обогащение текстов семантическими данными

5 views
Skip to first unread message

maxim.shatilov

unread,
Nov 15, 2009, 10:46:04 AM11/15/09
to webofdata.ru
Здравствуйте!

Меня интересует ПО для извлечения данных из текстов для аннотирования
ресурсов, например - http://www.opencalais.com/

Какие средства кроме данной системы могут подойти для этого?

Интересны также продукты для русского языка.

С уважением,
Шатилов Максим.

Ivan Mikhailov

unread,
Nov 15, 2009, 11:11:51 AM11/15/09
to webofdat...@googlegroups.com
Здравствуйте, Максим,

Пока что с калэйсом просто некого сравнивать. Рейтерс на голову выше
всех. В разработке ещё есть диалоговые семантические средства, но они
разбирают отдельные предложения, напр. чтобы понять конкретный вопрос.
Тут вспоминается XOperator.

Всего наилучшего,
Иван Михайлов
OpenLink Software
http://virtuoso.openlinksw.com

Vasiliy Faronov

unread,
Nov 15, 2009, 11:19:59 AM11/15/09
to webofdat...@googlegroups.com
Здравствуйте, Максим.

Посмотрите следующее:

http://www.zemanta.com/
http://www.alchemyapi.com/
http://developer.yahoo.com/search/content/V1/termExtraction.html
http://lookup.dbpedia.org/

--
Василий Фаронов

Бегтин Иван

unread,
Nov 15, 2009, 11:41:53 AM11/15/09
to webofdata.ru
Ещё есть Ontos API (http://ontos.com/o_eng/index.php?cs=1), насколько
я знаю разработчики его - это Авикомп, соответственно там
распознавание named entities для 3-х языков: английского, немецкого и
русского.

С уважением,
Иван Бегтин

On 15 ноя, 18:46, "maxim.shatilov" <maxim.shati...@gmail.com> wrote:
> Здравствуйте!
>
> Меня интересует ПО для извлечения данных из текстов для аннотирования

> ресурсов, например -http://www.opencalais.com/

Бегтин Иван

unread,
Nov 15, 2009, 11:45:35 AM11/15/09
to webofdata.ru
> http://www.alchemyapi.com/

Я не так давно пробовал AlchemyAPI и пока ничего хорошего сказать не
могу. Из нескольких тысяч веб-страниц на русском языке скормленных в
Language Identification API он около половины опознал как вьетнамские
и вообще не умеет определять кодировки. Может быть с другими их API
ситуация получше, но что-то мне пока не очень в это верится.

С уважением,
Иван Бегтин

Mikhail Navernyuk

unread,
Nov 16, 2009, 10:33:29 AM11/16/09
to webofdat...@googlegroups.com
Еще можно посмотреть http://aot.ru/

Хотя это больше просто лингвистика, но у них где-то было что-то похожее.

maxim.shatilov

unread,
Nov 16, 2009, 10:34:47 AM11/16/09
to webofdata.ru
Большое спасибо!

А есть нечто похожее для русского языка?

Евгений Рабчевский

unread,
Nov 18, 2009, 1:14:52 PM11/18/09
to webofdat...@googlegroups.com
Есть ряд разработотк шефилдского университета по аннотации
группа http://nlp.shef.ac.uk/wig/

в частности платформа для построения подобных приложений под названием gate

небольшой обзор есть у меня
http://rabchevsky.name/taxonomy/term/29

16.11.09, maxim.shatilov<maxim.s...@gmail.com> написал(а):


> Большое спасибо!
>
> А есть нечто похожее для русского языка?
> >
>


--
ПРИ ОТВЕТЕ НА ПИСЬМО ПРОСЬБА СОХРАНЯТЬ ИСТОРИЮ ПЕРЕПИСКИ!
С наилучшими пожеланиями,
Рабчевский Евгений

Reply all
Reply to author
Forward
0 new messages