Методология построения онтологий

Anton Cherny

unread,

Jun 11, 2009, 8:48:39 AM6/11/09

to webofdata.ru

Добрый день, уважаемые коллеги!

Хотелось бы здесь обсудить тему создания онтологий с нуля.

Итак задача:
Есть некоторая предметная область (ПО). Необходимо составить для нее
онтологию.

Вот какие этапы вижу я:
1) Берем документ(набор документов), содержащий большое количество
понятий предметной области и специалиста по этой собственно области.
2) Выделяем из документа эти понятия и забиваем в онтологию, создавая
выявляющиеся иерархии на ходу.
3) После выделения этих свойств осуществляется очередной проход для
установления restriction-ов и прочих свойств - эквивалент классов и
т.п.
4) Наполнение экземплярами и вместе с этим выявление дополнительных
свойств(которые при этом пренепременно всплывают).
5) После этого можно сказать что костяк онтологии сформирован.

Проблемы:
1) проблема disjoint-а. Если при создании понятия добавлять disjoint с
другими классами, то при добавлении новых классов надо опять все
перетряхивать.

Это единственная большая проблема которую я вижу в предложенной
методике. Может вы увидите больше и предложите свои подходы.

Жду ваших сацесс стори :-)

С уважением,
Антон Черний

Mikhail Roshchin

unread,

Jun 11, 2009, 12:31:16 PM6/11/09

to webofdat...@googlegroups.com

на мой взгляд, то что вы предложили является самой большим заблуждением при построении онтологии.

для онтологии нужна модель - с нее и надо начинать. а модель будет строиться исходя из задач, к-е необходимо выполнить. соответственно понятия предметной области заполняются в схему и никакого дисджойнта добавлять не приходится. он уже в схеме, к-я обычно не больше 50 классов

2009/6/11 Anton Cherny <antony...@gmail.com>

--
ciao,
Misha
------
Mikhail Roshchin's personal web page www.ruscience.ru

Anton Cherny

unread,

Jun 19, 2009, 10:48:47 PM6/19/09

to webofdata.ru

Добрый день!
Вы говорите, что надо отталкиваться от задачи.

Хорошо. Но вот если задача в построении онтологии предметной области
для метаописания документов.
Вот к примеру возьмем всем известную ПО - образование (школьное или
ВУЗовское) - неважно.

И откуда взять модель?
И опять таки...
Притягивать за уши понятия к красивому древу, чтоб было удобно
проставить disjoint - имхо неправильно...

Так как же быть?

С уважением,
Черний А.В.

On 11 июн, 23:31, Mikhail Roshchin <roshc...@gmail.com> wrote:
> на мой взгляд, то что вы предложили является самой большим заблуждением при
> построении онтологии.
>
> для онтологии нужна модель - с нее и надо начинать. а модель будет строиться
> исходя из задач, к-е необходимо выполнить. соответственно понятия предметной
> области заполняются в схему и никакого дисджойнта добавлять не приходится.
> он уже в схеме, к-я обычно не больше 50 классов
>

> 2009/6/11 Anton Cherny <antony.che...@gmail.com>

Mikhail Roshchin

unread,

Jun 20, 2009, 4:27:36 PM6/20/09

to webofdat...@googlegroups.com

Антон, под задачей я имел в вид немного не то, что вы имеете в виду. если брать область образование, то одной из задач (функциональных) например может быть составление расписания по раздичным критериям. и дисджойнт тут не при чем - это всего лишь одна из вещей, с которой вам придется столкнуться во время моделирования. самое центральное будет построить модель таким образом, чтобы вывод на ней осуществлялся в считанные секунды. представьте, что у вас модель (онтология ТБокс) состоит из 10 классов и есть АБокс (200 различных представителей) - если модель построена неправильно, то вывод (получение расписания) либо будет неправильным - что в принципе легко исправляется за какое то время, либо будет очень медленным (до нескольких часов) - что исправляется ну оочень медленно (надо знать логику и вывод на ней достаточно глубоко). а результат такой вам придется показывать заказчикам, которые удивленно спросят, так в чем же преимущество онтологий перед теми же базами данных, где с помощью тригеров задача решается достаточно просто.

просто это уже один раз здесь затрагивалось - необходимо различать синтаксис (например, модель какой то ПО) и вывод на этой модели (т.е. как раз то, что называется семантикой, и то, что формулируется исходя из задачи вывода, и потом соответственно, модель (синтаксис ПО) строится на базе этой задачи). РДФ и ОВЛ - мое личное убеждение - сами по себе как форматы особо не отличаются от каких других, кроме того, что заставляют программистов изучать что-то другое, по-мимо иксмл парсера. Их преимущество именно в использовании логическиз машин вывода. но это очень не легко

2009/6/20 Anton Cherny <antony...@gmail.com>

Reply all

Reply to author

Forward