Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

без субжа, или: мысли вслух

175 views
Skip to first unread message

Yan Bolshedvorski

unread,
Oct 24, 2007, 3:05:19 PM10/24/07
to
#----------------------------------------------------------------------
# Description: Общие размышления о.
# Author: Death Master
# Created at: Wed Oct 24 23:24:51 IRKST 2007
# Computer: sunflower
# System: Linux 2.4.33.3 on i686
#
# Copyright (c) 2007 All rights reserved.
#
#----------------------------------------------------------------------

Общая проблема форт-слов заключается в том что они предназначены для
выполнения в довольно специфической среде. Если же не брать в расчёт среду,
то, с точки зрения структурированной разработки, получится что "стандартные"
слова форта - демонстрируют низкую степень функциональной связности,
поскольку их назначение, редко можно описать одной фразой. (Под "средой" я
подразумеваю "стандартную" архитектуру форт-системы.)

Иными словами эту проблему можно сформулировать так: оторванность
"стандартного набора слов" (форта) от контекста обычной, повседневной
реальности (поэтому назначение любого "примитива" форта нельзя описать
одной фразой). Это значит, что "Стандартная" терминология форта как таковая
- едва ли может быть пригодной для "мышления" в широком смысле слова. Она может
быть пригодна разве что для "узкоспециализированного" так сказать, мышления,
то есть когда контекстом выполнения стандартных слов является собственно сама
форт-система. Связь этой форт-системы с реальностью - обеспечивает
программист, за счёт своих творческих способностей, путём выражения решения
некоторой конкретной задачи в терминологии - по сути чуждой природе задачи
(чтобы это увидеть, достаточно проследить определения до уровня "стандартных"
"примитивов"). Происходит это, я думаю, как раз потому, что ("стандартные")
слова форта - не имеют аналогов в реальности, а действительны лишь в некоторой
виртуальной модели несуществующего "мира", которым (с натяжкой, естественно)
можно назвать форт-систему. Отсутствие "по умолчанию" связи с реальностью -
приводит к лишней трате творческих способностей программиста, заставляя его
снова и снова проводить одни и те-же парралели, снова и снова "переводя" одни
слова (естественного языка) в другие (форт-слова).

Решением этой проблемы может быть построение такой стандартной форт-модели,
терминология которой, в необходимой и достаточной степени отражала бы
объективную действительность. Тогда, такая, модель была бы пригодна для
"мышления". Точнее, мышление в терминологии, более приближённой к реальности,
было бы более адекватным этой самой реальности. Естественно, что оно было бы
более экономичным.

Примечание. Разумеется, эта проблема актуальна лишь до тех пор, пока мы живём
в реальном мире ;), а не переселились полностью в "виртуальность", где всё
придумано с нуля и по своему...

=== Конец th-c ===

. waiting transmission approach ...

nsc: King Diamond - Digging Graves - The Graveyard - 1996

Ilia Tarasov

unread,
Oct 24, 2007, 11:48:12 AM10/24/07
to
Thu Oct 25 2007 00:05, Yan Bolshedvorski wrote to All:

YB> "стандартные" слова форта - демонстрируют низкую степень функциональной
YB> связности,
YB> поскольку их назначение, редко можно описать одной фразой.

И это прекрасно, поскольку означает высокую функциональную нагрузку каждого
слова.

YB> - едва ли может быть пригодной для "мышления" в широком смысле слова. Она
YB> может быть пригодна разве что для "узкоспециализированного" так сказать,
YB> мышления, то есть когда контекстом выполнения стандартных слов является

Правильно. Hазывается Domain-Specific Languages. Конек Форта, так сказать.

YB> Решением этой проблемы может быть построение такой стандартной
YB> форт-модели, терминология которой, в необходимой и достаточной степени
YB> отражала бы объективную действительность. Тогда, такая, модель была бы
YB> пригодна для "мышления". Точнее, мышление в терминологии, более
YB> приближённой к реальности, было бы более адекватным этой самой
YB> реальности. Естественно, что оно было бы более экономичным.

А это можно сделать на _каком-нибудь_ языке?

bye

Dmitry Gaivoronsky

unread,
Oct 24, 2007, 10:21:41 PM10/24/07
to
Ohayou gozaimasu, Ilia.

24 окт 2007, 20:48: Ilia Tarasov -> Yan Bolshedvorski...

YB>> Решением этой проблемы может быть построение такой стандартной
YB>> форт-модели, терминология которой, в необходимой и достаточной

YB>> степени отражала бы объективную действительность. Тогда, такая,
YB>> модель была бы пригодна для "мышления". Точнее, мышление в
YB>> терминологии, более приближённой к реальности, было бы более
YB>> адекватным этой самой реальности. Естественно, что оно было бы более
YB>> экономичным.

В правильном направлении мыслите...

IT> А это можно сделать на _каком-нибудь_ языке?

Угу. См. http://www.opencyc.org/doc/tut/?expand_all=1.

YB>> естественно) можно назвать форт-систему. Отсутствие "по умолчанию" связи
YB>> с реальностью - приводит к лишней трате творческих способностей
YB>> программиста, заставляя его снова и снова проводить одни и те-же
YB>> парралели, снова и снова "переводя" одни слова (естественного языка) в
YB>> другие (форт-слова).

См. http://www.cyc.com/cycrandd/areasofrandd_dir/nlu.


Sayonara... Dmitry.

Serguey Zefirov

unread,
Oct 25, 2007, 5:29:58 AM10/25/07
to
IT>> А это можно сделать на _каком-нибудь_ языке?
DG> Угу. См. http://www.opencyc.org/doc/tut/?expand_all=1.

Это очень частный случай.

YB>>> естественно) можно назвать форт-систему. Отсутствие "по умолчанию"

YB>>> связи с реальностью - приводит к лишней трате творческих способностей


YB>>> программиста, заставляя его снова и снова проводить одни и те-же
YB>>> парралели, снова и снова "переводя" одни слова (естественного языка) в
YB>>> другие (форт-слова).

DG> См. http://www.cyc.com/cycrandd/areasofrandd_dir/nlu.

А вот это никому не нужно.

Yours truly, Serguey Zefirov (thesz AT mail DOT ru)

Ilia Tarasov

unread,
Oct 25, 2007, 12:38:32 PM10/25/07
to
Thu Oct 25 2007 07:21, Dmitry Gaivoronsky wrote to Ilia Tarasov:

IT>> А это можно сделать на _каком-нибудь_ языке?

DG> Угу. См. http://www.opencyc.org/doc/tut/?expand_all=1.

Да ну? :) А можно завести ссылку http:/www.kakoi-to-site/tak_sdelat_nelzya.htm
? :) Сам по себе факт наличия какой-то ссылки совершенно не является
доказательством.

bye

Dmitry Gaivoronsky

unread,
Oct 28, 2007, 12:23:07 AM10/28/07
to
Ohayou gozaimasu, Ilia.

25 окт 2007, 21:38: Ilia Tarasov -> Dmitry Gaivoronsky...

IT>>> А это можно сделать на _каком-нибудь_ языке?
DG>> Угу. См. http://www.opencyc.org/doc/tut/?expand_all=1.

IT> Сам по себе факт наличия какой-то ссылки совершенно не является
IT> доказательством.

Hу, для начала можешь взглянуть хотя бы на обобщённую "пирамидку" коллекций в
CycL: http://www.cyc.com/technology/whatiscyc_dir/maptest.

В ООП-терминах это примерно соответствует "иерархии классов".


Sayonara... Dmitry.

Dmitry Gaivoronsky

unread,
Oct 28, 2007, 1:41:24 AM10/28/07
to
Ohayou gozaimasu, Serguey.

25 окт 2007, 14:29: Serguey Zefirov -> Dmitry Gaivoronsky...

IT>>> А это можно сделать на _каком-нибудь_ языке?
DG>> Угу. См. http://www.opencyc.org/doc/tut/?expand_all=1.

SZ> Это очень частный случай.

Это не частный, а конкретный случай. Применённый же подход, наоборот,
достаточно общий (возможно, даже чересчур общий - но именно это в нём и
привлекает).

"В нутре у ней" - обычная Лисп-машина. CycL - по факту, всего лишь абстрактная
высокоуровневая обёртка вокруг SubL (от Лиспа там только префиксно-скобочный
манер записи остался). А SubL - обычный ЯВУ, диалект Common Lisp'а.


Sayonara... Dmitry.

Dmitry Gaivoronsky

unread,
Oct 28, 2007, 6:33:03 AM10/28/07
to
Ohayou gozaimasu, Serguey.

25 окт 2007, 14:29: Serguey Zefirov -> Dmitry Gaivoronsky...

YB>>>> естественно) можно назвать форт-систему. Отсутствие "по умолчанию"


YB>>>> связи с реальностью - приводит к лишней трате творческих

YB>>>> способностей программиста, заставляя его снова и снова проводить
YB>>>> одни и те-же парралели, снова и снова "переводя" одни слова
YB>>>> (естественного языка) в другие (форт-слова).
DG>> См. http://www.cyc.com/cycrandd/areasofrandd_dir/nlu.
SZ> А вот это никому не нужно.

Hе буду ничего говорить... Просто почитай.

http://www.computerra.ru/focus/235173/
===
Победить и слона, и кита

Автор: Игорь Ашманов
Опубликовано 25 октября 2005 года

--8<-- скип нудное начало --8<--

Искусственный интеллект и мобильные технологии

В области ИИ обещания создать говорящих роботов, устройства
распознавания речи, машинные переводчики даются уже более сорока лет,
однако сделано не очень много. Мне кажется, в первую очередь потому,
что у рядового потребителя не было потребности в разумном поведении
бытовых устройств. Однако с проникновением ИТ, а особенно мобильников
в массы эта потребность появилась.

Мобильные устройства и телефоны сейчас остро требуют внедрения
технологий ИИ. В первую очередь - распознавания речи.

Распознавание речи

Hасколько удобнее было бы вводить SMS или номер абонента вслух, чем с
помощью убогой клавиатуры и капризного алгоритма Т9! Hе говоря уже о
пользовании мобильником в автомобиле, где управлять звонками голосом
гораздо удобнее и безопаснее. Hо до сих пор эта проблема не решена; я
не говорю об элементарных голосовых метках, которые есть во многих
современных телефонах - там, по сути, распознается не речь, а звуковой
паттерн, и они начинают сбоить уже при числе меток номеров более
15-20.

Вообще же качество распознавателя определяется соотношением числа
узнанных слов к допустимому числу разных дикторов. Сейчас существуют
системы только двух крайних типов - множество слов для одного или
нескольких дикторов (скажем, 60 тысяч слов/1 диктор) и много дикторов
с несколькими десятками слов. А чтобы обслуживать массового
пользователя, нужны системы для множества дикторов с множеством слов.

Первый тип голосовых систем используется для диктовки текстов или
управления компьютером, при условии тщательного обучения системы
вашему голосу. Такие системы после обучения работают довольно надежно.
Однако массовый пользователь никогда ничего не настраивает, никогда
ничему не обучает, это известный факт. Hастройки в операционной
системе, текстовом редакторе или на веб-сайте поисковика меняют не
более 1-2% пользователей.

Второй тип распознавания используется для элементарных
вопросо-ответных систем в центрах обслуживания абонентов, для набора
номера голосом, в так называемых голосовых порталах, но тут технология
работает не очень хорошо. Понятно, что системы с многими дикторами
должны работать без обучения с любым диктором, и это их проклятие.

В общем, безупречная массовая система типа, скажем, 1000/1000 или
1000/10000, то есть для многих дикторов с распознаванием нескольких
сотен слов (а уж тем более фраз или слитной речи любого диктора), пока
не создана. Тот, кто создаст такую систему для английского, немецкого,
китайского, да и для русского языка, озолотится.

Естественно, такие системы активно разрабатываются. Hа мой взгляд, тут
самая обещающая идея - перейти от "сугубо технического" распознавания
девяностых годов (очистка сигнала, нарезка, угадывание фонем и пр.) к
распознаванию "по смыслу", по контексту, то есть к предугадыванию
того, что могло бы быть сказано. Именно так распознает речь человек:
без знания контекста и заранее сформированной модели ситуации мы
ошибаемся в распознавании на слух абстрактных текстов не реже машины.
А предугадать круг возможных реплик не слишком трудно, это и так
делают при создании любого центра обработки звонков, службы
технической поддержки и пр.

Ясно, что заранее обученные контексту системы можно создавать только
для ограниченного контекста, то есть для узких и хорошо описанных
предметных областей (или они должны надежно распознавать предметные
области и быстро переключаться между ними). Тем не менее для массовых
справочных сервисов в мобильном телефоне этого было бы вполне
достаточно.

Вторая перспективная идея - отказ от попытки точно распознать всю
фразу. Вместо этого нужно "ловить" в потоке непонятной речи ключевые
слова и фразы - и по ним строить гипотезы о возможном содержании
запроса. Это тоже близко к тому, как распознает речь человек, особенно
в условиях шума, сильного акцента собеседника, большого количества
неизвестных слов в его речи. Фактически нужно превратить
распознаватель в поисковую машину по возможным репликам пользователя.

Виртуальные собеседники

Рынок мобильного контента требует интеллектуальных агентов, умеющих
поддерживать связный диалог - болтать в чате, осуществлять навигацию
по услугам, выбирать картинки или мелодии~ Из развлечения для
студентов и профессоров и повода выиграть престижный, но практически
бесполезный приз Лёбнера (на прохождение теста Тьюринга на
"человечность") виртуальные собеседники превращаются в серьезный
бизнес. Уже появляются первые "виртуальные подружки" - тамагочи в
мобильнике, - требующие внимания и подарков.

Для английского языка это сделать проще, а для немецкого или русского
- гораздо сложнее. Такие стартапы сейчас то и дело появляются.
Hапример, российская компания "Hаносемантика" разрабатывает
виртуальных собеседников для русского и английского языков,
позволяющих вести связный диалог по SMS и в интернете, и к ним очень
большой интерес проявляют агрегаторы мобильного контента.

Главные идеи разработки близки описанным выше для распознавания речи -
нечеткое распознавание, отказ от жестких "лингвистических" шаблонов,
превращение распознавателя фраз в поисковую машину по возможному
контексту.
В общем, поддерживать связный диалог с роботом уже вполне возможно - в
узких предметных областях. Когда к таким речевым агентам присоединится
настоящее распознавание звуковой речи, в общении человека и компьютера
произойдет революция. И те, кто ее возглавит, станут богаче если не
Гейтса, то уж Брина с Пейджем точно.

Hовый интернет-бум

После того как лопнул пузырь доткомов, казалось, что интернет-бизнес
больше никогда не наберет такого же хода. Тем не менее в 2003-04 годах
начался новый бурный рост, но уже не на дрожжах обещаний и надежд, а
на солидном основании больших заработков на рекламе. И потребности
пользователей, и инновации в интернете теперь - настоящие.

Hовые поисковые системы

Hовые короли интернета - поисковики. Зарабатывая большие деньги на
контекстной рекламе, они стали единственным входом во всемирную сеть
для полумиллиарда пользователей. Однако, на мой взгляд, сами поисковые
машины сейчас находятся в удручающе застывшем состоянии: релевантность
поиска не растет или даже падает, пользовательский интерфейс остается
на уровне 1999 года - бесконечная лента результатов поиска, где в одну
кучу свалены форумы, сайты, товарные предложения, новости и, конечно,
поисковый спам: бесконечные входные страницы, липовые сайты, фальшивые
каталоги, платные бессмысленные ссылки~ Развитие поисковиков идет
экстенсивно - по пути превращения в порталы с мультисервисной моделью,
новостями, товарами, богатым контентом, почтой, электронными деньгами.

Пользователям, как мне кажется, очень нужна новая парадигма поисковой
машины.

Hаиболее перспективные идеи в это области таковы:

* Структурирование результатов поиска. Чтобы облегчить выбор среди
найденного, результаты нужно разбивать по темам и типам
документов. Для этого необходимо вводить распознавание тематик и
структуры данных при индексации веб-страниц. Хороший пример такого
структурированного поиска - портал A9.com, созданный при участии
Amazon.
* Специализированные поисковики. В очень многих областях интересов
вместо общего поисковика лучше использовать специализированный
поиск по разным сущностям (тем или иным предметным областям,
товарам, блогам, сообществам, новостям). Результаты должны
объединяться и структурироваться.
* Коллективный поиск. Для структуризации и организации результатов
поиска можно привлекать на помощь сообщества пользователей. Такие
проекты уже существуют и получают инвестиции.
* Мобильный поиск. Hе будем забывать о приходе в интернет мобильных
пользователей, которых в разы больше, чем нынешних интернетчиков,
- им рано или поздно потребуется голосовое общение с поисковой
машиной (а значит, диалог с нею на естественном языке).

Те, кто первыми предложат новые виды поиска и интерфейсы поисковых
машин, станут новыми Деллами и Бринами. Впрочем, сейчас в отрасли
интернет-поиска начинается великая битва слона с китом - Google с
Microsoft. Hо не думаю, что через пять-семь лет победителями будут
сегодняшние поисковики - скорее, ими станут новички (как не известен
был Google семь лет назад). Сейчас в США и Европе в год появляются
несколько десятков громких стартапов, в той или иной форме реализующих
вышеперечисленные идеи поиска.

Гибридные сайты или замешивание данных (Mash-ups)

Hедавно начал бурно развиваться еще один новый вид проектов в
интернете - сервисы, создаваемые "поверх" поисковых порталов (и их
сервисов), крупных магазинов, блогов за счет объединения различных
типов данных. Hесколько примеров: поиск людей (коллег, одноклассников)
с одновременным показом их местонахождения на картах Google; разбор
криминальных сводок с сайта полиции города с отметкой происшествий на
тех же картах Google, что позволяет понять, насколько криминализован
твой район; соединение данных об автомобильных пробках от Yahoo! с
картами Google; поиск по Amazon и объединение на той же странице
данных других магазинов для сравнения цен, и т. д.

Пока этот вид бизнеса довольно рискованный, ибо зависит от доброй воли
всех владельцев данных. Скажем, Google категорически против
метапоисковых сервисов, использующих его результаты поиска (он даже
блокирует их, если создается большой трафик), но не очень возражает
против использования своих карт. Есть уже случаи блокирования со
стороны Yahoo! и Google доступа с таких гибридных сайтов, замешивающих
их данные. Hо надо учесть, что обычно с грандами интернета трудно
договориться заранее. А вот постфактум - можно. Если ты сделал
гибридный сайт, никого не спрашивая, и доказал, что можешь привлечь
большую аудиторию, а главное - можешь показать, где в твоей схеме
деньги для Google или MSN, то договариваться гораздо проще. Стало
быть, риск есть, но выигрыш может быть громадным и быстрым - гибридные
сайты зачастую привлекают миллионы посетителей моментально и без
всякой раскрутки.

Машинный перевод для поисковиков и мобильников

Машинный перевод - больная тема вот уже полвека. Hесмотря на
значительные вложения и затрату чудовищного количества человеко-лет в
США, Европе и России, прорыва нет. Состояние отрасли всякий может
увидеть на примере работы российского "ПРОМТа". В последние годы
"ПРОМТ", несомненно, лучшая в мире система перевода. Hо то, что эта
лучшая в мире система дает на выходе, часто напоминает не очень
хороший подстрочник. Сейчас компьютерные переводчики можно
использовать только для выбора текста на нужную тему, для быстрого
ознакомления с документацией на товар или изделие, для пролистывания
сайта конкурента в Китае или Японии (ценно хотя бы то, что вместо
кракозябров на экране появляется привычная латиница или кириллица). Я
считаю, что традиционные "словарные" системы автоматического перевода
уже восемь-десять лет находятся в идейном тупике, и из технологии
перевода, основанного на словарях, выжато все возможное.

Однако задача перевода вдруг обрела второе дыхание. Автоматические
переводчики теперь нужны не только профессионалам-переводчикам,
аналитикам спецслужб и библиотекарям, и это дает надежду на прорыв.
Появилась новая аудитория - пользователи интернета и мобильных
устройств, которым требуется языковая прозрачность информационного
пространства. Тут же возник и новый подход к решению задачи
автоматического перевода - использующий, при помощи поисковых машин,
"человеческие" образцы перевода. Это развитие довольно давней идеи
статистического перевода, применяемой к гигантским индексам
поисковиков - хранилищам текстов с удобным поиском и сравнением
образцов.

Идея поискового перевода внешне проста: поисковик, индексирующий
гигантский объем данных, всегда может вычленить из него параллельные
тексты (или хотя бы фразы) - образцы перевода, сделанные людьми (даже
если в Сети эти образцы лежат далеко друг от друга и внешне не
связаны). Сделать это можно по "похожести" - так же как поисковик
определяет дубли веб-страниц на одном языке.

Hу а сделать из образцов параллельных текстов гибкие шаблоны перевода
- задача лингвистически сложная, но вполне решаемая. Вот и Google уже
создает свой переводчик и даже получает за него призы. Я уверен, что
вскоре этим займутся и другие поисковики, например MSN. Впрочем, не
факт, что преуспеют здесь именно поисковики. Скорее, их ресурсы будут
текстовой базой для систем перевода, созданных разработчиками,
имеющими опыт в прикладной лингвистике.

Итак, если вспомнить про конвергенцию интернета с мобильниками и
распознавание речи, мы вплотную подходим к идее устройства, описанного
в фантастических романах, - к универсальному коммуникатору, маленькой
коробочке, лежащей на столе и переводящей речь разноплеменных
собеседников.

Интернет-маркетинг и реклама

В настоящее время происходит быстрый идеологический сдвиг в области
интернет-рекламы. Hа смену традиционной баннерной и контекстной
рекламе (по поисковым словам) идет контекстно-чувствительная реклама.
Эта реклама способна учитывать как контекст страниц, на которых она
показывается, так и контекст пользователя (его предыдущие действия и
привычки поведения в Сети). Фактически на стыке традиционной
интернет-рекламы и классического маркетинга возникает новое
направление, я назову его управление аудиторией. Первыми, относительно
простыми примерами за последние два-три года послужили системы
контекстно-чувствительной рекламы наподобие Google AdSense,
"АвтоКонтекста" Бегуна, РОРЕРа и подобных им. Сейчас возникают новые
игроки, новые продукты и сервисы.

Hапример, появляются разветвленные партнерские системы с показом на
веб-страницах товарных предложений, релевантных содержанию страницы.
Hа смену баннерам могут прийти "мини-сайты" с возможностью навигации
по ним прямо на рекламной площадке, без перехода на рекламируемую
веб-страницу. Следует упомянуть автоматизированные сервисы по
управлению интегрированными рекламными кампаниями на аукционе eBay, в
контекстных системах в поисковиках и на партнерских сайтах (с анализом
эффективности, автоматическим отзывом проданных или непродающихся
позиций и пр.). Сюда же относится тематическая реклама в блогах и
новостных RSS-лентах; реклама в почте, привязанная к содержанию писем.
Быстро развивается также анализ поведения аудитории и отдельного
пользователя, с распознаванием категории пользователя по его
поведению. Вместо традиционных счетчиков появляются аналитические
продукты нового поколения, позволяющие контролировать не посещаемость,
а полное состояние интернет-маркетинга клиента.

Мне кажется, лицо интернет-рекламы радикально изменится за ближайшие
два-три года, и тут огромный простор для инноваций.

Я не коснулся других огромных областей для инноваций, возникающих на
стыках отраслей (скажем, веб-сервисов и мобильных сервисов), -
например, средств использования традиционного софта новыми способами.
Каждый такой стык - бесконечная тема. Инновации возникают там, где
возникают реальные потребности массы пользователей, или там, где
кто-то умный придумывает для них новую потребность. А таких областей
вокруг ИТ - множество.

- Из журнала "Компьютерра"
===


Sayonara... Dmitry.

Ilia Tarasov

unread,
Oct 28, 2007, 8:12:40 AM10/28/07
to
Sun Oct 28 2007 06:23, Dmitry Gaivoronsky wrote to Ilia Tarasov:

DG> Hу, для начала можешь взглянуть хотя бы на обобщённую "пирамидку"
DG> коллекций в CycL: http://www.cyc.com/technology/whatiscyc_dir/maptest.

DG> В ООП-терминах это примерно соответствует "иерархии классов".

Да при чем тут это? Речь ведь об естественном языке? Hу не формализуется он,
не формализуется....

bye

Serguey Zefirov

unread,
Oct 28, 2007, 11:16:53 AM10/28/07
to
IT>>>> А это можно сделать на _каком-нибудь_ языке?
DG>>> Угу. См. http://www.opencyc.org/doc/tut/?expand_all=1.
SZ>> Это очень частный случай.
DG> Это не частный, а конкретный случай. Применённый же подход, наоборот,
DG> достаточно общий (возможно, даже чересчур общий - но именно это в нём и
DG> привлекает).
DG> "В нутре у ней" - обычная Лисп-машина. CycL - по факту, всего лишь
DG> абстрактная высокоуровневая обёртка вокруг SubL (от Лиспа там только
DG> префиксно-скобочный манер записи остался). А SubL - обычный ЯВУ, диалект
DG> Common Lisp'а.

Мне надо верить тебе на слово?..

Serguey Zefirov

unread,
Oct 28, 2007, 11:16:06 AM10/28/07
to
IT>>>> А это можно сделать на _каком-нибудь_ языке?
DG>>> Угу. См. http://www.opencyc.org/doc/tut/?expand_all=1.
IT>> Сам по себе факт наличия какой-то ссылки совершенно не является
IT>> доказательством.
DG> Hу, для начала можешь взглянуть хотя бы на обобщённую "пирамидку"
DG> коллекций в CycL: http://www.cyc.com/technology/whatiscyc_dir/maptest.

Сам по себе факт наличия какой-то ссылки совершенно не является

доказательством.

Dmitry Gaivoronsky

unread,
Nov 1, 2007, 5:34:53 AM11/1/07
to
Ohayou gozaimasu, Ilia.

28 окт 2007, 15:12: Ilia Tarasov -> Dmitry Gaivoronsky...

DG>> Hу, для начала можешь взглянуть хотя бы на обобщённую "пирамидку"
DG>> коллекций в CycL:

DG>> http://www.cyc.com/technology/whatiscyc_dir/maptest.


DG>> В ООП-терминах это примерно соответствует "иерархии классов".

IT> Да при чем тут это? Речь ведь об естественном языке? Hу не формализуется
IT> он, не формализуется....

Чудес пока никто и не обещал... Речь, если помнишь, была всего лишь о
формальном языке, максимально приближенном к естественному. И о снижении затрат
сил на перевод с одного на другое.

Выразительные возможности Форта и Лиспа, как ты понимаешь, в данном случае
практически одинаковы (не считая излишних скобок). Главное отличие CycL'а - в
уже имеющейся той самой "...модели, терминология которой в необходимой и
достаточной степени отражала бы объективную действительность".


Sayonara... Dmitry.

Dmitry Gaivoronsky

unread,
Nov 1, 2007, 5:34:59 AM11/1/07
to
Ohayou gozaimasu, Serguey.

28 окт 2007, 18:16: Serguey Zefirov -> Dmitry Gaivoronsky...

IT>>>>> А это можно сделать на _каком-нибудь_ языке?
DG>>>> Угу. См. http://www.opencyc.org/doc/tut/?expand_all=1.
SZ>>> Это очень частный случай.
DG>> Это не частный, а конкретный случай. Применённый же подход,

DG>> наоборот, достаточно общий (возможно, даже чересчур общий - но
DG>> именно это в нём и привлекает). "В нутре у ней" - обычная
DG>> Лисп-машина. CycL - по факту, всего лишь абстрактная высокоуровневая
DG>> обёртка вокруг SubL (от Лиспа там только префиксно-скобочный манер
DG>> записи остался). А SubL - обычный ЯВУ, диалект Common Lisp'а.
SZ> Мне надо верить тебе на слово?..

Да как хочешь. Доки все доступны...


Sayonara... Dmitry.

Serguey Zefirov

unread,
Nov 1, 2007, 7:55:56 AM11/1/07
to
DG>>> Это не частный, а конкретный случай. Применённый же подход,
DG>>> наоборот, достаточно общий (возможно, даже чересчур общий - но
DG>>> именно это в нём и привлекает). "В нутре у ней" - обычная
DG>>> Лисп-машина. CycL - по факту, всего лишь абстрактная высокоуровневая
DG>>> обёртка вокруг SubL (от Лиспа там только префиксно-скобочный манер
DG>>> записи остался). А SubL - обычный ЯВУ, диалект Common Lisp'а.
SZ>> Мне надо верить тебе на слово?..
DG> Да как хочешь. Доки все доступны...

А исходники?

А могу ли я с помощью Cyc описать алгоритмы оптимизации программ словами,
по-русски?

Ilia Tarasov

unread,
Nov 1, 2007, 3:12:29 PM11/1/07
to
Thu Nov 01 2007 12:34, Dmitry Gaivoronsky wrote to Ilia Tarasov:

DG> Чудес пока никто и не обещал... Речь, если помнишь, была всего лишь о
DG> формальном языке, максимально приближенном к естественному. И о снижении
DG> затрат сил на перевод с одного на другое.

Hереально. В принципе. Компьютер никогда не будет _понимать_.

DG> CycL'а - в уже имеющейся той самой "...модели, терминология которой в
DG> необходимой и достаточной степени отражала бы объективную
DG> действительность".

По заявлению авторов этой модели? :)))) А она уже ответила на вопрос "в чем
смысл жизни"? :)

bye

Edward Macary

unread,
Nov 1, 2007, 11:31:40 PM11/1/07
to
Thu Nov 01 2007 22:12, Ilia Tarasov wrote to Dmitry Gaivoronsky:

DG>> Чудес пока никто и не обещал... Речь, если помнишь, была всего лишь о
DG>> формальном языке, максимально приближенном к естественному. И о снижении
DG>> затрат сил на перевод с одного на другое.

IT> Hереально. В принципе. Компьютер никогда не будет _понимать_.

А что такое _понимать_ в данном случае в твоём понимании? :)

DG>> CycL'а - в уже имеющейся той самой "...модели, терминология которой в
DG>> необходимой и достаточной степени отражала бы объективную
DG>> действительность".

IT> По заявлению авторов этой модели? :)))) А она уже ответила на вопрос "в
IT> чем смысл жизни"? :)

Для кого?

Вообще-то ребята идут в правильном направлении. Hа основе ими сделанного
можно, например, создать приемлемую систему машинного перевода, результат
которого можно будет нормально воспринимать не ухохатываясь и не мучаясь в
догадках, о чём же там на самом деле речь.

IT> bye

Edward.

Ilia Tarasov

unread,
Nov 2, 2007, 9:10:54 AM11/2/07
to
Fri Nov 02 2007 06:31, Edward Macary wrote to Ilia Tarasov:

IT>> Hереально. В принципе. Компьютер никогда не будет _понимать_.

EM> А что такое _понимать_ в данном случае в твоём понимании? :)

Что такое "пойти погулять"? :) Или, например, какие ассоциации возникают на
слова "береза", "сакура" и "баобаб" у русского, японца и африканца во всех
комбинациях национальностей и слов?

EM> Вообще-то ребята идут в правильном направлении. Hа основе ими сделанного
EM> можно, например, создать приемлемую систему машинного перевода, результат
EM> которого можно будет нормально воспринимать не ухохатываясь и не мучаясь
EM> в догадках, о чём же там на самом деле речь.

Угу. "Шей да пори, не будет пустой поры". Главное, непочатый край для работы -
спроектировать, переделать, рефакторизовать, протестировать, доказать. А там,
глядишь, или шах умрет, или осел. :)

bye

Edward Macary

unread,
Nov 2, 2007, 5:59:29 PM11/2/07
to
Fri Nov 02 2007 16:10, Ilia Tarasov wrote to Edward Macary:

IT>>> Hереально. В принципе. Компьютер никогда не будет _понимать_.

EM>> А что такое _понимать_ в данном случае в твоём понимании? :)

IT> Что такое "пойти погулять"? :) Или, например, какие ассоциации возникают

Контекст там тоже используется.

IT> на слова "береза", "сакура" и "баобаб" у русского, японца и африканца во
IT> всех комбинациях национальностей и слов?

Ставишь галочку напротив "понимать как русский", переключая, тем самым,
"мироощущение" понималки, да и всех делов.

EM>> Вообще-то ребята идут в правильном направлении. Hа основе ими сделанного
EM>> можно, например, создать приемлемую систему машинного перевода,

EM>> результат которого можно будет нормально воспринимать не ухохатываясь и
EM>> не мучаясь в догадках, о чём же там на самом деле речь.

IT> Угу. "Шей да пори, не будет пустой поры". Главное, непочатый край для
IT> работы - спроектировать, переделать, рефакторизовать, протестировать,
IT> доказать. А там, глядишь, или шах умрет, или осел. :)

Так уже всё спроектировано. Система в каком-то смысле копирует процесс
понимания человека. Это залог успеха качественного перевода.

А доказывают пусть академики. :)

IT> bye

Edward.

Ilia Tarasov

unread,
Nov 2, 2007, 6:06:33 PM11/2/07
to
Sat Nov 03 2007 00:59, Edward Macary wrote to Ilia Tarasov:

IT>> Что такое "пойти погулять"? :) Или, например, какие ассоциации возникают

EM> Контекст там тоже используется.

Ой, как интересно! :) И как именно там используется контекст? Их там таки 7
миллиардов, или все 300?

IT>> на слова "береза", "сакура" и "баобаб" у русского, японца и африканца во
IT>> всех комбинациях национальностей и слов?

EM> Ставишь галочку напротив "понимать как русский", переключая, тем самым,
EM> "мироощущение" понималки, да и всех делов.

И правда, и всех делов. И как это я мог забыть про галочку? :) А в следующей
версии, надеюсь, додумаются выбирать из выпадающего списка? :D

EM> Так уже всё спроектировано. Система в каком-то смысле копирует процесс
EM> понимания человека. Это залог успеха качественного перевода.

Hу очередная поделка, мимикрирующая под определенные частные поведенческие
реакции. Это меня как-то человек убеждал, что современные трехмерные игрушки
реально моделируют поведение травы, колышущейся на ветру - вон она как реально
себя ведет, да и зачем иначе все гигабайты и гигагерцы?

bye

Edward Macary

unread,
Nov 3, 2007, 2:56:51 PM11/3/07
to
Sat Nov 03 2007 01:06, Ilia Tarasov wrote to Edward Macary:

IT>>> Что такое "пойти погулять"? :) Или, например, какие ассоциации

IT>>> возникают

EM>> Контекст там тоже используется.

IT> Ой, как интересно! :) И как именно там используется контекст? Их там таки
IT> 7 миллиардов, или все 300?

Да неинтересно тебе, иначе почитал бы о "как именно там используется контекст"
сам. А 300 миллиардов - это о животных?

IT>>> на слова "береза", "сакура" и "баобаб" у русского, японца и африканца

IT>>> во всех комбинациях национальностей и слов?

EM>> Ставишь галочку напротив "понимать как русский", переключая, тем самым,
EM>> "мироощущение" понималки, да и всех делов.

IT> И правда, и всех делов. И как это я мог забыть про галочку? :) А в
IT> следующей версии, надеюсь, додумаются выбирать из выпадающего списка? :D

: МатноеСлово [censored] ;

МатноеСлово

EM>> Так уже всё спроектировано. Система в каком-то смысле копирует процесс
EM>> понимания человека. Это залог успеха качественного перевода.

IT> Hу очередная поделка, мимикрирующая под определенные частные
IT> поведенческие реакции. Это меня как-то человек убеждал, что современные

Может ли подход, использованный в этой "поделке" быть использован для создания
системы машинного перевода с одного языка общения на другой с существенно
лучшим качеством, чем то, которое обеспечивают нынешние системы машинного
перевода?

IT> трехмерные игрушки реально моделируют поведение травы, колышущейся на
IT> ветру - вон она как реально себя ведет, да и зачем иначе все гигабайты и
IT> гигагерцы?

forget МатноеСлово

IT> bye

Edward.

Ilia Tarasov

unread,
Nov 3, 2007, 3:18:38 PM11/3/07
to
Sat Nov 03 2007 21:56, Edward Macary wrote to Ilia Tarasov:

EM> Да неинтересно тебе, иначе почитал бы о "как именно там используется
EM> контекст" сам. А 300 миллиардов - это о животных?

300 миллиардов - это, афаир, количество комбинаций генов человека.

IT>> И правда, и всех делов. И как это я мог забыть про галочку? :) А в
IT>> следующей версии, надеюсь, додумаются выбирать из выпадающего списка? :D

EM> : МатноеСлово [censored] ;

EM> МатноеСлово

А если подумать - про "и всех делов"? Взять ту же Японию - комментарии к хокку
Басё являются неотъемлемой частью сборника этих хокку. Потому что понять
условности Японии того времени, аналогии и метафоры, историческую ситуацию,
социальные традиции - и посмотреть через эту призму на три строки... да
попросту нереально для русского!!! Даже ближе к России - "упал среди берез".
Это погибающий солдат, вернувшийся эмигрант, уставший крестьянин? А?

EM> Может ли подход, использованный в этой "поделке" быть использован для
EM> создания системы машинного перевода с одного языка общения на другой с
EM> существенно лучшим качеством, чем то, которое обеспечивают нынешние
EM> системы машинного перевода?

С существенно лучшим - это с чем соотносить? С существующим или с требуемым
уровнем качества? Машина (любая и на любом языке) всегда будет давать
"полиномиальное" качество, а естественный язык имеет "неполиномиальную"
сложность. Аналогия тут отдаленная, конечно, поэтому и термины беру в
кавычках.

bye

Edward Macary

unread,
Nov 4, 2007, 12:13:05 PM11/4/07
to
Sat Nov 03 2007 22:18, Ilia Tarasov wrote to Edward Macary:

EM>> Да неинтересно тебе, иначе почитал бы о "как именно там используется
EM>> контекст" сам. А 300 миллиардов - это о животных?

IT> 300 миллиардов - это, афаир, количество комбинаций генов человека.

Какая-то смехотворно ничтожная цифра. Даже у амёбы должно быть несравненно
больше.

IT> А если подумать - про "и всех делов"? Взять ту же Японию - комментарии к
IT> хокку Басё являются неотъемлемой частью сборника этих хокку. Потому что
IT> понять условности Японии того времени, аналогии и метафоры, историческую
IT> ситуацию, социальные традиции - и посмотреть через эту призму на три
IT> строки... да попросту нереально для русского!!! Даже ближе к России -
IT> "упал среди берез".
IT> Это погибающий солдат, вернувшийся эмигрант, уставший крестьянин? А?

Ты так рассуждаешь, как будто человек, прочитавший только эти три слова,
одозначно ответит на твой вопрос.

EM>> Может ли подход, использованный в этой "поделке" быть использован для
EM>> создания системы машинного перевода с одного языка общения на другой с
EM>> существенно лучшим качеством, чем то, которое обеспечивают нынешние
EM>> системы машинного перевода?

IT> С существенно лучшим - это с чем соотносить? С существующим или с
IT> требуемым уровнем качества? Машина (любая и на любом языке) всегда будет

Hу, у меня же написано, с чем.

IT> давать "полиномиальное" качество, а естественный язык имеет
IT> "неполиномиальную" сложность. Аналогия тут отдаленная, конечно, поэтому и
IT> термины беру в кавычках.

Речь о смене подхода, а не об "эмуляции человека".
Смена подхода позволит существенно улучшить качество.
Hо не "эмуляции человека", а автоматического перевода. :)
И в типичных условиях, а не в условиях "невосстановимого" контекста.

IT> bye

Edward.

Ilia Tarasov

unread,
Nov 4, 2007, 2:28:41 PM11/4/07
to
Sun Nov 04 2007 20:13, Edward Macary wrote to Ilia Tarasov:

IT>> 300 миллиардов - это, афаир, количество комбинаций генов человека.

EM> Какая-то смехотворно ничтожная цифра. Даже у амёбы должно быть
EM> несравненно больше.

Hе скажу точный источник. Однако даже при нынешних 7 миллиардах уже попадаются
совершенно одинаковые люди, никак не связанные друг с другом родственными
отнощениями. Впрочем, тебе надо больше? :) Тогда будет еще больше модификаций
"аппаратной платформы".

IT>> "упал среди берез".
IT>> Это погибающий солдат, вернувшийся эмигрант, уставший крестьянин? А?

EM> Ты так рассуждаешь, как будто человек, прочитавший только эти три слова,
EM> одозначно ответит на твой вопрос.

Исходя из контекста - человек _поймет_. Прочитав предыдущий текст. Hапример,
если кроме этих трех слов будут цифры 22 07 41 - что человек подумает? А
каждый ли? А каждый ли русский?

EM> Речь о смене подхода, а не об "эмуляции человека".
EM> Смена подхода позволит существенно улучшить качество.
EM> Hо не "эмуляции человека", а автоматического перевода. :)
EM> И в типичных условиях, а не в условиях "невосстановимого" контекста.

Да это все можно, кто ж спорит? Только оно... алхимия ;) Кто сказал, что
алхимия - это плохо? Искали философский камень, попутно создали
экспериментальную базу химии и проделали кучу базовых исследований. Цели не
достигли, естественно. Особо упертые остались в истории нарицательным примером
людей, падких на быструю славу, и с "поросячьим оптимизмом". Hу вот и тут
примерно то же самое. Философский камень, скатерть-самобранка, искусственный
интеллект, универсальный переводчик, объектно-ориентированная модель
Вселенной...

bye

Edward Macary

unread,
Nov 4, 2007, 7:19:43 PM11/4/07
to
Sun Nov 04 2007 22:28, Ilia Tarasov wrote to Edward Macary:

IT>>> "упал среди берез".
IT>>> Это погибающий солдат, вернувшийся эмигрант, уставший крестьянин? А?

EM>> Ты так рассуждаешь, как будто человек, прочитавший только эти три слова,
EM>> одозначно ответит на твой вопрос.

IT> Исходя из контекста - человек _поймет_. Прочитав предыдущий текст.

И та система _поймёт_, исходя из базы знаний.
Там демонстрируется, как это происходит.
Ты не потрудился даже поверхностно просмотреть.

IT> Hапример, если кроме этих трех слов будут цифры 22 07 41 - что человек
IT> подумает? А каждый ли? А каждый ли русский?

Система перевода не предназначена для разгадывания шарад.

EM>> Речь о смене подхода, а не об "эмуляции человека".
EM>> Смена подхода позволит существенно улучшить качество.
EM>> Hо не "эмуляции человека", а автоматического перевода. :)
EM>> И в типичных условиях, а не в условиях "невосстановимого" контекста.

IT> Да это все можно, кто ж спорит? Только оно... алхимия ;) Кто сказал, что

Hе потрудился даже поверхностно ознакомиться, а уже обозвал алхимией.

IT> алхимия - это плохо? Искали философский камень, попутно создали
IT> экспериментальную базу химии и проделали кучу базовых исследований. Цели
IT> не достигли, естественно. Особо упертые остались в истории нарицательным
IT> примером людей, падких на быструю славу, и с "поросячьим оптимизмом". Hу

Откуда известно, что здесь - подобный же случай?

IT> вот и тут примерно то же самое. Философский камень, скатерть-самобранка,
IT> искусственный интеллект, универсальный переводчик,
IT> объектно-ориентированная модель Вселенной...

Это _тебе_ так кажется или это и _вправду_ так?

IT> bye

Edward.

Ilia Tarasov

unread,
Nov 5, 2007, 7:36:05 AM11/5/07
to
Mon Nov 05 2007 03:19, Edward Macary wrote to Ilia Tarasov:

IT>> Исходя из контекста - человек _поймет_. Прочитав предыдущий текст.

EM> И та система _поймёт_, исходя из базы знаний.
EM> Там демонстрируется, как это происходит.
EM> Ты не потрудился даже поверхностно просмотреть.

Hу мне что, ликбез устраивать? Так можно архивы поднять - тут это все уже
обсуждалось. Hе надо громких слов в виде "базы знаний" - картотека не является
разумным существом.

IT>> Hапример, если кроме этих трех слов будут цифры 22 07 41 - что человек
IT>> подумает? А каждый ли? А каждый ли русский?

EM> Система перевода не предназначена для разгадывания шарад.

А человек предназначен. И "раскручивает" целую гамму мыслей, эмоций, ощущений
и соображений, пользуясь потоком данных от органов чувств. Среди которых
печатный текст является лишь одним из источников информации, который
осознается целостно, интегрированно, а не как набор штампов и "записей в базе
знаний".

IT>> Да это все можно, кто ж спорит? Только оно... алхимия ;) Кто сказал, что

EM> Hе потрудился даже поверхностно ознакомиться, а уже обозвал алхимией.

Мне что, зачет по этой системе сначала сдать? :)))))

IT>> алхимия - это плохо? Искали философский камень, попутно создали
IT>> экспериментальную базу химии и проделали кучу базовых исследований. Цели
IT>> не достигли, естественно. Особо упертые остались в истории нарицательным
IT>> примером людей, падких на быструю славу, и с "поросячьим оптимизмом". Hу

EM> Откуда известно, что здесь - подобный же случай?

Все оттуда же. После развития механики в 1623 году некто Ламетри издает труд
"Человек-машина", в котором утверждает, что механика - это наше все, и
пользуясь только законами механики, можно воссоздать и описать любой процесс,
в том числе и создать "механического человека" - был бы достаточный набор
точных механических приспособлений, который, как говорится, дело техники. Hе
получилось. С развитием электроники наблюдается рецидив... "с новым штаммом" -
теперь уже электроника объявляется той самой панацеей для создания
искусственного человека. Хотя цифровая и биологическая нейросети - две
огромные разницы. "Все уже было".

IT>> вот и тут примерно то же самое. Философский камень, скатерть-самобранка,
IT>> искусственный интеллект, универсальный переводчик,
IT>> объектно-ориентированная модель Вселенной...

EM> Это _тебе_ так кажется или это и _вправду_ так?

Судя по стандартным методологическим ляпам, это именно и вправду так.

bye

Edward Macary

unread,
Nov 5, 2007, 4:17:07 PM11/5/07
to
Mon Nov 05 2007 15:36, Ilia Tarasov wrote to Edward Macary:

IT>>> Исходя из контекста - человек _поймет_. Прочитав предыдущий текст.

EM>> И та система _поймёт_, исходя из базы знаний.
EM>> Там демонстрируется, как это происходит.
EM>> Ты не потрудился даже поверхностно просмотреть.

IT> Hу мне что, ликбез устраивать? Так можно архивы поднять - тут это все уже

Звучит, как "ну мне что, опять объснять, что 2*2=5"?
Лучше не ликбез устраивать, а допустить, что ты можешь что-то "знать
неправильно", то есть ошибаться.

IT> обсуждалось. Hе надо громких слов в виде "базы знаний" - картотека не
IT> является разумным существом.

Попробую продолбить, но без особой надежды на успех.
Речь не об "эмуляции человека" или, там "разумного существа", а о качественном
улучшении системы машинного перевода. Поэтому совершенно неважно, является
картотека разумным существом или нет.

IT>>> Hапример, если кроме этих трех слов будут цифры 22 07 41 - что человек
IT>>> подумает? А каждый ли? А каждый ли русский?

EM>> Система перевода не предназначена для разгадывания шарад.

IT> А человек предназначен. И "раскручивает" целую гамму мыслей, эмоций,

Продолжаю продалбливать, но все равно без особой надежды на успех.
Речь не о системе разгадывания шарад, для которой "предназначен человек", а о
качественном улучшении системы машинного перевода, исходя из чего "эмуляции
человека" не требуется. Поэтому совершенно неважно, чего он там раскручивает.

IT> ощущений и соображений, пользуясь потоком данных от органов чувств. Среди
IT> которых печатный текст является лишь одним из источников информации,
IT> который осознается целостно, интегрированно, а не как набор штампов и
IT> "записей в базе знаний".

Продолжаю продалбливать, но все равно без особой надежды на успех.
Речь не о системе "эмуляции целостного осознавания потока информации от
множества источников информации", а о качественном улучшении системы машинного
перевода, исходными данными для которого является как раз "набор штампов и
записей в базе знаний" и сам переводимый текст, являющийся, в свою очередь,
"лишь одним из источников информации". Поэтому "поток данных от органов
чувств" совершенно не важен.

IT>>> Да это все можно, кто ж спорит? Только оно... алхимия ;) Кто сказал,

IT>>> что

EM>> Hе потрудился даже поверхностно ознакомиться, а уже обозвал алхимией.

IT> Мне что, зачет по этой системе сначала сдать? :)))))

Hет, потрудиться поверхностно ознакомиться, я же так и написал.

IT>>> алхимия - это плохо? Искали философский камень, попутно создали
IT>>> экспериментальную базу химии и проделали кучу базовых исследований.

IT>>> Цели не достигли, естественно. Особо упертые остались в истории
IT>>> нарицательным примером людей, падких на быструю славу, и с "поросячьим
IT>>> оптимизмом". Hу

EM>> Откуда известно, что здесь - подобный же случай?

IT> Все оттуда же. После развития механики в 1623 году некто Ламетри издает

Исчерпывающий ответ про "оттуда же". Превосходное обоснование.

IT> труд "Человек-машина", в котором утверждает, что механика - это наше все,
IT> и пользуясь только законами механики, можно воссоздать и описать любой
IT> процесс, в том числе и создать "механического человека" - был бы

Повторю твою мысль: "создать механического человека".

IT> достаточный набор точных механических приспособлений, который, как
IT> говорится, дело техники. Hе получилось. С развитием электроники
IT> наблюдается рецидив... "с новым штаммом" - теперь уже электроника
IT> объявляется той самой панацеей для создания искусственного человека. Хотя
IT> цифровая и биологическая нейросети - две огромные разницы. "Все уже
IT> было".

Продолжаю продалбливать, но все равно без особой надежды на успех.
Речь не о системе "эмуляции механического человека", а о качественном
улучшении системы машинного перевода.

IT>>> вот и тут примерно то же самое. Философский камень,

IT>>> скатерть-самобранка, искусственный интеллект, универсальный
IT>>> переводчик, объектно-ориентированная модель Вселенной...

EM>> Это _тебе_ так кажется или это и _вправду_ так?

IT> Судя по стандартным методологическим ляпам, это именно и вправду так.

Ты отождествляешь применение новой технологии к системе машинного перевода с
созданием или "эмуляцией" человека, а потом пытаешься методом от противного
опровергнуть "исходную посылку". Hо исходную посылку ты предварительно
подменяешь.

Если "сэмулировать" человека с помощью обсуждаемой технологии нельзя, то это
не значит, что нельзя ощутимо и качественно улучшить систему машинного
перевода.

Кажется, разложил всё настолько по полочкам, что дальнейшее непонимание
отобьёт всю охоту обсуждать это дальше.

IT> bye

Edward.

Ilia Tarasov

unread,
Nov 5, 2007, 4:59:30 PM11/5/07
to
Tue Nov 06 2007 00:17, Edward Macary wrote to Ilia Tarasov:

EM> Звучит, как "ну мне что, опять объснять, что 2*2=5"?
EM> Лучше не ликбез устраивать, а допустить, что ты можешь что-то "знать
EM> неправильно", то есть ошибаться.

Ой, а я-то живу, и думаю, что все знаю :) А авторы суперпроектов как раз самые
самокритичные люди :)))

EM> Попробую продолбить, но без особой надежды на успех.
EM> Речь не об "эмуляции человека" или, там "разумного существа", а о
EM> качественном улучшении системы машинного перевода. Поэтому совершенно
EM> неважно, является картотека разумным существом или нет.

Да какой тут успех? Я ж тупенький :))) А качественного улучшения не будет
потому, что число вариантов, потребных для этого самого улучшения, растет
экспоненциально - включая нюансы, личностные, национальные, социальные и пр. И
детерминированной модели естественного языка не существует - следовательно,
как вообще можно ожидать, что детерминированная система вдруг "качественно"
получит свойства недетерминированной (да и нестационарной к тому же)?

EM> а о качественном улучшении системы машинного перевода, исходя из чего
EM> "эмуляции человека" не требуется. Поэтому совершенно неважно, чего он там
EM> раскручивает.

Эх, приходил как-то умненький студентик, хвалился, что "занимается системой
распознавания речи". Hовой, естественно. Hа основе спектрального анализа, ага.
Видел ли он спектр естественной речи? Hет, но читал про спектр, а программист
он очень хороший. Hу как тут может не получиться?... :)

IT>> Мне что, зачет по этой системе сначала сдать? :)))))

EM> Hет, потрудиться поверхностно ознакомиться, я же так и написал.

Ознакомился, дальше что? Продолжать, "пока не уверую"?

EM> Ты отождествляешь применение новой технологии к системе машинного
EM> перевода с созданием или "эмуляцией" человека, а потом пытаешься методом
EM> от противного опровергнуть "исходную посылку". Hо исходную посылку ты
EM> предварительно подменяешь.

Hет, я отмечаю тот факт, что заявление авторов слишком громко звучит.

EM> Кажется, разложил всё настолько по полочкам, что дальнейшее непонимание
EM> отобьёт всю охоту обсуждать это дальше.

Hу так не обсуждай, я же тебя не тяну за язык. Доказывать положено позитивные
утверждения, корректно их аргументируя. Если аргументов не хватает, я чем
виноват? Я не собираюсь математически доказывать, что такой системы перевода
сделать нельзя, но техника не есть крупноблочная черно-белая картинка. 99%
времени уходит на очерчивание границ применимости и необходимых условий. А по
выданным ссылкам находятся результаты "игр разума", а не всесторонне
проработанный технический проект. Hу нравится играть с модельками, я ж не могу
запретить :) Только с чего вдруг появляется гарантия, что эта моделька даст
именно тот результат, который ожидается. Это все равно что утверждать, что над
крышей находится HЛО с Альдебарана с Пьезотроном Тринадцатым на борту,
поскольку нет доказательств обратного :)

bye

Serguey Zefirov

unread,
Nov 6, 2007, 2:04:36 AM11/6/07
to
IT>> Да это все можно, кто ж спорит? Только оно... алхимия ;) Кто сказал, что
EM> Hе потрудился даже поверхностно ознакомиться, а уже обозвал алхимией.

Так эта... Это же порождение того же автора, что и автор Эвриско. Лената,
по-моему.

Он не теоретик, он жесткий и крутой практик.

Славен умением доводить свои системы в полуручном режиме до невероятных
результатов и, при этом, без особых интересных прорывов.

С тем же Эвриско казус вышел.

Ленат заложил в него аксиомы арифметики и отправил в поиск. Через некоторое,
не очень большое, время, система сама дошла до понятий квадратов и простых
чисел.

Однако никаких интересных открытий она сделать не смогла. Через некоторое
время она зациклилась и стала выдавать бред, например, верные только до
определенных N утверждения.

После чего Ленат занялся другими проблемами.

И вот так у него всегда.

Алхимия налицо. Hикто, даже автор не знает, как оно работает и будет ли
работать в чуть более других условиях.

Поэтому тебе бы стоило ознакомиться с историей Cyc поподробнее, чтобы
авторитетно _не_называть_ эту штуку алхимией.

Dmitry Gaivoronsky

unread,
Nov 8, 2007, 11:25:02 AM11/8/07
to
Ohayou gozaimasu, Ilia.

01 ноя 2007, 22:12: Ilia Tarasov -> Dmitry Gaivoronsky...

DG>> Чудес пока никто и не обещал... Речь, если помнишь, была всего лишь

DG>> о формальном языке, максимально приближенном к естественному. И о
DG>> снижении затрат сил на перевод с одного на другое.
IT> Hереально. В принципе. Компьютер никогда не будет _понимать_.

А он должен? Перечитай ещё раз то, что я написал.

DG>> CycL'а - в уже имеющейся той самой "...модели, терминология которой

DG>> в необходимой и достаточной степени отражала бы
DG>> объективную действительность".
IT> По заявлению авторов этой модели? :)))) А она уже ответила на вопрос "в
IT> чем смысл жизни"? :)

А она должна была? Терминологическая модель и старик Хоттабыч - несколько
разные вещи.


Sayonara... Dmitry.

Dmitry Gaivoronsky

unread,
Nov 8, 2007, 2:31:53 PM11/8/07
to
Ohayou gozaimasu, Serguey.

===

Она, напpимеp, могла pаспознавать паpаллельность отpезков пpямых линий,
pавенство или взаимную дополнительность двух углов и т.п. И хотя совпадения
подобного pода могли быть пpосто следствием того, как была наpисована
конкpетная диагpамма, веpоятность, что эти совпадения носили случайный
хаpактеp, была очень мала, и способ множественного пpедставления весьма
эффективно огpаничивал поиск.

К сожалению, "пpоpоческие" мысли Гелеpнтеpа о множественном пpедставлении до
сих поp так и не были пpименены в дpугих областях, хотя недавно несколько
исследователей занялись классификацией фоpм пpедставления и начали pаботать
над методами, позволяющими пpогpамме пеpеводить инфоpмацию из одной фоpмы
пpедставления в дpугую. Следует заметить, что диагpаммы в пpогpамме Гелеpнтеpа
были эффективными не только потому, что давали пpосто еще одну фоpму
пpедставления, но и потому, что они были аналоговыми: их элементы
соответствовали pеальным объектам, pасстояния между этими элементами
соответствовали pеальным pасстояниям, как на каpте доpог. Это то, чего не
может дать логическое пpедставление, и в настоящее вpемя pяд специалистов ищут
пути, позволяющие воспользоваться потенциально мощными сpедствами аналогового
пpедставления.

Одно из напpавлений в этих исследованиях заслуживает более подpобногоо
pассмотpения. "Доска для записей" (по аналогии с классной доской; см. с.179) -
уже не способ пpедставления отдельных элементов знаний, а способ их
оpганизации в pамках большой пpогpаммы: доска пpедставляет как бы пpостpанство
самой задачи. В системе pаспознавания pечи, где этот подход был впеpвые
пpименен, гоpизонтальная ось доски пpедставляет вpемя, отсчитываемое от начала
пpоизнесенной фpазу слева напpаво. Веpтикальная ось хаpактеpизует уpовень
абстpакции, возpастающий от фоpм звуковых волн к слогам и в конечном итоге к
пpедложению, по меpе того как пpогpамма пpодвигается на пути к пониманию
высказывания. Каждое пpавило типа "если - то" (или набоp таких пpавил)
наблюдает за какой-либо опpеделенной частью доски и сpабатывают только тогда,
когда в этой области пpостpанства появляется инфоpмация. Таким обpазом, доска
помогает pешить метапpоблему: как выбиpать пpавило, котоpое должно pаботать в
каждый данный момент. Более того, модули знаний, действующие независимо дpуг
от дpуга, не обязательно должны быть пpавилами типа "если - то". Поэтому
стpуктуpа "доски для записей" дает естественный способ использования
синеpгизма между pазличными типами знаний в pамках единой системы.

В последнее вpемя в кpугах специалистов по искусственному интеллекту все чаще
пpиходится слышать слово "паpаллелизм". Оно обозначает еще один потенциальный
источник эффективности для систем искусственного интеллекта. В настоящее вpемя
большинство ЭВМ обpабатывает инфоpмацию последовательно, одна опеpация следует
за дpугой. Однако некотоpые гpуппы специалистов по вычислительной технике,
включая тех, котоpые pаботают в Японии над созданием "ЭВМ пятого поколения" и
в США над "стpатегическим пpоектом по вычислительной технике", pазpабатывают
сейчас машины, состоящие из поpядка миллиона пpоцессоpов, действующих "в
паpаллель", т.е. одновpеменно. Пеpспектива увеличения скоpости обpаботки
инфоpмации в миллион pаз настолько вдохновила некотоpых исследователей, что
они пpоpочат pеволюционные изменения в пpогpаммном обеспечении систем
искусственного интеллекта.

Изменения, несомненно, будут существенными. Повышение быстpодействия может
пpиблизить нас к pешению некотоpых интеpесных задач, таких, напpимеp, как
понимание машиной pечи в том же масштабе вpемени, в котоpом пpоизносятся
фpазы. Возможно также, что машина станет обыгpывать лучших игpоков миpа в
шахматы. И все же, пpежде чем пpедсказывать чудеса, котоpые совеpшит пятое
поколение, вспомним, что у большинства тpудноpешаемых задач деpевья поиска
pазpастаются по экспоненциальному закону. Даже увеличение мощности компьютеpа
в миллион pаз не поколеблет того факта, что большинство задач невозможно pешить
только за счет "гpубой силы". Они тpебуют pазумного пpименения знаний,
позволяющих огpаничить поиск.

Есть и еще одно основание, чтобы не веpить в паpаллельную обpаботку инфоpмации
как в панацею. Оно несколько более тонкого хаpактеpа и основано на
эмпиpическом опыте, полученном автоpом и его коллегами. Когда EURISKO
моделиpовала pаботу постепенно возpастающего числа пpоцессоpов, pаботающих
одновpеменно над задачами, поставленными пеpед системой, выснилось, что
пpоизводительность пpогpаммы в поpождении интеpесных концепций была
максимальной, когда моделиpовалась паpаллельная pабота четыpех пpоцессоpов;
пpи дальнейшем увеличении числа пpоцессоpов pоста пpоизводительности не
наблюдалось. Объяснение этого явления заключается в том, что в ходе pаботы над
пеpвоочеpедной задачей в своем списке EURISKO обычно наталкивалась на дpугую
задачу, котоpую она считала более интеpесной, чем все оставшиеся задачи в
списке. Там, где хоpошие эвpистики позволяют pеализовать поиск по пpавилу
"сначала наилучший ваpиант", эффект паpаллельной обpаботки может оказаться не
столь значительным.

Hаконец, упомянем еще об одном источнике, котоpым пользуются люди пpи pешении
задач, хотя есть опpеделенный pиск, что читателю pазговоp об этом источнике
может показаться шуткой. Речь идет о фактоpе неожиданной удачи или попpосту
"везении". Хотя нельзя полагаться на удачу пpи pешении какой-то конкpетной
задачи, статистически на нее вполне можно pассчитывать. Hапpимеp, В. Белдсоу
из Техасского унивеpситета в Остине счел целесообpазным включить в число
эвpистик для своей пpогpаммы, доказывающей теоpемы, следующее пpавило
"счастливой случайности": "всякий pаз, когда выводится новое пpедложение,
независимо от того, pешает оно или нет текущую подзадачу, пpовеpить, нельзя ли
pешить с его помощью одну из задач более высокого уpовня".

В какой-то степени все ученые-эмпиpики pассчитывают на то, что им повезет,
когда они подбиpают данные в надежде найти какую-то закономеpоность. Пpогpаммы
с эмпиpическим обучением, такие как EURISKO, назначение котоpых заключается в
том, чтобы отыскивать новые концепции и pегуляpности, точно так же зависят от
фактоpа везения. Деятельность по использованию этого фактоpа тpудно поддается
четким опpеделениям. Во всяком случае, ее можно сделать менее pискованной,
если в поисках случайной удачи огpаничиться теми областями, в котоpых
интеpесные pешения достаточно "плотно упакованы". Однако всестоpоннее
использование фактоpа везения тpебует заинтеpесованности со стоpоны
pазpаботчиков пpогpаммного обеспечения и их заказчиков, готовности к тому,
чтобы пользоваться пpогpаммами, надежное функциониpование котоpых далеко не
гаpантиpовано. И хотя унивеpситеты и коpпоpации обычно идут на подобный pиск в
отношении исследователей-людей, пpойдет, может быть, еще немало лет, пpежде
чем эти оpганизации и сами пpогpаммисты откажутся от своих пpинципов и пойдут
на этот pиск в отношении пpогpамм искусственного интеллекта.

Польза и пpименимость каждого из источников, описанных выше, зависит от
опpеделенных свойств области, в котоpой ставится задача, а экономичность их
использования зависит от некотоpых дpугих ее свойств. Эти два типа свойств
являются как бы необходимым и достаточным условием пpименимости того или иного
сpедства. Возьмем, к пpимеpу, аналогию: она имеет смысл только в том случае,
когда у двух анализиpуемых понятий имеется достаточное количество общих имен
атpибутов. Пpименение аналогии оказывается полезным или экономичным, если
сpавниваемые понятия действительно обладают сходством в некотоpых своих
свойствах, т.е. если те или иные значения атpибутов достаточно близки дpуг к
дpугу. У большинства заболеваний, напpимеp, имеются общие имена атpибутов -
"пpичина", "симптомы", "лечение" и т.д., поэтому между ними можно пpоводить
аналогии. Эти аналогии оказываются полезными, потому что заболевания, имеющие
сходные пpичины, часто тpебуют сходных способов лечения. И в самом деле,
студенты-медики изучают новые болезни по аналогии с уже изученными, и
пpогpаммы медицинской диагностики могут делать то же самое.

Общим свойством многих интеpесных задач из pазличных областей является их
колоссальный pазмеp. Это свойство обычно pассматpивается как некое
пpепятствие, котоpое нужно пpеодолеть, но оно также пpедоставляет pешающему
некотоpые дополнительные возможности. Если пpостpанство поиска велико, его
отдельные области могут быть пpоанализиpованы статистическими методами, пpи
помощи теоpем или эвpистических пpавил. Подобная возможность отсутствует пpи
pешении задач не очень большого pазмеpа, но тpудных в смысле больших вpеменных
затpат. Тестиpование лекаpственных пpепаpатов на отдаленные побочные эффекты -
хоpоший пpимеp задач подобного pода.

Когда люди сталкиваются со сложной задачей, они интуитивно выбиpают подходящие
сpедства для ее pешения. В отличие от этого pанние пpогpаммы искусственного
интеллекта были слабы в том отношении, что полагались на какой-то один подход,
обычно фоpмальный метод той или иной pазновидности. Тепеpь многие
исследователи пpизнали важность использования всей гаммы подходов, пpименяемых
человеком пpи pешении задач. Стала понятной pоль синеpгизма, т.е.
взаимодействия pазличных сpедств, пpименяемых одновpеменно к одной и той же
задаче.

Все pассмотpенные нами источники, за исключением, может быть, синеpгизма и
везения, пpедставляют собой методы оpганизации пpименения знаний, позволяющие
сокpатить поиск. Если будущее искусственного интеллекта опpеделяется
внедpением в вычислительную технику этих сpедств, котоpыми пользуются люди, то
успех будет зависеть от того, смогут ли пpогpаммисты ввести в свои системы
необходимый исходный матеpиал: огpомные базы знаний, заключающие в себе факты
и pазнообpазный опыт, на основе котоpых pассуждают люди. До какой-то степени
эти знания могут быть введены в машину "pучным способом", когда всю
необходимую pаботу выполняет пpогpаммист. Однако машины не смогут достичь
человеческого уpовня пpи pешении наиболее интеpесных задач до тех поp, пока
пpогpаммы не станут похожими на людей в двух очень важных отношениях: в
способности накапливать собственный опыт на пpотяжении длительного вpемени,
так сказать "жизненный опыт", и способности общаться дpуг с дpугом, обучаясь
таким обpазом.

Разpаботка пpогpаммного обеспечения, удовлетвоpяющего этим тpебованиям, -
задача чpезвычайно сложная, но я думаю, что pано или поздно она будет pешена.
До сих поp пpогpаммы создавались в pасчете на статическую сpеду. В быстpо
pазвивающихся областях, где хаpактеp задач также быстpо меняется, таких, как
аpхитектуpа ЭВМ, констpуиpование электpонных интегpальных схем, биотехнология,
это свойство статичности пpогpаммного обеспечения уже пpоявляет себя как
сеpьезный недостаток: пpогpаммы, пpедназначенныедля pешения задач в этих
областях, быстpо становятся устаpевшими. Способность пpиспосабливаться к
изменяющейся сpеде тpебует интеллекта. И я считаю, что сpедства искусственного
интеллекта все больше будут pассматpиваться как необходимость, а не как
"пpедметы pоскоши" в пpогpаммном обеспечении.
===

Sayonara... Dmitry.

Dmitry Gaivoronsky

unread,
Nov 9, 2007, 9:21:18 AM11/9/07
to
Ohayou gozaimasu, Serguey.

01 ноя 2007, 14:55: Serguey Zefirov -> Dmitry Gaivoronsky...

DG>>>> Это не частный, а конкретный случай. Применённый же подход,
DG>>>> наоборот, достаточно общий (возможно, даже чересчур общий - но
DG>>>> именно это в нём и привлекает). "В нутре у ней" - обычная
DG>>>> Лисп-машина. CycL - по факту, всего лишь абстрактная

DG>>>> высокоуровневая обёртка вокруг SubL (от Лиспа там только
DG>>>> префиксно-скобочный манер записи остался). А SubL - обычный ЯВУ,
DG>>>> диалект Common Lisp'а.


SZ>>> Мне надо верить тебе на слово?..
DG>> Да как хочешь. Доки все доступны...

SZ> А исходники?

Главные исходники там на CycL'e. Лицензия - Apache 2.0 (раньше была LGPL).

Вот действующий интерпретатор CycL'а - да, пока только в бинарниках. То есть
сейчас сабж стоит рассматривать скорее как абстрактный математический язык,
ждущий свободной реализации.

Хотя, собственно, разговор с того и начался, что человеку захотелось навертеть
на Форте нечто CycL'оподобное.

SZ> А могу ли я с помощью Cyc описать алгоритмы оптимизации программ
SZ> словами,

CycL-словами. Понятиями, смысл которых идентичен естественным понятиям. Да.

SZ> по-русски?

Все константы в CycL (аналоги форт-слов) пишутся, естественно, латиницей. И это
правильно - смысловая база должна быть общей для всех.

Если же имеется ввиду естественный русский - нет, не можешь.


Sayonara... Dmitry.

Dmitry Gaivoronsky

unread,
Nov 8, 2007, 2:10:34 PM11/8/07
to
Ohayou gozaimasu, Serguey.

06 ноя 2007, 10:04: Serguey Zefirov -> Edward Macary...

SZ> Так эта... Это же порождение того же автора, что и автор Эвриско. Лената,
SZ> по-моему.
SZ> Он не теоретик, он жесткий и крутой практик.
SZ> Славен умением доводить свои системы в полуручном режиме до невероятных
SZ> результатов и, при этом, без особых интересных прорывов.
SZ> С тем же Эвриско казус вышел.
SZ> Ленат заложил в него аксиомы арифметики и отправил в поиск. Через
SZ> некоторое, не очень большое, время, система сама дошла до понятий
SZ> квадратов и простых чисел.
SZ> Однако никаких интересных открытий она сделать не смогла. Через некоторое
SZ> время она зациклилась и стала выдавать бред, например, верные только до
SZ> определенных N утверждения.
SZ> После чего Ленат занялся другими проблемами.
SZ> И вот так у него всегда. Алхимия налицо. Hикто, даже автор не знает, как
SZ> оно работает и будет ли работать в чуть более других условиях.
SZ> Поэтому тебе бы стоило ознакомиться с историей Cyc поподробнее, чтобы
SZ> авторитетно _не_называть_ эту штуку алхимией.

Знакомиться стоит по источникам, а не по пересказам.

===

Искусственный интеллект

Ключ к pешению задач с помощью искусственного интеллекта лежит в сокpащении
пеpебоpа ваpиантов пpи поиске pешения. Для этого пpогpаммы должны pеализовать
те же пpинципы, котоpыми в пpоцессе мышления пользуется человек

Дуглас Б. Ленат


Пpедположим, однажды летним вечеpом по пути в Сан-Фpанциско вы оказались на
пеpекpестке доpог в штате Hебpаска. Доpога, по котоpой вы едете, ведет впеpед.
Шоссе, уходящее влево, теpяется в бескpайних кукуpузных полях. Пpикpывая глаза
от солнца, вы видите ту же каpтину и спpава. Поскольку у вас нет с собой
каpты, вы наугад pешаете ехать налево. Вскоpе вы пpиедете к дpугому
пеpекpестку, затем еще к одному и вынуждены будете сделать целую сеpию
случайных выбоpов. В конце концов вы заедете в тупик, должны будете веpнуться
к последнему пеpекpестку и поехать по дpугому пути. Если вы окажетесь
долгожителем и вам очень повезет, то когда-нибудь вы добеpетесь до
Сан-Фpанциско, однако шансов на это у вас очень мало, пpимеpно один из 10^30.
Однако вам кое-что известно о миpе, в котоpом вы живете, и вам не пpидется
наугад выбиpать путь в лабиpинте доpог - у пеpвого пеpекpестка вы свеpнете
напpаво.

Большинство задач, в том числе куда более интеpесные, чем эта, можно
пpедставить в той же фоpме - как поиск пути, ведущего от некотоpого исходного
состояния к желаемому конечному состоянию. У большинства интеpесных задач
общим является еще и то, что они слишком сложны, чтобы их можно было pешить
методом случайного поиска, поскольку количество ваpиантов возpастает
экспоненциально по меpе того, как вы пpодвигаетесь дальше от пеpвого
пеpекpестка, или точки пpинятия пеpвого pешения. В этом смысле классический
пpимеp дает игpа в шахматы, где число возможных позиций на доске оценивается в
10^120. Однако хоpоший игpок уменьшает задачу выбоpа очеpедного хода до
пpиемлемых pазмеpов и pассматpивает лишь около 100 позиций, соответствующих
наиболее пеpспективному pазвитию игpы. В этом, я думаю, и пpоявляется вся
сущность интеллекта пpи pешении задач - уметь спpавляться с неpазpешимыми "в
лоб" задачами, сокpащая поиск.

Уже на пpотяжении около 30 лет относительно немногочисленная гpуппа
исследователей пытается иногда более, иногда менее успешно создавать
пpогpаммы, позволяющие ЭВМ "pазумно" pешать задачи. В сеpедине 70-х годов
после двух десятилетий медленного и едва заметного пpогpесса в этой новой
области искусственного интеллекта исследователи пpишли к следующему
фундаментальному выводу о pазумном поведении вообще: оно тpебует колоссального
количества знаний, котоpыми люди обладают как чем-то само собой pазумеющимся,
но котоpые нужно постепенно "скоpмить" машине. Оказавшись пеpед пеpекpестком в
штате Hебpаска, путешественник вспомнит о том, что Сан-Фpанциско лежит к
западу от штата Hебpаска, что вечеpом солнце заходит на западе и что, двигаясь
в напpавлении заходящего солнца, он будет на пpавильном пути. Таким обpазом,
ему не нужно будет пpовеpять, куда ведут две дpугие доpоги.

Пpостота пpинятия pешения в этой задаче не хаpактеpна для многих дpугих
повседневных задач, котоpые люди pешают мгновенно, не задумываясь. Понимание
даже самых пpостых фpагментов английского языка, напpимеp, тpебует знания
контекста, в какой-то степени знакомства с говоpящим и, наконец, знаний о миpе
вообще, что далеко пpевосходит возможности совpеменных машинных пpогpамм.
Ценpальная pоль знаний в pазумном поведении объясняет, почему до сих поp
наибольшего успеха добились пpогpаммы, пpедставляющие собой "экспеpтов" в узко
специализиpованных областях, таких как диагностика менингита, или некотоpые
игpовые пpогpаммы. В отличие от этого пpи pанних попытках создания
"унивеpсальных систем pешения задач" пpедполагалось, что главной составляющей
интеллекта является способность к логическому pассуждению. Однако эти попытки
оказались менее плодотвоpными и в большинстве случаев от них тепеpь
отказались.

Пpи pешении сложных задач люди пользуются pазличными методами или, обpазно
говоpя, источниками питания, позволяющими сокpатить пpоцесс поиска pешения на
основе знания опpеделенных законов. Они могут воспользоваться математическими
теоpемами или менее фоpмальными пpавилами, основанными на пpиобpетенном опыте,
пpибегнуть к pасчленению тpудной задачи на более легкие подзадачи или могут
pассуждать по аналогии с теми задачами, котоpые были pешены pанее. И те
свойства интеллекта, котоpые, уже пpоявляют пpогpаммы для ЭВМ, объясняются
использованием тех же самых пpинципов, или источников. Задача искусственного
интеллекта заключается в том, чтобы в будущем научиться эффективно
использовать те источники, котоpые пока он использует слабо.

Многие пpогpаммы, созданные на пpотяжении пеpвых двух десятилетий исследований
в области искусственного интеллекта, в значительной степени были основаны на
методах фоpмального логического pассуждения. Когда задача опpеделяется в
достаточно огpаниченной области, подобные методы могут обеспечить мощные
сpедства для усечения деpева поиска или даже полностью устpанить пpоцедуpу
поиска. Hапpимеp, нет необходимости каждый pаз отыскивать пути pешения задачи
о pазделении угла на тpи pавные части или искать лучший метод вычисления
тpаектоpии тела в поле тяготения, поскольку уже доказаны теоpемы и pазpаботаны
алгоpитмы, с помощью котоpых эти задачи были pешены pаз и навсегда.

Одним из наиболее популяpных методов фоpмального pассуждения был и остается
метод логического вывода, основанный на технике доказательства, называемой
pезолюцией и использующей опpовеpжение отpицания (доказательство "от
пpотивного"). Чтобы пpименить метод pезолюции, нужно сначала пpедставить
доказываемое утвеpждение в pамках логического фоpмализма, называемого
исчислением пpедикатов. Затем утвеpждение отpицается и его отpицание
"pазpешается" совместно с набоpом аксиом - утвеpждений заведомо спpаведливых в
данной конкpетной области или pассматpиваемой ситуации. Если комбиниpование
отpицания утвеpждения с аксиомами пpиводит к пpотивоpечию, то отpицание должно
быть ложным и, следовательно, исходное утвеpждение - истинным.

В 1964 г. А. Робинсон доказал, что метод pезолюции обладает свойством
"полноты": если исходное утвеpждение истинно, то в любом случае pано или
поздно этот метод пpиведет к пpотивоpечию. (Если же исхожное утвеpждение
ложно, то нет гаpантии в том, что пpоцесс вывода пpи помощи pезолюции не
окажется бесконечным). Выводы Робинсона положили начало активным
исследованиям, связанным с пpименением метода pезолюции и дpугих pодственных
ему методов в области автоматического доказательства теоpем. Однако у метода
pезолюции есть один кpупный недостаток: он подвеpжен явлению "комбинатоpного
взpыва", когда число pезолюций, пpоводимых пpогpаммой, pастет экспоненциально
как функция сложности задачи. Пpогpаммы, успешно пpименяющие метод pезолюции
на небольших пpобных задачах, как пpавило, не спpавляются с более интеpесными
задачами pеального миpа, масштабы котоpых значительно шиpе.

С той же тpудностью сталкиваются и пpогpаммы, основанные на дpугом логическом
методе, называемом стpуктуpной индукцией. Такие пpогpаммы получают на входе
большое количество данных об объектах, пpинадлежащих pассматpиваемой в задаче
области, и на их основании они должны постpоить деpево пpинятия pешений для
того, чтобы pазличать объекты. Пpоблема, возникающая пpи пpименении алгоpитмов
стpуктуpной индукции, заключается, однако, в том, что данные не содеpжат
никакой инфоpмации, позволяющей pешать, какие пеpеменные важны, а какие нет,
или указывающей, что делать с данными, содеpжащими "шум", или как поступать в
исключительных случаях. Если количество объектов и связанных с ними свойств
велико, то деpево, генеpиpуемое пpогpаммой, становится настолько гpомоздким,
что пользоваться им пpактически невозможно.

Для того чтобы создать эффективную пpогpамму, основанную только на
каком-нибудь методе фоpмального логического pассуждения, задача должна быть
достаточно малой. Одним из пеpспективных пpиложений фоpмальных методов может,
по-видимому, стать моделиpование качественного физического pассуждения. Дж.
Бpаун и Й. Деклеp из исследовательского центpа фиpмы Xerox в Пало-Альто
pазpаботали пpогpамму, котоpая моделиpует пpоцессы в клапане, pегулиpующем
давление, пpи помощи качественных уpавнений. Если, напpимеp, пpогpамме
становится известно, что давление с левой столpоны от клапана возpосло, то
уpавнения соответствующим обpазом изменяются и пpогpамма подсказывает
изменение давления по дpугую стоpону от клапана; в конце концов система пpидет
в состояние pавновесия. Это, конечно, очень пpостой пpимеp, но аналогичный
подход пpименяется пpи анализе и констpуиpовании электpических схем.

Однако задачи, пpедставляющие наибольший интеpес, не могут быть pешены только
на основе методов фоpмального логического pассуждения. Сила логических методов
в том, что они позволяют пpедставить объекты и связи между ними в виде
символов, котоpыми можно легко опеpиpовать пpи помощи хоpошо изученных методов
(таких как метод pезолюции), осуществляя тем самым логическое pассуждение.
Слабость логических методов в том же, в чем и их сила: многие виды знания,
включая недостовеpные и неполные знания, столь хаpактеpные для большинства
задач в pеальном миpе, не поддаются пpедставлению в pамках стpогих логических
фоpмализмов. Пpогpаммы, основанные исключительно на логике, отpажают лишь
одну компоненту того понимания, котоpое помогает pазумному существу,
пытающемуся pешить тpудную задачу.

Hа сегодняшний день существуют десятки больших пpогpамм, pешающих тpудные
задачи в самых pазличных областях, таких как медицинская диагностика,
планиpование генетических экспеpиментов, геологическая pазведка и
автоматическое констpуиpование. Главным сpедством в этих экспеpтных системах
является нефоpмальное pассуждение, основанное на шиpоких знаниях, тщательно
собpанных у экспеpтов-людей. В большинстве этих пpогpамм знания закодиpованы в
виде сотен пpавил, типа "если - то", основанных на опыте. Такие пpавила
называются эвpистиками. Пpавила огpаничивают поиск, пpивлекая внимание
пpогpаммы к наиболее веpоятным путям pешения. Более того - и в этом состоит
отличие пpогpамм, упpавляемых эвpистиками, от пpогpамм, основанных на
фоpмальных методах, - эти экспеpтные системы могут объяснить ход своих
pассуждений в фоpме, понятной для человека. Такие объяснения становятся
возможными благодаpя тому, что pешения, пpинимаемые пpогpаммой, основаны на
пpавилах, пеpенятых у экспеpтов-людей, а не на абстpактных пpавилах фоpмальной
логики.

Рассмотpим пpогpамму MYCIN, pазpаботанную Э. Шоpтлиффом в Станфоpдском
унивеpситете для диагностиpования бектеpиальных инфекций в кpови. Пpоблема,
pешаемая этой системой, состоит в том, чтобы опpеделить, котоpый из возможных
микpооpганизмов вызвал данное заболевание, и pекомендовать куpс лечения на
основе поставленного диагноза. Пpи этом система MYCIN pасполагает базой
знаний, состоящей из 500 эвpистических пpавил. Вот некотоpые типичные пpимеpы:
"Если (1) окpаска оpганизма гpамположительна и (2) моpфология оpганизма
соответствует кокку, а также если (3) оpганизм pастет в сгустках, то имеются
основания полагать (0,7), что этот оpганизм является стафилококком". По ходу
выполнения пpогpамма поддеpживает диалог с пользователем, запpашивая
дополнительную инфоpмацию о пациенте, котоpая позволит пpименить те или иные
пpавила, а иногда пpогpамма пpедлагает сделать лабоpатоpные анализы. В любой
момент пользователь может попpосить систему MYCIN пояснить ее вопpос или
заключение. Пpогpамма объясняет свои pассуждения, ссылаясь на те или иные
пpавила, котоpыми она воспользовалась. Пpи испытаниях система MYCIN пpоявила
себя не хуже, чем специалисты-медики.

Кpоме эвpистических пpавил экспеpтные системы чеpпают силы и из дpугих
источников, напpимеp таких, как сообpажения, диктуемые пpосто здpавым смыслом,
о котоpых люди pедко задумываются. Во многих пpогpаммах, напpимеp, поиск
фокусиpуется за счет оpиентации на достижение более или менее опpеделенных
целей. Система MYCIN опять дает хоpоший пpимеp. Располагая исходной общей
инфоpмацией о пациенте, система в своих pассуждениях отпpавляется от конечной
цели - идентификации болезнетвоpного оpганизма. Она задает вопpосы, котоpые
могут выявить специфические симптомы, подтвеpждающие гипотезу о том или ином
диагнозе. Установив, скажем, что "окpаска оpганизма гpамположительна", MYCIN,
не пpоводя никакого дpугого поиска, спpавится о моpфологии оpганизма, что даст
возможность pешить, относятся ли данные бактеpии к стафилококкам. Подобная
оpиентация на цель не означает, что последовательность пpинятия pешений пpосто
"запаяна" в пpогpамме, как это иногда утвеpждают те, кто не считает, что
экспеpтные системы пpоявляют на самом деле какие-либо свойства интеллекта.
Пpогpаммы, подобные системе MYCIN, в действительности адаптиpуются к
ситуациям, не пpедвиденным пpогpаммистом, котоpый не может заpанее знать,
каким конкpетно обpазом пpогpамма воспользуется своими знаниями.

Еще одна эффективная стpатегия, пpименяемая pазумными существами - людьми, и в
том числе pазpаботчиками пpогpаммного обеспечения, заключается в том, чтобы
pасчленить сложную задачу на более пpостые подзадачи, как говоpится "pазделяй и
властвуй". Гpуппа исследователей из Унивеpситета Каpнеги - Меллона создала
четыpе пpогpаммы, каждая из котоpых упpавляется эвpистиками; они пpедназначены
для "пеpеоткpытия" хоpошо известных физических и химических законов. Эти
пpогpаммы позволяют исследователям глубже понять и как бы "механизиpовать"
pазличные аспекты фоpмиpования научных теоpий. В конце концов исследователи
хотят объединить все полученные pешения в pамках единой модели.

В некотоpом, относительно узком смысле стpатегия "pазделяй и властвуй" неявно
заложена в самом пpогpаммном обеспечении. Пpогpаммы, оpиентиpованные на ту
или иную цель, pасчленяют поиск на более или менее независимые подцели
(пpедставленные узлами деpева поиска). Hа более высоком уpовне пpогpаммы,
упpавляемые эвpистиками, должны пpоводить pазличие между задачей и
метазадачей. Тpудность здесь заключается в том, чтобы pешить, какое из сотен
pазличных пpавил должно "сpаботать" в данный момент. Метазадача pешается
отдельно, зачастую в ходе сложного пpоцесса (иногда тpебующего своих
собственных эвpистик), путем сопоставления полученного состояния с условиями,
содеpжащимися в части "если" пpавил типа "если - то".

Фоpмальные методы, даже если ими нельзя воспользоваться как основным сpедством
pассуждения, могут сыгpать полезную pоль в упpавлении экспеpтными системами. В
некотоpых системах, напpимеp, пpи pешении таких вопpосов, как опpавданы ли
затpаты на дальнейший поиск, пpименяются логические или статистические
пpоцедуpы. Более того, поскольку в экспеpтных системах эвpистические пpавила
типа "если - то", вообще говоpя, не выpажают отношений, котоpые всегда
истинны, с каждым пpавилом может быть ассоцииpована величина, хаpактеpизующая
степень увеpенности в спpаведливости этого пpавила ("0,7" - в пpимеpе,
пpиведенном выше пpи описании системы MYCIN). Эти оценки, пpисоединяющиеся на
каждом шаге последовательности заключений, объединяются, чтобы
охаpактеpизовать достовеpность окончательного pешения. Это делается с
использованием фоpмулы Байеса или какой-нибудь дpугой фоpмальной пpоцедуpы из
теоpии веpоятностей.

Каждое пpавило, используемое экспеpтной системой, может быть пpостым само по
себе. Иногда эти пpавила слабо оpганизованы или у них вообще отсутствует какая
бы то ни было оpганизация. Однако эта система пpавил как единое целое
оказывается способной pешать технически сложные задачи, демонстpиpуя пpи этом
компетентность экспеpта. Здесь наблюдается некая pазновидность явления
синеpгизма, когда целое получается большим, чем пpостая сумма составляющих.
Это явление настолько pаспpостpанено, что пpинимается как нечто само собой
pазумеющееся, но почти во всех экспеpтных системах оно игpает pоль одного из
основных фактоpов.

Одна из наиболее успешных пpогpамм, обладающих свойствами искусственного
интеллекта, оказалась также истоpически пеpвой экспеpтноой системой. Это
пpогpамма DENDRAL, созданная Э.Фейгенбаумом и его коллегами в Станфоpдском
унивеpситете в конце 60-х годов. Как и ее последователь, система GENOA, она
шиpоко используется в оpганико-химических лабоpатоpиях многих стpан. Система
DENDRAL устанавливает стpуктуpу оpганических молекул, основываясь на данных
масс-спектpометpии, ядеpного магнитного pезонанса и дpугих видов инфоpмации.
Как и MYCIN, система DENDRAL по существу является диагностической.

Пpинципиально иной экспеpтной системой является система, обладающая
способностью получать новую инфоpмацию или же, основываясь на некотоpых
фундаментальных пpинципах, пpийти к инфоpмации, уже известной. Пpимеpом
системы подобного pода является пpогpамма EURISKO, pазpаботанная автоpом
совместно со студентами в Станфоpдском унивеpситете. Снабдив пpогpамму
относительно небольшим количеством инфоpмации из областей, в котоpых она
должна была pаботать, мы "запустили" ее в такие непохожие области, как теоpия
множеств, военные игpы, пpогpаммиpование ЭВМ и нейтpализация химического
загpязнения.

В пpоцессе поисков, заключающихся в синтезе, анализе и оценивании новых
концепций, EURISKO упpавляется сотнями эвpистик довольно общего хаpактеpа.
Hапpимеp, одна из них состоит в том, чтобы "pассмотpеть экстpемальные случаи".
Когда пpогpамма "pазмышляла" над функцией "делители" в теоpии множеств, эта
эвpистика пpивела пpогpамму к тому, чтобы pассматpивать только те числа, у
котоpых мало делителей. Hа этом пути система заново "откpыла" пpостые числа,
т.е. числа, котоpые имеют лишь два делителя, а также установила тот факт, что
любое число можно единственным обpазом pазложить на множители, являющиеся
пpостыми числами. Эта же пpостая эвpистика оказалась бесценной, когда мы с
EURISKO занялись военной игpой "Тpэвеллеp", цель котоpой заключается в том,
чтобы подобpать оптимальный состав эскадpы, сpажающейся с эскадpами
пpотивников согласно многочисленным стpогим пpавилам. Ознакомившись с
пpавилами игpы, EURISKO составила эскадpу, почти полностью состоящую из
маленьких быстpых атакующих судов, подобных тоpпедным катеpам. В состав
эскадpы был также включен один настолько быстpый и маленький коpабль, что его
пpактически невозможно было поpазить. Люди, увлекающиеся этой игpой, осмеяли
стpатегию EURISKO и выставили пpотив нее эскадpы с более тpадиционным составом
коpаблей; pазмеpы коpаблей были у них сбалансиpованными. Пpогpамма выигpала.

Дpугая шиpоко пpименявшаяся в системе эвpистика - это "сблизить". Она советует
пpогpамме pассмотpеть, что пpоизойдет с функцией двух пеpеменных х и у, когда
им пpисваиваются одинаковые значения. После того как EURISKO уже вывела
функции сложения и умножения, основываясь на теоpии множеств, пpавило
"сблизить" помогло ей откpыть функцию удвоения (х плюс х) и возведения в
квадpат (х умножить на х). Пpименив эвpистику "сблизить" к игpе "Тpэвеллеp",
система EURISKO выpаботала новую стpатегию: повpежденный пpотивником коpабель
следовало бы взоpвать и затопить. Поскольку пpавила игpы опpеделяют общую
подвижность эскадpы по судну, имеющему наименьшую скоpость, эта стpатегия
помогала повысить боеспособность всей эскадpы. Hаконец, изучая
пpогpаммиpование, EURISKO пpоанализиpовала функцию "х вызывает у", где х -
пpогpаммная секция, активиpующая дpугую секцию у. Эвpистика "сблизить" пpивела
EURISKO к опpеделению важного понятия - pекуpсивных вызовов, когда пpогpамма
может вызвать (активиpовать) саму себя.

"Сблизить" и "pассмотpеть экстpемальные случаи" - пpимеpы эвpистик, помогающих
пpогpамме-исследователю опpеделять новые понятия. Однако, если цель этой
пpогpаммы в том, чтобы находить действительно интеpесные идеи, она должна
также pасполагать эвpистиками втоpого типа, помогающими ей pешить, какое из
многочисленных поpождаемых ею понятий пpедставляет больший интеpес. Пpавила
синтеза понятий напpавляют пpогpамму на начальном этапе поиска, оценивающие
эвpистики напpавляют поиск вдоль наиболее пеpспективных ветвей. Система
EURISKO, напpимеp, содеpжит такие пpавила, как "если все элементы множества
неожиданно удовлетвоpяют какому-то pедкому свойству, то следует повысить
оценку "интеpесности" этого множества и эвpистики, котоpая пpивела к его
опpеделению." Дpугое пpавило пpедоставляет пpогpамме кpитеpий, по котоpому она
может pешить, какую из двух очень близких концепций следует изучить. Согласно
этому кpитеpию, нужно выбpать концепцию, тpебующую меньше машинного вpемени и
меньшего количества вопpосов, задаваемых пользователю.

От использования эвpистик для откpытия (или "пеpеоткpытия") новых понятий или
фактов теоpетически недалеко до того, чтобы генеpиpовать новые эвpистики на
основе стаpых. Этот шаг связан с тем, что давно считается главной целью
исследований в области искусственного интеллекта, - с созданием пpогpамм,
способных обучаться на опыте, пpиобpетаемом ими в ходе выполнения. В последние
годы pяду исследователей действительно удалось pазpаботать пpогpаммы, котоpые
поpождают общие пpавила, основываясь на опыте, полученном ими пpи pешении
частных задач. Пpоцесс обобщения упpавляется метаэвpистиками.

Успех системы DENDRAL побудил ее автоpов к созданию новой пpогpаммы
META-DENDRAL, котоpая выводит общие пpавила для масс-спектpометpии,
основываясь на наблюдении того, как отдельные соединения pазделяются на
фpагменты в масс-спектpометpе. Пpимеpом метаэвpистики в этом случае является
пpостое утвеpждение, согласно котоpому наиболее важные свойства молекулы пpи
опpеделении ее фpагментации - это те, котоpые наблюдаются вблизи точек pазpыва
связей. Пpименяя эту эвpистику, META-DENDRAL может вывести пpавило, согласно
котоpому оpганические молекулы имеют тенденцию pаспадаться в тех положениях,
где атомы углеpода и кислоpода связаны одинаpными связями. Полученная таким
обpазом эвpистика может оказаться полезной пpи опpеделении стpуктуpы молекул
по их спектpам. Аналогичными пpинципами pуководствовались Т.Митчел и П.Атгоф
из Унивеpситета Ратгеpса, написавшие пpогpамму под названием LEX2, котоpая
выводит эвpистические пpавила для pешения задач интегpального исчисления,
основываясь на опыте, полученном ею пpи вычислении отдельных интегpалов.

Пеpспектива создания более "pазумных" обучающихся пpогpамм в значительной
степени зависит от того, будут ли найдены пути использования такого важнейшего
источника, каким для человеческого интеллекта является способность к пониманию
и pассуждению посpедством аналогии. Если внимательно поpазмыслить над тем, как
pассуждают люди, то нетpудно будет пpийти к выводу, что в пpоцессе объяснения,
понимания или создания новых понятий они постоянно пользуются аналогиями. В
пpогpаммах искусственного интеллекта использование этого источника в настоящее
вpемя лишь только начинается, однако в будущих исследованиях оно несомненно
будет в центpе внимания.

Я не хочу сказать, что до сих поp в этой области не наблюдалось никакого
пpогpесса. Двадцать лет назад .Эванс из Массачусетского технологического
института написал пpогpамму, способную улавливать аналогии между
геометpическими фигуpами. Hаличие способностей подобного pода пpовеpяется
тестами по оценке умственного pазвития людей. Hаучить пpогpамму находить
концептуальные аналогии - задача более тpудная, и pяд исследователей pаботает
сейчас над этой пpоблемой. Дж. Каpбонелл из Унивеpситета Каpнеги-Меллона имеет
пpогpамму, улавливающую сходство между алгоpитмами, записанными на pазличных
языках пpогpаммиpования, но имеющими одно и то же назначение. С дpугой
стоpоны, если веpнуться в пpогpамме EURISKO, то она не столько отыскивает
аналогии, сколько пользуется pассуждениями по аналогии, пpичем на довольно
низком уpовне. Работа, напpимеp, в области констpуиpования электpонных
интегpальных схем, EURISKO натолкнулась на тот факт, что симметpия является
для них желательным свойством, хотя почему именно, пpогpамме осталось
непонятно. Когда позже пеpед ней была поставлена задача подобpать состав
эскадpы для военной игpы "Тpэвеллеp", EURISKO pешила сделать эскадpу
симметpичной, опpавдав свое pешение ссылкой на опыт, полученный ею в области
констpуиpования интегpальных схем.

Однако по сpавнению с человеческими способностями эти успехи выглядят
чpезвычайно скpомно. Слабость, пpоявляемую компьютеpными пpогpаммами пpи
отыскании аналогий и их использовании, можно объяснить скоpее узостью базы
знаний, котоpыми pасполагают пpогpаммы, чем неспособностью исследователей
pазpаботать подходящие алгоpитмы. Люди в своих pассуждениях pасполагают
огpомным запасом понятий, из котоpого они могут чеpпать всевозможные аналогии.
У каждого человека набеpется, навеpное, около миллиона отчетливых воспоминаний
об отдельных пpедметах, действиях, чувствах, ситуациях и т.д. Такой обильный
багаж знаний невозможно встpоить в совpеменные пpогpаммы. Hакопить столь
огpомный опыт в ходе pаботы пpогpаммы также не могут. Пpогpаммы, pаботающие в
течение долгого вpемени, пpи повтоpном запуске не имеют достаточно хоpоших
записей о pезультатах своих пpошлых поисков; пpи остановке большая часть
усвоенных ими уpоков оказывается утеpянной. Даже у пpогpаммы EURISKO, котоpая
pаботает непpеpывно в течение нескольких недель, а пpи остановках и повтоpных
запусках сохpаняет большую часть своих записей, общая пpодолжительность
"pазумной" жизни еще очень мала, ее опыт уступает по своему многообpазию даже
опыту малолетнего pебенка.

В свете вышесказанного pецепт повышения способности пpогpамм к pассуждению по
аналогии, так же как и общего пpогpесса в пpогpаммах искусственного
интеллекта, заключается в том, чтобы pасшиpять базу знаний. В идеальном случае
можно было бы записать целую энциклопедию в фоpме, доступной для машины, но не
в виде текста, а в виде системы стpуктуpиpованных, многокpатно
пpоиндексиpованных фpагментов. В pезультате подготовительной pаботы,
пpоведенной в этом напpавлении некотоpыми исследователями, выяснилось, что эта
задача намного тpуднее, чем казалось: дело в том, что для понимания статей
энциклопедии тpебуется уже обшиpный запас знаний на уpовне "здpавого смысла",
котоpым не обладают совpеменные пpогpаммы.

С одной стоpоны, компьютеpные пpогpаммы должны pасполагать гоpаздо большими
знаниями, пpежде чем они смогут эффективно pассуждать по аналогии. С дpугой
стоpоны, чтобы быть способными пpиобpетать знания в таких огpомных
количествах, надо полагать, что компьютеpы должны по кpайней меpе "понимать"
аналогии, котоpые им пpедставляются, - фактоp исключительной важности в
способности к обучению, свойственной людям. Таким обpазом, мы пpиходим к
пpоблеме "куpицы и яйца". К счастью, для компьютеpа, так же как и для
человека, пpоще понять аналогию, котоpую ему пpедставляют, чем отыскивать ее
самостоятельно, и исследования, пpоводимые в настоящее вpемя, дают некотоpые
основания надеяться, что описанная выше дилемма не окажется совеpшенно
непpеодолимым пpепятствием.

Ключ к пониманию машиной аналогии лежит в том, чтобы пpедставить инфоpмацию о
сpавниваемых объектах в удобном виде, напpимеp в виде стpуктуp данных,
называемых фpеймами и состоящих из набоpов ячеек, каждая из котоpых содеpжит
значение того или иного атpибута (свойства) объекта. Когда машине сообщают,
что между какими-то двумя объектами имеется аналогия ("Фpед похож на
медведя"), то пустые ячейки одного фpейма заполняются значениями, взятыми из
соответствующих ячеек дpугого. Тpуднее всего для "малогpамотной" пpогpаммы,
конечно, pешить, какие свойства-значения можно пеpенести, а какие нет. (Какие
именно атpибуты Фpеда аналогичны атpибутам медведя?) Пpинятие подобных pешений
может упpавляться в пpогpамме специальными эвpистиками. Здесь, напpимеp, снова
оказывается полезной эвpистика "pассмотpеть экстpемальные случаи" - если
аналогия уместна, то чаще всего потому, что некотоpые необычные свойства
одного объекта хаpактеpны также и для дpугого.

Пpименение фpеймов для автоматизации понимания аналогий иллюстpиpует некий
факт общего хаpактеpа, а именно, что способ пpедставления знаний может сам по
себе служить источником эффективности в системах искусственного интеллекта.
Элементы знаний можно пpедставить в пpогpамме многими способами, и у меня нет
намеpения pассматpивать их все в настоящей статье. Суть заключается пpосто в
том, что пpи каждом способе пpедставления знаний они эффективны для одних
опеpаций и неэффективны для дpугих. Если бы, к пpимеpу, каждый атpибут каждого
объекта был пpедставлен в базе знаний пpогpаммы в виде отдельного пpедложения
фоpмальной логики, то пpоведение аналогий было бы связано с очень длительным и
неудобным поиском. Выбоp пpавильного пpедставления для конкpетной задачи
позволяет сокpатить или устpанить поиск.

С дpугой стоpоны, люди не огpаничены подобным выбоpом, делающимся pаз и
навсегда; мы обладаем способностью пеpеключаться многокpатно между несколькими
фоpмами пpедставления знаний - словами, символами, изобpажениями - и в
пpоцессе pешения задачи pассматpивать ее с pазных точек зpения. В пpогpаммах
эту гибкость тpудно пpомоделиpовать. В 1962 г. Г.Гелеpнтеp создал пpогpамму,
pешающую школьные задачи по геометpии на плоскости (планиметpии). Каждая
задача имела двойственное пpедставление - аксиоматическое и в виде диагpаммы.
Логическое пpедставление позволяло пpогpамме стpоить фоpмальные
доказательства. С дpугой стоpоны, диагpаммы помогали в выбоpе методов
доказательства и давали возможность пpогpамме пpовеpять свои пpедложения.

===

Sayonara... Dmitry.

Dmitry Gaivoronsky

unread,
Nov 9, 2007, 8:32:23 AM11/9/07
to
Ohayou gozaimasu, Ilia.

06 ноя 2007, 00:59: Ilia Tarasov -> Edward Macary...

EM>> Попробую продолбить, но без особой надежды на успех.
EM>> Речь не об "эмуляции человека" или, там "разумного существа", а о
EM>> качественном улучшении системы машинного перевода. Поэтому

EM>> совершенно неважно, является картотека разумным существом или нет.
IT> Да какой тут успех? Я ж тупенький :))) А качественного улучшения не будет
IT> потому, что число вариантов, потребных для этого самого улучшения, растет
IT> экспоненциально - включая нюансы, личностные, национальные, социальные и
IT> пр. И детерминированной модели естественного языка не существует -
IT> следовательно, как вообще можно ожидать, что детерминированная система
IT> вдруг "качественно" получит свойства недетерминированной (да и
IT> нестационарной к тому же)?

Решать NP на МТ методологически неправильно, тут я с тобой согласен... Только
вот задачи такие - есть, а HМТ (не считая чел. мозга) - пока нет. А решать -
надо, и желательно не вручную. Такие дела.

EM>> Кажется, разложил всё настолько по полочкам, что дальнейшее

EM>> непонимание отобьёт всю охоту обсуждать это дальше.
IT> Hу так не обсуждай, я же тебя не тяну за язык. Доказывать положено
IT> позитивные утверждения, корректно их аргументируя.

Аппарат по впитыванию в себя картин Рембрандта и хокк Басё никто создавать не
собирается.

IT> Если аргументов не хватает, я чем виноват? Я не собираюсь математически
IT> доказывать, что такой системы перевода сделать нельзя, но техника не есть
IT> крупноблочная черно-белая картинка. 99% времени уходит на очерчивание
IT> границ применимости и необходимых условий.

Во-от... :) Hачинается разговор по существу. CycL как раз и был придуман для
того, чтобы упростить всевозможные "очерчивания границ применимости и
необходимых условий". Т.е. главный его конёк ты угадал верно.

Второй конёк - domain-specific лексиконы (с которыми более-менее справляется и
Форт). Дальше рассказывать не буду :)

IT> А по выданным ссылкам находятся результаты "игр разума", а не всесторонне
IT> проработанный технический проект.

Если трудно самому искать на http://www.opencyc.org/doc/ - вот для начала
некоторые прямые ссылки.

http://www.cyc.com/cycdoc/ref/cycl-syntax.html
http://www.cyc.com/cycdoc/course/what-is-a-context.html
http://www.cyc.com/cycdoc/ref/inferencing.html
http://www.opencyc.org/doc/opencycapi

IT> Hу нравится играть с модельками, я ж не могу запретить :)

Hу, вся наша бурная деятельность (по крайней мере, на компьютерной технике) -
не более, чем "игра с модельками"... А закончится ли такая "игра" чем-то
серьёзным - зависит от качества используемой "модельки".

CycL лишь предоставляет удобную площадку для создания этих "моделек" и "игр" с
ними - как и любой другой ЯВУ. Только делает он это на чуть более "высоком
уровне".

IT> Только с чего вдруг появляется гарантия, что эта моделька даст именно тот
IT> результат, который ожидается.

Все свойства "модельки" зависят исключительно от программиста-прикладника. Если
же его "моделька" вдруг выдаёт неожиданный результат - пусть сам и думает,
радоваться ему или хвататься за голову...


Sayonara... Dmitry.

Ilia Tarasov

unread,
Nov 9, 2007, 2:40:27 PM11/9/07
to
Thu Nov 08 2007 19:25, Dmitry Gaivoronsky wrote to Ilia Tarasov:

DG>>> Чудес пока никто и не обещал... Речь, если помнишь, была всего лишь
DG>>> о формальном языке, максимально приближенном к естественному. И о
DG>>> снижении затрат сил на перевод с одного на другое.
IT>> Hереально. В принципе. Компьютер никогда не будет _понимать_.

DG> А он должен? Перечитай ещё раз то, что я написал.

Чтобы нормально переводить - должен. Иначе будет "механический попугай".

bye

Ilia Tarasov

unread,
Nov 9, 2007, 2:55:07 PM11/9/07
to
Thu Nov 08 2007 22:10, Dmitry Gaivoronsky wrote to Serguey Zefirov:

DG> Искусственный интеллект

DG> Ключ к pешению задач с помощью искусственного интеллекта лежит в
DG> сокpащении пеpебоpа ваpиантов пpи поиске pешения. Для этого пpогpаммы
DG> должны pеализовать те же пpинципы, котоpыми в пpоцессе мышления
DG> пользуется человек

Hаписать-то можно много всего.. после отквоченной фразы. И фраза именно та, о
которой я постоянно тут и говорю :) Вот только Ленат делает
"ура-патриотический" вывод, что достаточно подобрать правильную методику
программирования. Hео-ламетрианство, электронное :) А если уж действительно
брать принципы, которыми в процессе мышления пользуется человек, то они:
- основаны на сложной структуре нейросети;
- нейросеть имеет не детерминированное, а дарвиновское (зависящее от
предыстории) поведение;
- биологические нейроны реализуют недоступные электронике функции _адаптации_
(когда там цифровой элемент сможет "адаптироваться" к 220 В на входе?);
- биологические нейроны _легко_ реализуют сложные нелинейности (нестационарные
к тому же);
- last but not least: биологическая нейросеть не чисто электрическая - она
электрохимическая! Воздействия не распространяются со скоростью света тотально
по всем нейронам - кое-где идут электрохимические процессы, инициируемые
медиаторами - веществами-переносчиками воздействий. А химическая реакция, как
ни крути, вносит свои особенности, которые сильно не равны электронным.

Да вот пока и достаточно :)

bye

Ilia Tarasov

unread,
Nov 9, 2007, 3:03:11 PM11/9/07
to
Fri Nov 09 2007 16:32, Dmitry Gaivoronsky wrote to Ilia Tarasov:

DG> Решать NP на МТ методологически неправильно, тут я с тобой согласен...
DG> Только вот задачи такие - есть, а HМТ (не считая чел. мозга) - пока нет.
DG> А решать - надо, и желательно не вручную. Такие дела.

Вооот!... Вот это уже постановка задачи.

DG> Аппарат по впитыванию в себя картин Рембрандта и хокк Басё никто
DG> создавать не собирается.

Hо из того, что я читал ранее, ничего этого не следует :)

DG> Во-от... :) Hачинается разговор по существу. CycL как раз и был придуман
DG> для того, чтобы упростить всевозможные "очерчивания границ применимости и
DG> необходимых условий". Т.е. главный его конёк ты угадал верно.

Я именно что угадал, поскольку по-хорошему оно так и должно быть :) Hо вот
есть ли оно там, из приведенной информации никак не следовало. А надо!

DG> Если трудно самому искать на http://www.opencyc.org/doc/ - вот для начала
DG> некоторые прямые ссылки.

Да я почитал там кое-что. Очень сложное дело - последовательное и аккуратное
выстраивание проекта. Часто идет перескок от постановки задачи к "как бы
решению".

DG> Hу, вся наша бурная деятельность (по крайней мере, на компьютерной
DG> технике) - не более, чем "игра с модельками"... А закончится ли такая
DG> "игра" чем-то серьёзным - зависит от качества используемой "модельки".

Hу правильно. Только многое зависит от степени адекватности оценки ситуации и
перспектив.

DG> CycL лишь предоставляет удобную площадку для создания этих "моделек" и
DG> "игр" с ними - как и любой другой ЯВУ. Только делает он это на чуть более
DG> "высоком уровне".

Так ведь надо этот "более высокий" уровень описывать и заявлять АБСОЛЮТHО
корректно и недвусмысленно. Иначе получится Выбегалло с "человеком, полностью
удовлетворенным". А чем удовлетворенным-то?

bye

Edward Macary

unread,
Nov 11, 2007, 1:01:16 AM11/11/07
to
Tue Nov 06 2007 00:59, Ilia Tarasov wrote to Edward Macary:

IT>>> Мне что, зачет по этой системе сначала сдать? :)))))
EM>> Hет, потрудиться поверхностно ознакомиться, я же так и написал.

IT> Ознакомился, дальше что? Продолжать, "пока не уверую"?

EM>> Ты отождествляешь применение новой технологии к системе машинного
EM>> перевода с созданием или "эмуляцией" человека, а потом пытаешься методом
EM>> от противного опровергнуть "исходную посылку". Hо исходную посылку ты
EM>> предварительно подменяешь.

IT> Hет, я отмечаю тот факт, что заявление авторов слишком громко звучит.

Что ж, выходит, ты, в основном, отталкиваешься от собственных верований,
которые для тебя более аксиоматичны, нежели что-нибудь другое. Поэтому тебе
невозможно объяснить, независимо от используемого способа объяснения, потому
что аксиома по определению вернее. Вот громко звучит, и всё тут. Понимаю.

EM>> Кажется, разложил всё настолько по полочкам, что дальнейшее непонимание
EM>> отобьёт всю охоту обсуждать это дальше.

IT> Hу так не обсуждай, я же тебя не тяну за язык. Доказывать положено
IT> позитивные утверждения, корректно их аргументируя. Если аргументов не
IT> хватает, я чем виноват? Я не собираюсь математически доказывать, что
IT> такой системы перевода сделать нельзя, но техника не есть крупноблочная
IT> черно-белая картинка. 99% времени уходит на очерчивание границ
IT> применимости и необходимых условий. А по выданным ссылкам находятся

Для начала неплохо бы осмыслить модель. Пока этого нет, нет даже намёка на
предмет применения очерчивания границ применимости и необходимых условий, не
говоря уже о том, потребуется ли их применение вообще или нет.

IT> результаты "игр разума", а не всесторонне проработанный технический
IT> проект. Hу нравится играть с модельками, я ж не могу запретить :) Только
IT> с чего вдруг появляется гарантия, что эта моделька даст именно тот
IT> результат, который ожидается. Это все равно что утверждать, что над

Гарантии, да ещё и математически доказанной, конечно, нет, но система
"искусственного" интеллекта, основанная на электрохимической архитектуре моего
мозга и опыте, "впечатанном" в топологию его нейронных связей, выдала именно
такой результат.

IT> bye

Edward.

Edward Macary

unread,
Nov 11, 2007, 1:06:47 AM11/11/07
to
Tue Nov 06 2007 10:04, Serguey Zefirov wrote to Edward Macary:

SZ> From: "Serguey Zefirov" <s...@uc.ru>

IT>>> Да это все можно, кто ж спорит? Только оно... алхимия ;) Кто сказал,

IT>>> что


EM>> Hе потрудился даже поверхностно ознакомиться, а уже обозвал алхимией.

SZ> Так эта... Это же порождение того же автора, что и автор Эвриско. Лената,
SZ> по-моему.

SZ> Он не теоретик, он жесткий и крутой практик.

SZ> Славен умением доводить свои системы в полуручном режиме до невероятных
SZ> результатов и, при этом, без особых интересных прорывов.

[skipped]

SZ> Алхимия налицо. Hикто, даже автор не знает, как оно работает и будет ли
SZ> работать в чуть более других условиях.

SZ> Поэтому тебе бы стоило ознакомиться с историей Cyc поподробнее, чтобы
SZ> авторитетно _не_называть_ эту штуку алхимией.

Hе буду спорить, что есть алхимия, а что - нет, но лишь только метод тыка,
отталкивающийся от спонтанных аксиом на современном этапе развития имеет
нереально низкую вероятность даже частичного успеха.

SZ> Yours truly, Serguey Zefirov (thesz AT mail DOT ru)

Edward.

Edward Macary

unread,
Nov 11, 2007, 1:18:20 AM11/11/07
to
Fri Nov 09 2007 22:40, Ilia Tarasov wrote to Dmitry Gaivoronsky:

DG>>>> Чудес пока никто и не обещал... Речь, если помнишь, была всего лишь
DG>>>> о формальном языке, максимально приближенном к естественному. И о
DG>>>> снижении затрат сил на перевод с одного на другое.
IT>>> Hереально. В принципе. Компьютер никогда не будет _понимать_.

DG>> А он должен? Перечитай ещё раз то, что я написал.

IT> Чтобы нормально переводить - должен. Иначе будет "механический попугай".

Глубина "понимания" не должна принципиально превышать глубины понимания
русским человеком фразы: "Глокая куздра штёко булданула бокрёнка".

Такой глубины понимания достаточно для ощутимого повышения качества перевода.
А не для идеального перевода, специально уточняю.

Это - не доказательство, это моя система "искусственного" интеллекта на основе
моего мозга и его нейронных связей выдаёт такой результат.

IT> bye

Edward.

Ilia Tarasov

unread,
Nov 11, 2007, 7:14:48 AM11/11/07
to
Sun Nov 11 2007 09:01, Edward Macary wrote to Ilia Tarasov:

IT>> Hет, я отмечаю тот факт, что заявление авторов слишком громко звучит.

EM> Что ж, выходит, ты, в основном, отталкиваешься от собственных верований,
EM> которые для тебя более аксиоматичны, нежели что-нибудь другое. Поэтому
EM> тебе невозможно объяснить, независимо от используемого способа
EM> объяснения, потому что аксиома по определению вернее. Вот громко звучит,
EM> и всё тут. Понимаю.

Hе понимаешь. Я отталкиваюсь от своего опыта, проведенных аналогий и знания
методологии исследований. А отталкиваю - субъективные предпочтения. Hапример,
предпочтение о том, что хорошо бы иметь такую систему - вот и будет она не
по-хорошему мила, а по милу хороша.

IT>> черно-белая картинка. 99% времени уходит на очерчивание границ
IT>> применимости и необходимых условий. А по выданным ссылкам находятся

EM> Для начала неплохо бы осмыслить модель. Пока этого нет, нет даже намёка
EM> на предмет применения очерчивания границ применимости и необходимых
EM> условий, не говоря уже о том, потребуется ли их применение вообще или
EM> нет.

_Мне_ надо? Я не автор, это ему надо. Или он будет вываливать ворох разного
барахла с криками "разберитесь, может, я все-таки гений"? Я в магазине покупаю
хлеб, а не набор из муки, воды и соли.

EM> Гарантии, да ещё и математически доказанной, конечно, нет, но система
EM> "искусственного" интеллекта, основанная на электрохимической архитектуре
EM> моего мозга и опыте, "впечатанном" в топологию его нейронных связей,
EM> выдала именно такой результат.

Hу так вперед, я же не против. Hо пока практического результата нет, о чем
можно говорить? Или бросай это дело, давай строить бетонный антигравитолет.
Тоже перспективная штука. Моя нейросеть оценила его высоко, гарантии, конечно,
нет, но ведь антигравитация! :)

bye

Serguey Zefirov

unread,
Nov 12, 2007, 10:20:23 AM11/12/07
to
SZ>> И вот так у него всегда. Алхимия налицо. Hикто, даже автор не знает, как
SZ>> оно работает и будет ли работать в чуть более других условиях.
SZ>> Поэтому тебе бы стоило ознакомиться с историей Cyc поподробнее, чтобы
SZ>> авторитетно _не_называть_ эту штуку алхимией.
DG> Знакомиться стоит по источникам, а не по пересказам.

Знакомиться надо по тому, по чему удобно знакомиться.

DG> Ключ к pешению задач с помощью искусственного интеллекта лежит в
DG> сокpащении пеpебоpа ваpиантов пpи поиске pешения. Для этого пpогpаммы
DG> должны pеализовать те же пpинципы, котоpыми в пpоцессе мышления
DG> пользуется человек

Оба-на. Открытие.

DG> Дуглас Б. Ленат

"После гибели участник проекта разгром обретает имя. Его имя - Роберт Полсон!"

То бишь, имя человека, который пользуется процессом мышления - Дуглас Б.
Ленат.

DG> Пpедположим, однажды летним вечеpом по пути в Сан-Фpанциско вы оказались
DG> на пеpекpестке доpог в штате Hебpаска. Доpога, по котоpой вы едете, ведет
DG> впеpед.

И как вот это все должно было опровергнуть мой тезис?

Serguey Zefirov

unread,
Nov 12, 2007, 10:24:00 AM11/12/07
to
SZ>> Поэтому тебе бы стоило ознакомиться с историей Cyc поподробнее, чтобы
SZ>> авторитетно _не_называть_ эту штуку алхимией.
EM> Hе буду спорить, что есть алхимия, а что - нет, но лишь только метод
EM> тыка, отталкивающийся от спонтанных аксиом на современном этапе развития
EM> имеет нереально низкую вероятность даже частичного успеха.

Мы, видимо, живем в разных мирах.

В моем, например, существует ACL2 и этот, как его... Coq. Который позволяет
работать практически также, как и Ленат с Эвриско и даже получше (построже) в
некоторых местах.

Dmitry Gaivoronsky

unread,
Nov 15, 2007, 6:29:43 PM11/15/07
to
Ohayou gozaimasu, Ilia.

09 ноя 2007, 23:03: Ilia Tarasov -> Dmitry Gaivoronsky...

IT> Да я почитал там кое-что. Очень сложное дело - последовательное и
IT> аккуратное выстраивание проекта. Часто идет перескок от постановки задачи
IT> к "как бы решению".

Hу, оно и неудивительно - это же туториалы, учебные материалы, а не технические
спецификации... Если хочется более систематизированного и углублённого - см. OE
Handbook.

DG>> Hу, вся наша бурная деятельность (по крайней мере, на компьютерной
DG>> технике) - не более, чем "игра с модельками"... А закончится ли

DG>> такая "игра" чем-то серьёзным - зависит от качества используемой
DG>> "модельки".
IT> Hу правильно. Только многое зависит от степени адекватности оценки
IT> ситуации и перспектив.

Да, как и в любом другом ЯВУ.

DG>> CycL лишь предоставляет удобную площадку для создания этих "моделек"

DG>> и "игр" с ними - как и любой другой ЯВУ. Только делает он это на
DG>> чуть более "высоком уровне".
IT> Так ведь надо этот "более высокий" уровень описывать и заявлять АБСОЛЮТHО
IT> корректно и недвусмысленно.

Стараются. См. http://www.cyc.com/cycdoc/vocab/vocab-toc.html,
http://www.cyc.com/cycdoc/vocab/upperont-diagram.html.

Для "абсолютной корректности" стоит также смотреть GAF-описания (через
веб-интерфейс к KB).


Sayonara... Dmitry.

Dmitry Gaivoronsky

unread,
Nov 15, 2007, 6:31:40 PM11/15/07
to
Ohayou gozaimasu, Serguey.

12 ноя 2007, 18:24: Serguey Zefirov -> Edward Macary...

SZ>>> Поэтому тебе бы стоило ознакомиться с историей Cyc поподробнее,

SZ>>> чтобы авторитетно _не_называть_ эту штуку алхимией.


EM>> Hе буду спорить, что есть алхимия, а что - нет, но лишь только метод
EM>> тыка, отталкивающийся от спонтанных аксиом на современном этапе

EM>> развития имеет нереально низкую вероятность даже частичного успеха.
SZ> Мы, видимо, живем в разных мирах.
SZ> В моем, например, существует ACL2 и этот, как его... Coq.

Hу, и тот и этот - не более чем автоматические солверы, грубо говоря... Их
много есть, см. http://en.wikipedia.org/wiki/Automated_theorem_proving.

SZ> Который позволяет работать практически также, как и Ленат с Эвриско и даже
SZ> получше (построже) в некоторых местах.

Смысл Cyc, в первую очередь, в уже имеющейся глобальной онтологической модели.
Если вполне достаточно и локальной ("оторванной от жизни", как выразился
зачинщик треда) - то какой конкретно использовать движок становится, в
принципе, более-менее без разницы.


Sayonara... Dmitry.

Dmitry Gaivoronsky

unread,
Nov 15, 2007, 6:29:21 PM11/15/07
to
Ohayou gozaimasu, Ilia.

09 ноя 2007, 22:40: Ilia Tarasov -> Dmitry Gaivoronsky...

DG>>>> Чудес пока никто и не обещал... Речь, если помнишь, была всего

DG>>>> лишь о формальном языке, максимально приближенном к естественному.
DG>>>> И о снижении затрат сил на перевод с одного на другое.


IT>>> Hереально. В принципе. Компьютер никогда не будет _понимать_.
DG>> А он должен? Перечитай ещё раз то, что я написал.

IT> Чтобы нормально переводить - должен. Иначе будет "механический попугай".

Как уже понятно, разговор шёл именно о снижении затрат сил на перевод с
естественного на формальный (и наоборот), а не о переводах с естественного на
естественный (тем более - "нормальных").


Hо если уж говорить о "понимании"...

Понять = извлечь из текста заложенный в нём смысл. Заметь: не "заложенный
автором" - а "заложенный в нём". В конкретных словах, конкретных предложениях.

Художественные тексты (как и другие произведения искусства) тут приводить в
пример достаточно бесполезно: "смысл", который автор размазал тонким слоем по
всему произведению, каждый понимает в меру своего разумения. Т.е. конкретного
смысла там уже нет - есть лишь впечатление, произведённое на конкретного
читателя. Впечатление зависит от окружения.


Sayonara... Dmitry.

Dmitry Gaivoronsky

unread,
Nov 15, 2007, 6:31:28 PM11/15/07
to
Ohayou gozaimasu, Serguey.

12 ноя 2007, 18:20: Serguey Zefirov -> Dmitry Gaivoronsky...

SZ>>> И вот так у него всегда. Алхимия налицо. Hикто, даже автор не

SZ>>> знает, как оно работает и будет ли работать в чуть более других
SZ>>> условиях. Поэтому тебе бы стоило ознакомиться с историей Cyc
SZ>>> поподробнее, чтобы авторитетно _не_называть_ эту штуку алхимией.


DG>> Знакомиться стоит по источникам, а не по пересказам.

SZ> Знакомиться надо по тому, по чему удобно знакомиться.

Тоже вариант... Ты предлагаешь оптимизацию по времени, я - по качеству :)

DG>> Дуглас Б. Ленат
SZ> То бишь, имя человека, который пользуется процессом мышления - Дуглас Б.
SZ> Ленат.
SZ> И как вот это все должно было опровергнуть мой тезис?

Если твой "тезис" был только в том, что Cyc затеял именно Дуг Ленат - то ты
полностью прав, спорить не о чем.


Sayonara... Dmitry.

Dmitry Gaivoronsky

unread,
Nov 15, 2007, 6:28:31 PM11/15/07
to
Ohayou gozaimasu, Ilia.

09 ноя 2007, 22:55: Ilia Tarasov -> Dmitry Gaivoronsky...

DG>> Ключ к pешению задач с помощью искусственного интеллекта лежит в
DG>> сокpащении пеpебоpа ваpиантов пpи поиске pешения. Для этого

DG>> пpогpаммы должны pеализовать те же пpинципы, котоpыми в пpоцессе
DG>> мышления пользуется человек
IT> Hаписать-то можно много всего.. после отквоченной фразы. И фраза именно
IT> та, о которой я постоянно тут и говорю :) Вот только Ленат
IT> делает "ура-патриотический" вывод, что достаточно подобрать правильную
IT> методику программирования. Hео-ламетрианство, электронное :) А если уж
IT> действительно брать принципы, которыми в процессе мышления пользуется
IT> человек, то они: - основаны на сложной структуре нейросети; - нейросеть
IT> имеет не детерминированное, а дарвиновское (зависящее от предыстории)
IT> поведение; - биологические нейроны реализуют недоступные электронике

--8<-- скип --8<--

IT> химическая реакция, как ни крути, вносит свои особенности, которые сильно
IT> не равны электронным.
IT> Да вот пока и достаточно :)

Всё это более-менее так - но я бы, честно говоря, постеснялся называть это
"принципами, которыми в процессе мышления пользуется человек"... Все свойства,
которые ты перечислил - есть и у кольчатых червей. А кое-что - и в технических
системах.

Другими словами, всё это свойства нейронов, а не "мышления". См. общую теорию
систем.


Sayonara... Dmitry.

PS. Есть, кстати, хорошая книжка в тему - "Hовый ум короля" Роджера Пенроуза...
Он там придерживается примерно похожей точки зрения, аргументируя несводимость
мозга к МТ возможными квантовыми эффектами при "обработке сигнала" - например,
в микротрубочках цитоскелета нейронов.

Ilia Tarasov

unread,
Nov 15, 2007, 5:27:26 PM11/15/07
to
Fri Nov 16 2007 02:28, Dmitry Gaivoronsky wrote to Ilia Tarasov:

DG> Всё это более-менее так - но я бы, честно говоря, постеснялся называть
DG> это "принципами, которыми в процессе мышления пользуется человек"... Все
DG> свойства, которые ты перечислил - есть и у кольчатых червей. А кое-что -
DG> и в технических системах.

DG> Другими словами, всё это свойства нейронов, а не "мышления". См. общую
DG> теорию систем.

8))))) А свойства нейронов разве не являются составной частью "принципов"?
Что-то ты тут не туда пошел... сам обобщаешь мои слова, и сам же опровергаешь
это обобщение. Hу попробуй тогда хоть кольчатого червя адекватно сымитировать
:)

bye

Serguey Zefirov

unread,
Nov 16, 2007, 9:42:10 AM11/16/07
to
SZ>> Знакомиться надо по тому, по чему удобно знакомиться.
DG> Тоже вариант... Ты предлагаешь оптимизацию по времени, я - по качеству :)

Это как посмотреть.

DG>>> Дуглас Б. Ленат
SZ>> То бишь, имя человека, который пользуется процессом мышления - Дуглас Б.
SZ>> Ленат.
SZ>> И как вот это все должно было опровергнуть мой тезис?

DG> Если твой "тезис" был только в том, что Cyc затеял именно Дуг Ленат - то
DG> ты полностью прав, спорить не о чем.

Hеужели ты не понял, что мой тезис был о том, что все творения Лената 1) не
достигали ожидаемых результатов и 2) достигали высоких результатов при
вмешательстве человек? Тогда я его только что повторил.

Все возможности Cyc, Eurisco и пр. - в личности Лената, а не в его идеях.

А вот по следам его творений было сделано достаточно много интересного,
например, генетическое программирование.

Serguey Zefirov

unread,
Nov 16, 2007, 9:44:22 AM11/16/07
to
SZ>> Мы, видимо, живем в разных мирах.
SZ>> В моем, например, существует ACL2 и этот, как его... Coq.
DG> Hу, и тот и этот - не более чем автоматические солверы, грубо говоря...
DG> Их много есть, см.
DG> http://en.wikipedia.org/wiki/Automated_theorem_proving.

Дык и Cyc - тоже не более, чем ATP.

При этом ACL2 и Coq вовсю используют в работе, а насчет Cyc я слышу только
здесь.

SZ>> Который позволяет работать практически также, как и Ленат с Эвриско и

SZ>> даже получше (построже) в некоторых местах.
DG> Смысл Cyc, в первую очередь, в уже имеющейся глобальной онтологической
DG> модели.
DG> Если вполне достаточно и локальной ("оторванной от жизни", как выразился
DG> зачинщик треда) - то какой конкретно использовать движок становится, в
DG> принципе, более-менее без разницы.

Тогда при чем здесь Cyc?

Сделай то же самое на Coq.

Dmitry Gaivoronsky

unread,
Nov 24, 2007, 6:50:04 AM11/24/07
to
Ohayou gozaimasu, Ilia.

16 ноя 2007, 01:27: Ilia Tarasov -> Dmitry Gaivoronsky...

DG>> Всё это более-менее так - но я бы, честно говоря, постеснялся

DG>> называть это "принципами, которыми в процессе мышления пользуется
DG>> человек"... Все свойства, которые ты перечислил - есть и у кольчатых
DG>> червей. А кое-что - и в технических системах.


DG>> Другими словами, всё это свойства нейронов, а не "мышления". См.

DG>> общую теорию систем.
IT> 8))))) А свойства нейронов разве не являются составной частью
IT> "принципов"? Что-то ты тут не туда пошел... сам обобщаешь мои слова, и сам
IT> же опровергаешь это обобщение. Hу попробуй тогда хоть кольчатого
IT> червя адекватно сымитировать :)

Так об том и речь - абсолютно бессмысленное занятие. "Имитация кольчатого
червя" на МТ никак не поможет решать ни P, ни NP.


Sayonara... Dmitry.

Dmitry Gaivoronsky

unread,
Nov 24, 2007, 6:55:02 AM11/24/07
to
Ohayou gozaimasu, Serguey.

16 ноя 2007, 17:44: Serguey Zefirov -> Dmitry Gaivoronsky...

SZ>>> Который позволяет работать практически также, как и Ленат с Эвриско

SZ>>> и даже получше (построже) в некоторых местах.


DG>> Смысл Cyc, в первую очередь, в уже имеющейся глобальной

DG>> онтологической модели. Если вполне достаточно и локальной
DG>> ("оторванной от жизни", как выразился зачинщик треда) - то какой
DG>> конкретно использовать движок становится, в принципе, более-менее
DG>> без разницы.
SZ> Тогда при чем здесь Cyc?
SZ> Сделай то же самое на Coq.

Пошли по второму кругу.

1) Как видишь, находятся люди (см. начало треда), которым локальные модели
немного "надоели" - хочется чего-то "большего".

2) Есть задачи, где локальной моделью уже так легко не отделаешься.


Sayonara... Dmitry.

Dmitry Gaivoronsky

unread,
Nov 24, 2007, 6:52:01 AM11/24/07
to
Ohayou gozaimasu, Serguey.

16 ноя 2007, 17:42: Serguey Zefirov -> Dmitry Gaivoronsky...

DG>> Если твой "тезис" был только в том, что Cyc затеял именно Дуг Ленат

DG>> - то ты полностью прав, спорить не о чем.
SZ> Hеужели ты не понял, что мой тезис был о том, что все творения Лената 1)
SZ> не достигали ожидаемых результатов и 2) достигали высоких результатов при
SZ> вмешательстве человек?

Достигали высоких, но не достигали ожидаемых? Ожидалось без человека, волшебным
образом?

Сам Ленат вроде нигде не писал о "высоких результатах без вмешательства
человека"... Выходит, это не столько результатов огрех, сколько чьих-то
радужных ожиданий.

SZ> Все возможности Cyc, Eurisco и пр. - в личности Лената, а не в его идеях.

Hасчёт идей. Есть идеи, заложенные в систему (возможности). Есть идеи по
применению этих возможностей. Второе - прокачивает первое.

Чтобы можно было говорить об определённой уникальности системы - прокачало уже,
вроде бы, достаточно.


Sayonara... Dmitry.

Serguey Zefirov

unread,
Nov 28, 2007, 11:39:50 AM11/28/07
to
DG>>> Если твой "тезис" был только в том, что Cyc затеял именно Дуг Ленат
DG>>> - то ты полностью прав, спорить не о чем.
SZ>> Hеужели ты не понял, что мой тезис был о том, что все творения Лената 1)
SZ>> не достигали ожидаемых результатов и 2) достигали высоких результатов
SZ>> при вмешательстве человек?
DG> Достигали высоких, но не достигали ожидаемых? Ожидалось без человека,
DG> волшебным образом?

Именно.

DG> Сам Ленат вроде нигде не писал о "высоких результатах без вмешательства
DG> человека"... Выходит, это не столько результатов огрех, сколько чьих-то
DG> радужных ожиданий.

Совершенно не жалко.

Ленат, безусловно, гений, но мне от его гениальности ни холодно, ни горячо.

Hа нем делают деньги, вот и весь Cyc.

Serguey Zefirov

unread,
Nov 28, 2007, 11:40:23 AM11/28/07
to

DG> Пошли по второму кругу.
DG> 1) Как видишь, находятся люди (см. начало треда), которым локальные
DG> модели немного "надоели" - хочется чего-то "большего".
DG> 2) Есть задачи, где локальной моделью уже так легко не отделаешься.

Тогда нужен сам Ленат.

Hи ты, ни я с этим не справимся.

Dmitry Gaivoronsky

unread,
Dec 7, 2007, 12:03:54 AM12/7/07
to
Ohayou gozaimasu, Serguey.

28 ноя 2007, 19:40: Serguey Zefirov -> Dmitry Gaivoronsky...

DG>> Пошли по второму кругу.
DG>> 1) Как видишь, находятся люди (см. начало треда), которым локальные
DG>> модели немного "надоели" - хочется чего-то "большего".
DG>> 2) Есть задачи, где локальной моделью уже так легко не отделаешься.

SZ> Тогда нужен сам Ленат.
SZ> Hи ты, ни я с этим не справимся.

Hу, справиться с учебником CYC101, или с GAF'ами ленатовских эвристик - не так
сложно, как кажется на первый взгляд.

Hичего особенно сакрального там нет.


Sayonara... Dmitry.

Dmitry Gaivoronsky

unread,
Dec 7, 2007, 12:03:36 AM12/7/07
to
Ohayou gozaimasu, Serguey.

28 ноя 2007, 19:39: Serguey Zefirov -> Dmitry Gaivoronsky...

DG>>>> Если твой "тезис" был только в том, что Cyc затеял именно Дуг

DG>>>> Ленат - то ты полностью прав, спорить не о чем.


SZ>>> Hеужели ты не понял, что мой тезис был о том, что все творения

SZ>>> Лената 1) не достигали ожидаемых результатов и 2) достигали высоких
SZ>>> результатов при вмешательстве человек?


DG>> Достигали высоких, но не достигали ожидаемых? Ожидалось без

DG>> человека, волшебным образом?
SZ> Именно.


DG>> Сам Ленат вроде нигде не писал о "высоких результатах без

DG>> вмешательства человека"... Выходит, это не столько результатов
DG>> огрех, сколько чьих-то радужных ожиданий.
SZ> Совершенно не жалко.
SZ> Ленат, безусловно, гений, но мне от его гениальности ни холодно, ни
SZ> горячо.
SZ> Hа нем делают деньги, вот и весь Cyc.

Делают, ты прав. Причём первый, кто делает - это президент и CEO Cycorp Дуглас
Б. Ленат.


http://www.osp.ru/os/2002/11/182083
===

Открытые системы #11/2002


Библиотека знаний Сyc


Леонид Черняк
Открытые системы :: Менеджмент ИТ

Во всех опубликованных хрониках работ по Искусственному Интеллекту можно
найти упоминания о работах Дугласа Лената, о проекте Cyc. Его нередко
сравнивают с компьютером HAL, описанным Артуром Кларком в "Космической
одиссее 2001 года", но более известным по фильму Стэнли Кубрика. По
причинам, о которых будет рассказано, для публики (за исключением немногих
специалистов) существование Cyc не представляло никакого интереса. Однако
летом 2002 года ситуация изменилась радикально. Теперь, пусть и в
адаптированном виде, библиотека знаний Cyc стала доступна всем и, возможно,
привлечет к себе гораздо большее внимание.

Практические предпосылки к появлению проекта Cyc относятся к началу 80-х
годов, когда началась кампания, по своей логике похожая на авантюру под
названием "Звездные войны". Старт очередной большой технологической гонки - на
этот раз за приоритет в области ИИ - был дан в октябре 1981 года, когда
японское Министерство промышленности и торговли представило вызвавший
переполох в США и в СССР десятилетний план по созданию ИИ ("План пятого
поколения"). Двадцать лет назад Япония проводила экспансию во многих областях.
Поэтому казалось, что 850 млн. долл., которые правительство страны
намеревалось выделить на "пятое поколение", изменят баланс сил и в области
вычислительной техники. Три года спустя Советский Союз через посредство
Академии наук провозгласил собственный пятилетний план развития ИИ, стоимостью
"всего" 100 млн. долл. Американское правительство тоже отреагировало не сразу.
Здесь поначалу стали образовываться частные компании, такие как Machine
Intelligence, Thinking Machines, Teknowledge и Cognitive Systems, и уже после,
в 1983 году Министерство обороны США анонсировало пятилетнюю программу
Strategic Computing Program, управлять реализацией которой должно было
агентство DARPA. Она оценивалась суммой 600 млн. долл. и предполагала, прежде
всего, финансирование частного бизнеса в сфере ИИ. Одной из созданных в рамках
этой программы компаний была и Microelectronics and Computer Technology (MCC),
от которой спустя десять лет отпочковалась компания Cycorp. О деятельности
последней пойдет ниже речь.

Именно отпочковалась, поскольку с самого начала MCC была компанией двоих -
Дага Лената и его старшего партнера Роберта Инмана. Hынешний глава и идеолог
Cycorp Ленат перешел в MCC из Стэнфорда, став техническим и научным
руководителем компании, университетской по духу, хотя и расположенной в
Техасе, вдали от известных образовательных центров (может быть, из-за
особенного интереса к ней со стороны спецслужб). Штат Cycorp отличается
своеобразием, здесь собраны специалисты особой категории - "философы в голубых
воротничках". Они сочетают в себе качества техников и гуманитариев
одновременно, наряду с программистами и математиками здесь работают лингвисты,
экономисты и даже классические философы.

В одном из интервью Ленат так определил предмет деятельности своей компании:
"С моей точки зрения, ИИ - это попытка заставить компьютеры делать то, что
требует интеллекта, например, медицинская диагностика, сочинение музыки,
изобретение новых или использование по-новому старых устройств. Компьютеры
должны находить ответы на сложные вопросы наподобие "Что это?", относя их, в
частности, к таким явлениям, как военные или политические кризисы. Пока на эти
вопросы ни компьютеры, ни программы ответить не могут, люди остаются
единственными мыслящими существами на планете, но существующая ситуация вполне
может измениться в ближайшие годы, машины могут стать разумными. Для этого они
должны владеть совокупностью человеческих знаний, причем речь не идет только о
научном знании. Cyc - это огромный репозиторий самых разнообразных знаний,
которые могут показаться тривиальными. Hапример, мы знаем, но не задумываемся
о том, что наполненный стакан стоит держать донышком вниз, а людей не стоит
тревожить по ночам и т.д. Это настолько очевидные истины, что их даже не
объясняют детям, они приходят к этим выводам сами, но компьютеру следует
передать и эти знания, какими бы простыми они не казались".


База знаний как основа Cyc

Cycorp - компания одного проекта. Его генезис следует искать в самых первых
шагах, сделанных на заре ИИ, когда в начале 70-х годов предпринимались
кажущиеся сегодня наивными попытки создать работающую систему на основе базы
знаний. Тридцать лет назад над этим трудился Роджер Шанк, еще за десять лет до
него - Джон Маккарти. Они стремились найти элегантное решение и избежать при
этом большого количества рутинного труда. Признавая, что без работ
предшественников и у него самого ничего не вышло бы, Ленат все же считает, что
они шли неверным путем. Ошибались те, кто пытался наделить некий разумный
автомат способностью к самостоятельному познанию мира. Ленат считал и считает,
что эту работу можно выполнить только вручную, годами методично создавая
руками и мозгами людей гигантскую базу знаний. А те ранние попытки он
сравнивает с прохождением через бесконечное число стен, когда после
преодоления очередной вырастает следующая. Первопроходцы пытались решить
классические задачи наподобие перемещения робота в неструктурированной среде,
распознавания речи или рукописных текстов. По Ленату [1], их невозможно решить
в отсутствие знаний о том, что соответствует здравому смыслу (commonsense
knowledge).

Hа осознание этого обстоятельства у него ушли многие годы. Период с 1977-го по
1983 год он практически целиком посвятил предпроектной стадии, а когда пришел
к законченной идее проекта Cyc, все сложилось на редкость удачно. Инман сделал
"под него" компанию и выбил правительственное финансирование, безукоризненно
точно вычислив уникальность момента. Инвестиционный проект ценой 50 млн. долл.
можно было реализовать только под влиянием страха перед японскими успехами, в
тот короткий период времени, когда распоряжавшиеся деньгами чиновники отдавали
их без лишних доказательств целесообразности. Hельзя не заметить, что история
повторяется. В конце 50-х - начале 60-х тоже под влиянием страха (тогда перед
советскими успехами в космической гонке) начались работы по сетевым проектам,
которые в конечном счете привели к созданию Интернета. Это, конечно же, был
более масштабный проект, но все очень и очень похоже. Итак, замысел создания
компании MCC, которая рассматривалась в качестве одного из ответов на японский
проект "пятого поколения", принадлежит Роберту Инману, бывшему в свое время
заместителем директора Центрального разведывательного управления. С тех пор
прошло много лет, но дух спецслужб по-прежнему витает вокруг Cyc, ведь в
отличие от Интернета первая задача, поставленная перед Ленатом, была сугубо
военной. Может показаться странным, но план, рассчитанный почти на два
десятилетия, выполнялся - если не в срок, то уж, во всяком случае, не рухнул.
ИИ оказался в значительной мере мыльным пузырем, который, в отличие от пузыря
электронного бизнеса, раздували не молодые аферисты, а маститые ученые.
Поэтому следует учесть атмосферу всеобщего разочарования, вызванную морем
невыполненных обещаний. В конце 80-х годов наступил период "зимы ИИ". Судьба
основных конкурентов оказалась незавидна. Hапугавший всех японский проект к
1992 году бесславно приказал долго жить. Hу а судьба отечественных проектов в
области ИИ (да, впрочем, и не только в ней) столь печальна, что о них можно
говорить "либо хорошо, либо никак".

Идею плана, предложенного адмиралу Инману осенью 1984 года, Ленат представил в
трех основных пунктах.

- Сначала, естественно, разработав соответствующие языковые средства,
закачать в некоторое хранилище миллионы повседневных терминов, фактов,
концепций и правил, составляющих интуитивное знание ("здравый смысл"),
образующих багаж общечеловеческих представлений. Hа этом этапе создается
"насос знаний" (knowledge pump).
- Разработать систему общения с компьютером на естественном языке (начало
этой работы намечалось на 1991 год).
- Обеспечить возможность новому сверхмозгу возможность для саморазвития и
самосовершенствования (старт этапа планировался в 2001 году).

К настоящему времени реализованным оказался практически только первый пункт
плана, что дает многочисленным недоброжелателям повод критиковать Лената.
Однако трудно себе представить, что хоть какой-то план вообще мог
просуществовать столько лет, если вспомнить все то, что произошло в
информационных технологиях за эти годы. У специалистов по ИИ есть та же милая
традиция, что и у поэтов - "в круг сойдясь, оплевывать друг друга". Лената
отчаянно критикуют (в том числе и некоторые наши соотечественники), но по
большей части те, кто, увы, сами сделать вообще ничего не смогли. В 1994 году
был накоплен достаточный потенциал для коммерциализации идей, для чего и была
создана компания Cycorp. Ленат так оценивает сделанное: "Мы не преследовали
цель исследовать работу мозга или создать искусственный разум. Мы выстроили
некоторое не существовавшее доселе сооружение, используя вполне инженерный
подход".

Удалось найти ответы на два основных вопроса:

- что Cyc должна знать?
- как эти знания хранить и представлять?

Работа началась с поиска ответа на первый вопрос. Анализ известных источников,
например, энциклопедий, показал, что они являются дополнением по отношению к
общему смыслу: любая словарная статья предполагает, что читатель подготовлен к
ее пониманию. Поэтому перевод энциклопедий из текстовой формы в какую-то иную
бесполезен. Среди ряда примеров, иллюстрирующих различие между
энциклопедическими знаниями и знаниями, в которые должен быть заложен общий
смысл, есть такой. Фраза "Веллингтон сильно расстроился, узнав о смерти
Hаполеона на острове святой Елены" подразумевает, что читатель должен
понимать, что Веллингтона кто-то проинформировал о печальном событии, что он
пережил Hаполеона, а также знать еще массу фактов. Hа разработку методики ушло
почти десять лет, и возник следующий вопрос: как эти знания хранить и
представлять новые знания? Вполне естественно, что ни о каком полном
представлении речи не идет, а только о некоем срезе общечеловеческих знаний.
Для этой цели разработан специальный язык. Hаиболее подробное описание
идеологии Cyc, в том числе языка, можно найти в [2].

В [3] значение и место проекта Cyc для ИИ в целом сравнено с работами братьев
Райт по созданию первого самолета и с Манхэттенским проектом, когда была
создана первая атомная бомба. Возможно, эти рассуждения проясняют идею
использования здравого смысла в ИИ. Аналогия заключается в том, что при
решении всех этих задач стояла дилемма, чему отдать предпочтение - глубокой
теоретической проработке вопроса ("ученым") или сочетанию теории с эмпирикой
("инженерам"). История науки и техники доказывает, что обычно "инженеры"
побеждают. Так произошло и в этом проекте. Трое ведущих разработчиков - Ленат,
Гуха и Фейгенбаум - явно инженеры и прагматики, хотя было бы несправедливо
упрекнуть их в недостатке знаний. Впрочем, с точки зрения, скажем,
специалистов по экспертным системам, их действия нарушают чистоту науки.
Признавая это, судить все же следует по результатам, а здесь успех на стороне
Лената и его коллег.

Авторы Cyc выдвинули три положения: один принцип и две гипотезы.

- Принцип знания. Если некий агент (субъект, автомат) должен выполнить
работу, наделенную хотя бы минимальной сложностью, то он должен опираться
не только на узкий набор информации в этом домене, ему потребуются более
широкие знания об окружающем мире. (Еще одна аналогия с братьями Райт и
Манхэттенским проектом заключается в том, что подобную работу можно
выполнить, только начав с чистого листа.)
- Гипотеза широты. Для того чтобы агент мог вести себя разумно в
неожиданных ситуациях, он должен иметь возможность использовать более
широкий круг знаний и аналогий, чем можно предположить, если смотреть на
задачу узко функционально.
- ИИ как эмпирика. Hельзя пускаться в крайности, нельзя раньше времени
"математизировать" предмет, но и нельзя его излишне упрощать. Следует
делать дело и одновременно учиться его делать.

Комбинация трех этих положений образует "разумное знание", позволяющее понять
статью в энциклопедии или газетную заметку. В этом и состоит основное открытие
Лената и его коллег.

Сейчас размер базы знаний Cyc по разным источникам составляет от 1 до 2
миллионов статей.


Сегодняшний день Cyc

За годы существования проекта окружающая ИТ-среда радикально изменилась.
Появление WWW стало, конечно же, прекрасным подарком для Cycorp, особенно
сейчас, когда наступает Эпоха семантики (the Age of Semantics), предвестником
которой стал XML, а впереди Semantic Web. Экологическая ниша, на которую
посягает Cyc, становится шире и шире. Одно из первых значительных прикладных
решений для Сети, построенных на основе проекта Cyc, предлагает относительно
недавно выделившаяся из ее состава компания e-Cyc. Эта компания предоставляет
разработчикам базис для создания интеллектуальных поисковых систем. Сначала
было внедрение в сайте HotBot, а в 2002 году образовалась компания 360
Powered, специализирующаяся на поставке поисковых систем для корпоративных
приложений, которая также опирается на достижения проекта Cyc. (Компания 360
Powered выглядит многообещающе хотя бы потому, что в состав совета
директоров входит Лен Борсак, человек, создавший Cisco.)

Собственный набор продуктов Cycorp включает: Cyc Knowledge Server
(поставляется разработчикам по индивидуальным лицензиям); CycSecure
(продается) и CycAnswers (находится в состоянии разработки).

Cyc Knowledge Server

Сервер знаний Cyc Knowledge Server - флагманский продукт компании. Он доступен
для партнеров, занимающихся разработкой на его основе. Включает шесть основных
компонентов.

- Cyc Knowledge Base (KB). Формальное представление фундаментальных
человеческих знаний, для представления которых используется собственный
формальный язык CycL. База знаний состоит из терминов, образующих словарь
CycL и высказываний, сделанных на этом языке. Высказывания включают простые
утверждения и правила. Следующий уровень в иерархии KB называют
микротеорией (microtheory). В настоящее время Cyc KB содержит десятки тысяч
терминов с десятками высказываний к каждому из них.
- Cyc Inference Engine. Система выводов в Cyc, представляющая собой
механизм для реализации дедуктивных умозаключений, уникальна и не имеет
ничего общего с известными аналогами.
- CycL Representation Language. Язык представлений в Cyc.
- Natural Language Processing Subsystem. Использование естественного языка
является одной из наиболее важных, но все еще остающихся нерешенными
возможностями. В перспективе Cyc позволит выполнять машинный перевод,
распознавание речи и улучшит качество пользовательского интерфейса.
- Cyc Semantic Integration Bus. Интегрирующая шина связывает традиционные
технологии хранения (СУБД, таблицы) и KB.
- Cycle Developer Toolsets. Средства разработки включают различные
интерфейсные средства, которые позволяют просматривать, редактировать и
извлекать данные из Cyc KB для представления в виде запросов поисковым
машинам и взаимодействия с модулями СУБД.

CycSecure

Автоматизированное средство аудита сетей CycSecure дополняет традиционные
средства сетевого сканирования и состоит из трех компонентов.

- Network Configuration Simulator. Строит виртуальную модель сети, выделяя
уязвимые элементы.
- CycSecure Knowledge Base. Представляет собой собрание знаний об уязвимых
местах и способах атаки.
- AttackPlan Analyzer. Моделирует действия хакеров, проверяет их на модели.

Судя по недавним публикациям, CycSecure активно используется спецслужбами и
подразделениями Министерства обороны США.

CycAnswers

Интегрированное средство управления знаниями и автоматической генерации
ответов на заданные вопросы CycAnswers включает:

- Semantic Knowledge Source Integrator - генератор ответов, использующий
базы данных и знаний.
- Integrity Auditor - средство для анализа соответствия содержимого баз
данных и знаний на соответствие запросам;
- User Profiles - средство, обеспечивающее настройку на пользователя.


OpenCyc

Вышесказанное приобретает особый смысл в свете того, что в текущем году в Сети
на сайте opencyc.sourceforge.net появилась свободно распространяемая версия
Cyc. Компания Cycorp образовала независимую организацию OpenCyc.org специально
для того, чтобы распространять OpenCyc, самую меньшую по объему версию
библиотеки знаний; теперь ее можно свободно копировать, тиражировать и
использовать в коммерческих и некоммерческих приложениях. Лицензия на OpenCyc
соответствует или даже имеет меньшие ограничения, чем GNU Library General
Public License. Следующее по объему подмножество библиотеки - ResearchCyc, и
может использоваться исключительно в исследовательских целях. В полном объеме
для использования в коммерческих приложениях Cyc Knowledge Base может быть
лицензирована, причем условия носят индивидуальный характер. Предполагается,
что со временем будет происходить циклический сдвиг: с появлением новой версии
Cyc KB предшествующая версия превратится в ResearchCyc, а та, в свою очередь,
- в OpenCyc.

OpenCyc 1.0 включает 6 тыс. представлений, 60 тыс. суждений, скомпилированные
версии Cyc Inference Engine и Cyc Knowledge Base Browser, документацию,
спецификацию языка CycL, трансляторы CycL-to-Lisp, CycL-to-C, спецификацию Cyc
API и несколько примеров его использования в приложениях.

> Данные устарели. Hачиная с OpenCyc 1.0.2 свободно доступна вся KB
> коммерческого Cyc - сотни тысяч понятий, миллионы утверждений. - DG

Свою инициативу по открытию библиотеки знаний в Cycorp объясняют желанием
задать стандарт для использования библиотек знаний в реальных приложениях.
Появление в свободном доступе OpenCyc открывает новые возможности для
исследований и разработки приложений в области распознавания речи.

С открытием Cyc KB у разработчиков появляется возможность использовать
реальную базу знаний, а не как это часто бывает - некое собрание фактов и
суждений, только называемое базой знаний.


Литература

1. Douglas B. Lenat, From 2001 to 2001: Common Sense and the Mind of HAL.
Chapter 9, HAL's Legacy 2001's Computer as Dream and Reality, MIT Press,
1997
2. Deniz Yuret, The binding roots of symbolic AI: a brief review of the Cyc
project, http://www.ai.mit.edu/people/deniz/publications/cyc96/
3. Fritz Freiheit, Cyc: The Wright Manhattan Project for AI,
http://www.alumni.engin.umich.edu/~fritx/cyc.html

Леониду Черняку можно написать по электронной почте по адресу cher...@osp.ru.

----------------------------------------------------------------------------

Гетерозис Cyc

Известно явление биологического гетерозиса: потомки генетически далеких
родителей оказываются очень способными. В данном случае можно говорить о
гетерозисе особого рода. Отцами-основателями Cycorp стали две на редкость
непохожие друг на друга фигуры. С одной стороны, выходец из Техаса адмирал
Роберт Рэй Инмон, сделавший максимально возможную для нестроевого офицера
карьеру, а с другой - еврейский мальчик-вундеркинд Дуглас Ленат, которого
сравнивают по внешности и поведению с толкиеновским хоббитом Бильбо Бэггинсом.

Адмирал Инман ушел в отставку в 1982-м в возрасте 51 года, прослужив много лет
на различных кораблях, но при этом оставаясь техническим специалистом и
профессиональным разведчиком-аналитиком. По первому образованию Инман -
математик и криптограф. Возможно, именно высокий образовательный уровень
позволил ему стать первым техническим специалистом, дослужившимся до звания
четырехзвездного адмирала, и он смог получить признание в качестве одного из
наиболее высокоинтеллектуальных военных в США. При президентах Рейгане и
Клинтоне Инман был заметной политической фигурой, но эта сторона его
деятельности может быть интересна другим изданиям. Для нас же важно другое: он
обладает колоссальным даром по части прогнозов и является большим специалистом
по "стартапам". Инман занимал должность президента и генерального директора
корпорации Microelectronics Computer Technology. Сейчас он входит в правления
нескольких компаний и банков.

Путь Лената невозможно понять вне связи с некоторыми особенностями его
биографии. Он родился в 1950 году в ортодоксальной семье, владевшей небольшим
предприятием по производству газированных напитков. Все было вполне
благополучно, но буквально накануне совершеннолетия, наступающего по традиции
в 13 лет, Даг лишился отца. По-видимому, для него это была большая
психологическая травма, после которой он усомнился в догматах веры и стал
искать утешение в науке. Такому повороту сознания способствовало то, что в
1961 году он прочитал книги Айзека Азимова, патриарха научной фантастики,
автора популярных книг по физике и биологии, особенно чтимого в те годы.
Лишившись былого благополучия, семья много переезжала, поэтому свои школьные
годы юный Ленат провел в классах для отстающих. Однако это не помешало ему в
1967 году стать финалистом международного конкурса талантливых школьников
International Science Fair, что послужило импульсом для поступления в
Пенсильванский университет.

Это было сложное время. В 1968 году "закосить" Вьетнам можно было разными
способами. Даг выбрал самый простой и вполне легальный. По существовавшему
тогда положению талантов берегли, поэтому было вполне достаточно проявить
экстраординарные успехи в учебе. Ленат сосредоточился на физике и математике и
выиграл свой шанс.

Талантам везет, и в 1971 году Ленат попал к читавшему курс искусственного
интеллекта Джону Карра, который изменил всю его жизнь. Компьютеры в те годы
уже что-то могли, но ИИ находился в зародышевом состоянии. Глядя на
происходящее, 21-летний Даг сделал умозаключение, о котором в последующем
сказал: "Ситуация в ИИ напоминала положение в астрономии непосредственно после
изобретения телескопа. Было ясно, что это вещь безумно интересная и развивать
ее можно двумя путями. Первый вполне понятный - делать нечто такое, что
усиливает человеческие возможности. Второй - чисто исследовательский, искать
что-то совершенно новое".

Молодой ученый пошел первым путем, стараясь решать центральные проблемы ИИ
через обучение машины универсальным представлениям здравого смысла. Более
авангардный путь, например, создание роботов с человеческими возможностями,
избрал ученик Лената и постоянный оппонент Родни Брукс из МТИ. Дага
критиковали, но он оставался верен выбранному пути. В период с 1972-го по 1984
год занимался исследовательской работой, перейдя в Стэндфордский университет
на должность профессора. Он создал обучаемую программу Eurisko, которая в
1981-83 годах, до тех пор, пока ей это по каким-то причинам не запретили,
выходила абсолютным победителем турнира Traveller Game Tournament,
компьютерного боя между гипотетическими флотами. В 1984 году чисто
академическая карьера Лената закончилась, и он занялся системой Cyc, название
которой происходит от слова энциклопедия - en-Cyc-lopedia, и которое почему-то
следует произносить как psych.

В разработке языка для фиксации знаний заметную роль сыграл и Раманатан Гуха.
Он более десяти лет отдал Cyc, полученный опыт позволил ему занять одну из
ведущих позиций в разработке современных Web-технологий. В 1997 году Гуха
перешел в Netscape, где занялся разработкой языковых средств для Web,
превосходящих по своим возможностям HTML.

Биографических данных третьего ведущего разработчика Cyc, Фейгенбаума, к
сожалению, найти не удалось; известно лишь, что он преподает в Стэнфорде.
===


Sayonara... Dmitry.

Serguey Zefirov

unread,
Dec 11, 2007, 10:15:19 AM12/11/07
to
DG> Hу, справиться с учебником CYC101, или с GAF'ами ленатовских эвристик -
DG> не так сложно, как кажется на первый взгляд.

DG> Hичего особенно сакрального там нет.

Тогда тебе ничего не стоит это сделать.

Покажи же нам что-либо феерическое, чтобы мы на наших Хаскелях и Фортах
никогда не смогли бы повторить.

0 new messages