Мивары: 25 лет создания искусственного интеллекта
Шрифт:
Как видно, в современной теории ИИ кроме предикатного подхода уже разработано большое количество других подходов, кардинально отличающихся от исчисления предикатов и т.п. Подчеркнем, что продукционный подход и его развитие в миварных сетях являются еще одной альтернативой исчислению предикатов при создании ИИ.
2. Основные преимущества миварного подхода
2.1. Обзор достижений в области искусственного интеллекта
В области ИИ существует две фундаментальные проблемы – это представление знаний и поиск [264, стр. 42]. Первая проблема относится к получению новых знаний с помощью формального языка. Поиск – это метод решения проблемы, в котором систематически просматривается пространство состояний задачи, т.е. альтернативных стадий ее решения.
В области ведения игр широкое применение нашли разнообразные человеческие игры: пятнашки, шашки, шахматы и т.п. Эти игры ведутся с использованием четко определенного набора правил, что уже само по себе является важным ограничением по сравнению с реальными задачами, где правил может не быть совсем, или они могут изменяться по желанию противников. Позиции фигур легко представимы
Автоматическое доказательство теорем – одна из старейших областей возможного применения ИИ, где было много достижений, исследований и программ, включая Универсальный решатель задач Ньюэлла и Саймона. Люгер подчеркивает, что именно "…эта ветвь принесла наиболее богатые плоды…" [264, стр. 44]. Благодаря исследованиям в этой области были формализованы алгоритмы поиска и разработаны языки формальных представлений, такие как исчисление предикатов и логический язык программирования Пролог. Приведем обоснование Дж. Люгера: "… привлекательность автоматического доказательства теорем основана на строгости и общности логики. В формальной системе логика располагает к автоматизации. Разнообразные проблемы можно попытаться решить, представив описание задачи и существенно относящуюся к ней информацию в виде логических аксиом и рассматривая различные случаи задачи как теоремы, которые нужно доказать. Этот принцип лежит в основе автоматического доказательства теорем и систем математических обоснований" [264, стр. 44]. Далее следует замечательный вывод и итог 20 века в этой наиболее богатой ветви: "К сожалению, в ранних пробах написать программу для автоматического доказательства, не удалось разработать систему, которая бы единообразно решала сложные задачи" [264, стр. 44]. Таким образом, Дж. Люгер подтверждает наш тезис о том, что в прошлом веке даже в самых передовых областях ИИ ученые не смогли решить сложные задачи, а значит, нужны принципиально новые подходы и исследования, к числу которых относится и миварный подход.
Приведем обоснование ограниченности возможностей автоматического доказательства теорем, которое имеет важное значение для дальнейших исследований, как минимум, показывая, куда НЕ надо идти. Как говорится, отрицательный результат – это тоже результат!!! Итак, обоснование Дж. Люгера: "Это было обусловлено способностью любой относительно сложной логической системы сгенерировать бесконечное количество доказуемых теорем: без мощных методик (эвристик), которые бы направляли поиск, программы доказывали большие количества не относящихся к делу теорем, пока не натыкались на нужную. Из-за этой неэффективности многие утверждают, что чисто формальные синтаксические методы управления поиском в принципе не способны справиться с такими большими пространствами, и единственная альтернатива этому – положиться на неформальные, специально подобранные к случаю (лат "ad hoc") стратегии, как это, похоже, делают люди. Это один из подходов, лежащих в основе экспертных систем… и он оказался достаточно плодотворным" [264, стр. 44]. Таким образом, возникают новые проблемы: работа с бесконечными множествами теорем и разработка эвристик, про которые ранее было показано, что они не гарантируют решение задачи. Конечно, за прошедшее время ученым удалось разработать мощные эвристики, основанные на оценке синтаксической формы логического выражения, которые в результате понижают сложность пространства поиска. Кроме того, пришло понимание, что системе не обязательно решать особо сложные проблемы без человеческого вмешательства. "Многие современные программы доказательств работают как умные помощники, предоставляю людям разбивать задачи на подзадачи и продумывать эвристики для перебора в пространстве возможных обоснований" [264, стр. 44]. Этот вывод может служить обоснованием нашего утверждения, что ИИ – это усилитель человеческих способностей и автоматизация мыслительных процессов. Кроме того, это косвенно подтверждает необходимость введения шкалы измерений интеллектуальности автоматических систем и наличие относительно слабых форм интеллекта у уже существующих компьютерных программ и устройств. Значит, в таком смысле ИИ уже существует и продолжает развиваться, помогая человеку решать сложные задачи.
Вместе с тем, рассмотренные проблемы доказательств поднимают вопросы необходимости формализации представлений и описаний различных предметных областей. Однако такая возможность есть далеко не всегда. Значит, надо исследовать возможности обработки менее формализованной информации или альтернативных моделей представления данных и знаний, что также развивается в миварном подходе. Миварный подход позволяет работать с различными формами представления данных и правил (знаний), включая и работу с бесконечными описаниями сущностей – вещей, отношений и свойств в миварном многомерном динамическом информационном пространстве унифицированного представления данных и правил (знаний).
Перейдем к анализу экспертных систем (ЭС). Одним из главных достижений ранних исследований по ИИ стало осознание важности специфичного для предметной области знания. Экспертное знание – это сочетание теоретического понимания проблемы и набора эвристических правил для ее решения. "Экспертные системы создаются с помощью заимствования знаний у человеческого эксперта и кодирования их в форму, которую компьютер может применить к аналогичным проблемам" [264, стр. 45]. Следовательно, стратегии ЭС основаны на знаниях человека-эксперта. К настоящему моменту разработаны сотни ЭС, которые прекрасно зарекомендовали себя в различных предметных областях для решения относительно сложных задач. Современные ЭС могут работать на основе ненадежной или недостаточной информации, выводят ясные и логичные пояснения своих решений. Дж. Люгер отмечает, что большинство ЭС были написаны для специализированных предметных областей, которые довольно хорошо изучены и располагают четко определенными стратегиями принятия решений. А вот проблемы, определенные на нечеткой основе здравого смысла реализовать в ЭС гораздо сложнее. Дж. Люгер выделяет 5 основных проблем для ЭС [264, стр. 46]:
1. Трудности в передаче глубоких знаний предметной области и потенциальная ограниченность знаний ЭС.
2. Недостаток здравомыслия и гибкости. ЭС не могут, подобно людям, исследовать сначала основные принципы, а потом выработать стратегию для подхода к проблеме.
3. Неспособность предоставлять осмысленные объяснения. Поскольку ЭС не владеют глубоким знанием своей предметной области, их пояснения обычно ограничиваются описанием шагов, которые система предприняла в поиске решения, но они не могут объяснить, почему был выбран конкретный подход.
4. Трудности в тестировании. Обоснование корректности работы любой большой компьютерной системы достаточно трудоемко. Проверять ЭС особенно тяжело, и это серьезная проблема, т.к. технологии ЭС применяются для разных критичных задач.
5. Ограниченные возможности обучения на опыте. ЭС делаются "вручную" и их производительность возрастает только после вмешательства программистов. Это заставляет серьезно усомниться в разумности таких систем [264, стр. 46].
Отметим, что в настоящее время ЭС нашли самое широкое применение в специализированных областях, но перестали быть передовым краем исследований в области ИИ, т.к. о них сообщается на большом количестве научных конференций. Многие ученые идут в своих исследованиях дальше, и теория ЭС продолжает развиваться в том числе и на основе миварного подхода, который позволяет устранить указанные ограничения и выйти на новый уровень интеллектуальности ЭС. Вместе с тем, именно широкое использование ЭС дает надежные основания для утверждения, что ИИ уже создан и широко используется людьми в своей повседневной деятельности. Конечно, это не означает, что ЭС и системы ИИ на их основе смогли превзойти уровень интеллектуальности человека, т.е. в другом понимании термина ИИ, как системы равной или превосходящей возможности человека, конечно же, еще достаточно далеко до создания такого ИИ.
2.2. Миварный подход и понимание естественных языков
Следующей проблемой ИИ является понимание естественных языков и семантическое моделирование. Здесь мы поддерживаем описание и выводы Дж. Люгера, которые заслуживают подробного цитирования: "Способность применять и понимать естественный язык является фундаментальным аспектом человеческого интеллекта, а его успешная автоматизация привела бы к неизмеримой эффективности самих компьютеров. Многие усилия затрачены на написание программ, понимающих естественный язык. Хотя такие программы и достигли успеха в ограниченных контекстах, системы, использующие натуральные языки с гибкостью и общностью, характерной для человеческой речи, лежат за пределами сегодняшних методологий" [264, стр. 46]. Усилим это высказывание: известные научные подходы к проблеме понимания естественного языка даже не рассматривают эту проблему в полном объеме, сразу ограничивая область и свои возможности. Т.е. выражение "за пределами сегодняшних методологий" означает, что на текущий момент даже и подходов к общему решению этой проблемы пока нет. И этому есть несколько объяснений, включая и приведенное выше пояснение о том, что многие современные ученые решают "игрушечные" задачи, даже не предполагая решение реальных, к числу которых и относится проблема понимания естественного языка.
Мы поддерживаем следующие рассуждения Дж. Люгера: "…понимание естественного языка включает куда больше, чем разбор предложений на индивидуальные части речи и поиск значений слов в словаре. Оно базируется на обширном фоновом знании о предмете беседы и идиомах, используемых в этой области, так же, как и на способности применять общее контекстуальное знание для понимания недомолвок и неясностей, присущих человеческой речи. Задача сбора и организации этого фонового знания, чтобы его можно было применить к осмысливанию языка, составляет значительную проблему в автоматизации понимания естественного языка. Разработано множество методов структурирования семантических значений. Но, из-за огромных объемов знаний, требуемых для понимания естественного языка, большая часть работы ведется в хорошо понимаемых специализированных проблемных областях. Методики представления известных специализированных программ слишком просты, чтобы передать семантическую организацию более богатых и сложных предметных областей. Основная часть текущих работ в этой области направлена на поиск формализмов представления, которые должны быть достаточно общими, чтобы применяться в широком круге приложений и уметь адаптироваться к специфичной структуре заданной области. Множество разнообразных методик, большинство из которых являются развитием или модификацией семантических сетей, исследуются с этой целью и используются при разработке программ, способных понимать естественный язык в ограниченных, но достаточно интересных предметных областях. Есть стохастические модели, описывающие совместное использование слов в языке, которые применяются для характеристики как синтаксиса, так и семантики. Далее следует принципиально важный вывод: полное понимание языка на вычислительной основе все же остается далеко за пределами современных возможностей" [264, стр. 47].