Об интеллекте
Шрифт:
Нейронные сети были подлинным улучшением после ИИ-подхода, потому что их архитектура базируется, хотя и очень слабо, на реальных нейронных сетях. Вместо программирования компьютеров, исследователи нейронных сетей, известные также как коннекционисты, интересовались изучением того, какое поведение может быть продемонстрировано связыванием группы нейронов вместе. Мозг состоит из нейронов; таким образом, мозг — это нейронная сеть. Это факт. Надежда коннекционистов была в том, что эфемерные свойства интеллекта могли бы проясниться изучением того, как нейроны взаимодействуют, и некоторые из проблем, которые не решались с помощью ИИ, могли бы быть решены репликацией соответствующего соединения между популяциями нейронов. Нейронные сети отличаются от компьютера тем, что в них нет процессора, и они не хранят информацию в централизованной памяти. Знания и память сети распределены по ее соединениям — прямо как в реальном
На первый взгляд, нейронные сети казались наилучшим приложением моих интересов. Но я быстро развеял свои иллюзии в этой области. За это время у меня сформировалось мнение, что три вещи были существенными для понимания мозга. Первым моим критерием было включение времени в функции мозга. Реальный мозг быстро обрабатывает потоки информации. Нет ничего статического в потоках информации, поступающих в мозг и из мозга.
Вторым критерием была важность обратных связей. Нейроанатомы давно осведомлены о том, что мозг насыщен обратными связями. Например, в контуре между неокортексом и нижележащей структурой, называемой таламусом, количество соединений, идущих обратно (в сторону входа) превышает количество идущих в прямом направлении более чем в десять раз! То есть, на каждое волокно, передающее информацию в направлении неокортекса приходится десять волокон, передающих информацию в направлении органов чувств. Обратные связи преобладают также и в большинстве соединений внутри неокортекса. Никто не понял конкретную роль этих обратных связей, но из опубликованных исследований ясно, что они есть везде. Я полагаю, что это должно быть важным.
Третьим критерием было то, что теория или модель мозга должна учитывать физическую архитектуру мозга. Неокортекс не является простой структурой. Как мы увидим далее, он организован как повторяющаяся иерархия. Ни одна нейронная сеть, не обладающая такой структурой, определенно не будет работать как мозг.
Но как только феномен нейронных сетей покинул сцену, ее занял класс очень простых моделей, которые не удовлетворяли ни одному из этих критериев. Большинство нейронных сетей состоят из небольшого количества нейронов, соединенных в три слоя. Паттерн (вход) подается на первый слой. Эти входные нейроны соединены со следующим слоем нейронов, так называемым скрытым слоем. Скрытый слой затем соединяется с последним слоем нейронов, выходным. Соединения между нейронами имеют различный вес, подразумевая, что активность одного нейрона может усиливать активность другого нейрона и ослаблять активность третьего в зависимости от веса соединения. Изменяя эти веса, нейронная сеть обучается отображать входные паттерны на выходные.
Такие простые нейронные сети обрабатывали только статические паттерны, не использовали обратных связей и не были чем-то похожим на мозг. Наиболее общий тип нейронных сетей, называемых сетями «обратного распространения», обучались путем распространения ошибки от выходных слоев обратно к входным. Вы могли бы подумать, что это одна из форм обратной связи, но это не так. Обратное распространение ошибки возникало только во время фазы обучения. Когда нейронная сеть работала в обычном режиме после того, как она была обучена, информация распространялась только в одну сторону. От выходов к входам не было обратных связей. И у этих моделей не было времени. Статический входной паттерн преобразовывался в статический выходной. Затем подставлялся другой входной паттерн. В сети не было какой либо истории или записей о том, что происходило даже чуть раньше. И наконец архитектура этих нейронных сетей была тривиальной по сравнению со сложной и иерархической структурой мозга.
Я думал, что это направление быстро перейдет к более реалистичным сетям, но этого не произошло. Поскольку эти простые нейронные сети были способны на интересные вещи, казалось, что исследования остановятся прямо там на годы. Был найден новый и интересный инструмент, и неожиданно тысячи ученых, инженеров и студентов бросились получать гранты, зарабатывать ученые степени и писать книги о нейронных сетях. Были созданы компании, использующие нейронные сети для предсказания курсов на фондовых рынках, обработки заявок на получение кредитов, проверки подписей и выполнения сотен других приложений по классификации паттернов. Хотя намерения исследователей в этой области могли бы быть более общими, эта область стала доминирующей стараниями людей, которые не были заинтересованы в понимании того, как работает мозг или что такое интеллект.
Популярная пресса не понимала различий. Газеты, журналы и телевизионные научные программы представляли нейронные сети «мозгоподобными», или работающими по тем же принципам, что и мозг. В отличие от ИИ, где все должно было быть запрограммировано, нейронные сети обучались на примерах, что казалось более интеллектуальным. Наиболее
Позвольте привести вам аналогию, чтоб показать, как далеки были нейронные сети от реального мозга. Вообразите, что вместо того, чтоб пытаться понять, как работает мозг, мы попытаемся понять, как работает цифровая вычислительная машина. Через годы изучения мы откроем, что все в компьютере состоит из транзисторов. В компьютере есть сотни миллионов транзисторов и они соединены между собой определенным сложным образом. Но мы не понимаем, как работает компьютер или почему транзисторы соединены именно так. Итак, однажды мы решаем соединить всего лишь несколько транзисторов, чтоб увидеть, что происходит. Вот смотрите, мы обнаружили, что несколько транзисторов, когда соединяются вместе определенным образом, становятся усилителем! Слабый сигнал, поданный на один конец, усиливается на другом конце (подобным образом делают усилители в радиоприемниках и телевизорах). Это важное открытие, и немедленно вырастает индустрия, выпускающая транзисторные радиоприемники, телевизоры и другие электронные приборы на транзисторных усилителях. Все это хорошо, но это ничего не говорит нам о том, как работает компьютер. Хотя и усилитель и компьютер сделаны из транзисторов, они не имеют почти ничего общего. Точно так же и реальный мозг и трехслойная нейронная сеть построены из нейронов, но не имеют почти ничего общего.
Летом 1987 я получил опыт, который еще больше охладил мой и так невысокий энтузиазм относительно нейронных сетей. Я пришел на конференцию по нейронным сетям, где я увидел презентацию, устроенную компанией, называемой Nestor. Nestor пыталась продать приложение на нейронной сети для распознавания рукописных символов на подложке. Она предлагала лицензию на программу за один миллион долларов. Это привлекло мое внимание. Хотя Nestor провела улучшение алгоритма ее нейронной сети и рекламировала ее как еще один большой прорыв, я чувствовал, что проблема распознавания рукописных символов могла бы быть решена более простым, более традиционным путем. Я пришел домой той ночью, размышляя о проблеме, и за два дня разработал распознаватель рукописных символов который был быстрым, маленьким и гибким. Мое решение не использовало нейронную сеть и оно работало совершенно не так, как мозг. Хотя эта конференция разожгла мой интерес в разработке компьютеров со стилусом (в конечном счете приведший к проекту PalmPilot десять лет спустя), это также убедило меня, что нейронные сети были не таким уж большим улучшением по сравнению с традиционными методами. Распознаватель рукописных символов, который я создал, пригодился в конечном счете для системы текстового ввода, названной Graffiti, использованной в первых сериях продукции Palm. Я думаю, компания Nestor ушла из бизнеса.
Слишком много для простых нейронных сетей. Большинство их возможностей легко воспроизводились другими методами и в итоге шумиха в СМИ спала. Наконец, исследователи нейронных сетей перестали объявлять свои модели интеллектуальными. Ведь это были очень простые нейронные сети и делали гораздо меньше, чем ИИ-программы. Я не хочу оставить у вас впечатление, что все нейронные сети являются простыми трехслойными. Некоторые исследователи продолжали изучать нейронные сети различных конфигураций. Сегодня термин нейронные сети используется для описания различных множеств моделей, некоторые из них являются биологически более точными, некоторые — нет. Но почти ни одна из них не является попыткой охватить полностью функции или архитектуру неокортекса.
По моему мнению, большинство фундаментальных проблем с большинством нейронных сетей — это особенности, которые они разделяют с ИИ-программами. И те и другие обременены тем, что фокусируются на поведении. Называют ли они это поведение «ответами», «паттернами» или «выходными данными», и ИИ и нейронные сети полагают, что интеллект заключается в поведении, которое программа или нейронная сеть демонстрирует после обработки заданных входных данных. Наиболее важным атрибутом компьютерной программы или нейронной сети является то, выдает ли она правильные или желаемые результаты. Как навязано Аланом Тьюрингом, интеллект эквивалентен поведению.