Фреймы для представления знаний
Шрифт:
КОНКРЕТИЗАЦИЯ. Когда мы смотрим в определенном направлении, то, во-первых, в соответствии с информацией активного фрейма ожидаем увидеть определенные визуальные черты в определенных зрительных областях, соответствующих данным GSF, и, во-вторых, на самом деле видим их там. Поэтому естественно предложить такую теорию зрительного восприятия (первого порядка), в которой каждый маркер каждого терминала фактически задает некоторый класс визуальных демонов - "признаков" так же, как и предполагаемое местоположение соответствующего узла в GSF. В такой системе наблюдатель может быть тоже представлен как объект и это позволит ему "увидеть" себя из разных мест в качестве полноправного элемента сцены. При наличии всего этого довольно легко получить информацию,
5.3. Совершенствование системы
В нашей первой формулировке предполагалось, что терминалы визуальных фреймов связаны некоторым образом с узлами каркаса GSF. В этой связи возникает вопрос: почему бы не отказаться от всей идеи создания системы визуальных фреймов и не построить трехмерные предметные фреймы, которые непосредственно трансформировались бы в определенные пространственные позиции? В этом случае предметный фрейм почти без всяких ухищрений мог бы представлять трехмерную символьную структуру, а GSF-система автоматически порождать различные видовые фреймы для любого объекта.
Для систем, ориентированных на ЭВМ, это могло бы принести хорошие результаты, но для психологической модели породило бы слишком много серьезных проблем: каким образом можно справиться с трансформациями, поворотами и изменениями масштаба; как следует проводить переориентацию субструктур и др. Для моделирования поворотов первое и весьма несовершенное решение может состоять в том, чтобы каждый объект характеризовался небольшим числом стандартных видов с указанием различных размеров и ориентации. Прежде чем отвергать эту идею, отметим, что она может быть весьма полезной для представления некоторых видов действий, а также при моделировании действий на их предварительных этапах.
Поскольку, однако, образ любого предмета базируется на опыте его использования в различных ситуациях, требуется, по всей видимости, некоторый более общий тип операций, основанных на трансформациях. Представление изменений в местоположении и масштабе может быть выполнено на основе следующей промежуточной структуры: каждый предметный фрейм следует включить в некоторый пригодный для изменения местоположения "портативный" мини-GSF, который можно поворачивать и присоединять к любому узлу глобального GSF с соответствующими "примечаниями", указывающими, каким образом трансформирован исходный образ.
Наличие такой структуры влечет за собой не просто усложнение самой операции встраивания. Оно требует наличия в GSF "однородных структур"; это позволит упорядочить прежние, полезные, но идиосинкразические преувеличения, касаемые всего того, что расположено вблизи основного пространства, и потому нам более всего знакомого. Как бы привлекательна ни была подобная модель, мне не верится, что она реально существует в механизмах человеческого восприятия. Люди не очень хорошо представляют себе различные видоизменения сцен; я цитировал высказывания У.Хогарта о том, что в этих вопросах требуется весьма значительная тренировка, приводил наблюдения Ж.Пиаже, свидетельствующие, что необходимая компетенция появляется у детей только на втором десятилетии их умственного развития.
Итак, у нас имеется ряд теоретических механизмов пространственного видения. Я не буду выделять какой-либо из них и тем более называть его "теорией". Дело здесь совсем не в моих взглядах на эти вещи, а в важности того положения, что каждый индивидуум, очевидно, развивается с помощью последовательных все более и более усложняющихся механизмов. Нам следует уяснить, какие механизмы восприятия будут достаточны для различных уровней манипуляции зрительными образами; только после этого можно ожидать появления теории, совместимой с отмеченной концепцией развития. Следует также позаботиться и о том, чтобы располагать значительно более полной и точной психологической картиной, указывающей, как же в действительности используются пространственно-визуальные образы.
Некоторые читатели могут поинтересоваться, почему, подойдя столь близко к вопросам создания трехмерного аналогового механизма, не сделать это некоторым более простым, изящным и систематизированным способом. Такое предложение весьма естественно, но следует заметить, что из тех, кто стремился найти практическое решение подобного типа, еще никто не продвинулся дальше первых и несовершенных гештальт-моделей. Можно себе представить также и нейронную структуру несимвольной трехмерной системы, однако, проблемы построения на ее основе предполагаемых образов твердых тел вновь заставят нас решать те же нетривиальные с вычислительной точки зрения и в основе своей символьные вопросы. Поэтому мне представляется неизбежным создание некоторого аналога рассмотренного ранее видового перечня, а это ставит под сомнение саму цель организации промежуточной аналоговой пространственной модели.
5.4. Эволюция
Теория фреймов предполагает наличие большого числа разнообразных механизмов для манипуляции визуальными и символьными образами. Я не думаю, что большинство этих механизмов может возникнуть в процессе самоорганизации системы; скорее, они зависят от того, что было заложено в систему с самого начала. Какие этапы в эволюционном развитии способствовали появлению подобной первоосновы? Приведенные ниже доводы показывают, что совершенствованию фреймо-представлений в целом, видимо, способствовали требования пространственного зрительного восприятия.
На ранних стадиях эволюционного развития узловые моменты были, видимо, связаны с совершенствованием детекторов отдельных визуальных черт, что диктовалось необходимостью в удовлетворении первых жизненных потребностей (питание, воспроизводство, самооборона). По мере того, как все более сложными становились зрительная и двигательная системы, росли требования к правильному установлению отношений между видимыми предметами и их местонахождением во внешнем мире, т. е. между предметами и теми позициями, которые можно достигнуть или к которым можно подойти. Особо нужными становились те преобразования, которые позволяли бы компенсировать изменения в своем собственном местоположении. Это было важно, например, на охоте или в каких-то иных критических условиях. На охоте или во время полета определенным преимуществом обладает тот, кто способен координировать информацию, получаемую во время своего движения; если даже видение все еще базируется на последовательном распознавании простых визуальных черт, то и в этом случае способность к правильному объединению различных признаков, замеченных в разное время, предоставляет субъекту определенные преимущества.
Простое, линейное, горизонтальное упорядочение визуальных черт позволяет создать большое число полезных схем "распознавания". Еще большего можно достигнуть, если пользоваться данными, получаемыми, во-первых, в процессе движения объекта относительно наблюдателя и, во-вторых, как результат изучения двигательного параллакса. Вследствие этого нам нужно заниматься как схемами распознавания на базе согласования линейных фреймов с отдельными частями упорядоченных совокупностей, так и схемами объединения для выработки и развития представлений (пусть даже несовершенных) об окружаюем нас мире. Не следует думать, что мы сразу получим глобальную картину мира; вначале мы будем располагать эгоцентрическими полярными представлениями, основанными на связях между парами различных объектов или между объектом и каким-либо опорным направлением, скажем, направлением на солнце. На ранних этапах, по-видимому, еще не должны существовать усложненные механизмы для анализа связей типа "фигура-фон" и построения трехмерных сцен. Мне не известны какие-либо серьезные доказательства того, что живые существа, помимо человека, могут вырабатывать реальные представления о том, как устроен наш мир, и, хотя по поведению отдельных животных это можно было бы предположить, таким фактам можно дать более простое толкование.