Чтение онлайн

на главную

Жанры

Диалог с компьютером
Шрифт:

Дисгармония звучания и значения снижает вырази- t тельность слова, его общую воздействующую силу. Учитывая это обстоятельство, компьютер может подобрать слова с разной степенью выразительности в каждом кон- \ кретном случае. Скажем, компьютер вознамерился сообщить нам о каком-либо недочете, браке. В соответствующей понятийной группе он обнаруживает два синонима: изъян и дефект. Качественный ореол обоих слов отрицателен, но если у слова дефект фоносемантический ореол соответствует качественному (по звучанию это нечто «плохое, слабое, шершавое»),

то звучание слова изъян противоречит его значению (звучание «хорошее, нежное, красивое, безопасное, радостное»). Ясно, что слово дефект более полно и насыщенно выражает нужное значение. Поэтому, если нужно указать на небольшой недочет, компьютер может использовать слово изъян, а если речь идет о серьезном недостатке, о браке, более уместным будет слово дефект.

Согласитесь, что такого рода действия компьютера имитируют очень тонкие аспекты интеллектуального поведения человека.

Анализ семантического комплекса

До сих пор мы рассматривали действия компьютера в основном с отдельными семантическими аспектами слова, но в реальной речи все аспекты значения действуют совместно, в неразделимом единстве, поэтому придется обучать такому подходу и компьютер.

В принципе это можно сделать, собрав в единый комплекс все рассмотренные нами системы машинной переработки отдельных аспектов семантики слова. Общую схему работы такой комплексной системы семантического анализа слов можно представить себе в следующем виде.

Сначала все слова проходят систему обработки понятийного аспекта их значений, в результате чего компьютер проводит их грубую разбивку на понятийные группы, как это сделано в «Русском семантическом словаре». Затем каждая понятийная группа проходит качественный классификатор, и слова распределяются по более дробным группам в зависимости от их качественно-признаковых ореолов. Наконец, подключается система расчета фоносемантики, и компьютер наводит окончательный «семантический глянец», выявляя слова с различными типами ореольных взаимодействий.

Для примера рассмотрим результаты компьютерного анализа небольшой понятийной группы слов, взяв для описания ореолов всего три шкалы «хорошее — плохое», «сильное — слабое» и «быстрое — медленное».

«Понятийный классификатор» компьютера образовал следующую группу существительных с общей понятийной идеей «начало» (по «Русскому семантическому словарю) :

база, введение, вещество, идея, корень, материализм, металлургия, начало, основа, основание, первенство, первоклассник, передняя, подход, понедельник, постулат, почин, появление, право, предпосылка, премьера, прима, премьер, принцип, приоритет, природа, приход, причина, прототип, состязание, социализм, стержень, существо, философия, царь, чемпион, явление, январь.

Хотя все слова группы действительно объединены общей понятийной идеей, все же это довольно грубое объединение, явно требующее дальнейшей детализации. Между состязанием, металлургией и царем все же очень уж велика смысловая разница. Отдаленные связи, конечно, есть. Слово состязание компьютер поместил в этот список, потому что в ходе состязания определяется победитель, то есть первый среди соревнующихся. Металлургия — это, как указано в толковом словаре, «отрасль тяжелой промышленности, занимающаяся получением металлов из руд и первичной обработкой металлов». Упоминание «первичности» и дало основание компьютеру отнести слово в данную группу. Ну а царь, как и премьер, — главный, то есть первый человек в правительстве. И все же компьютер, разумеется, не смог бы эффективно оперировать словами группы без их дальнейшей семантической обработки.

Поэтому к работе подключаются сразу две программы дальнейшего семантического анализа — качественный и фоносемантический классификаторы. Первый разбивает слова на группы по сходству их качественно-признаковых ореолов, а второй выявляет отношения между

качественно-признаковыми и фоносемантическими ореолами слов. Результаты работы фоносемантического классификатора можно изобразить так: если ореолы слова находятся в соответствии, то после него ставится индекс С, если между ореолами обнаружено противоречие, слову приписывается индекс П, в случае неопределенных отношений между ореолами данное слово не маркируется.

Поскольку слов в списке немного, то при работе качественного классификатора не все возможные ореольные группы будут образованы, то есть часть выходов классификатора окажется пустой.

Приведем только те из них, которые заполнены словами.

1. Хорошее, сильное, быстрое: первенство, почин, прима, состязание, чемпион.

2. Хорошее, сильное: идея (С), материализм, начало (С), право, премьер, премьера, принцип, приоритет, природа, социализм, явление (С).

3. Хорошее, быстрое: первоклассник.

4. Сильное: металлургия.

5. Сильное, медленное: база (С), основа (С), основание (С), причина, стержень, философия (П).

6. Медленное: введение.

7. Плохое, сильное: царь (С).

8. Плохое: понедельник.

9. Нейтральная группа: вещество (С), корень (С), передняя, подход, постулат (С), появление, предпосылка, приход (С), прототип, существо (С), январь.

Как мы помним, трехуровневый классификатор имеет 27 выходов, здесь заполнено только 9. На некоторых оказалось по одному слову, другие собрали группы слов. Выходы с одиночными словами в данном случае выполняют «отсекающую» функцию: они выделяют слова, семантически наименее связанные с основной массой слов списка. Действительно, каждое из слов, попавших на выходы 3, 4, 6, 7 и 8, семантически специфично. Нейтральная группа (выход 9) похожа на кладовку — туда сваливают без разбора ненужные до поры до времени вещи. Для компьютера особенно важны группы слов, собравшиеся на значимых (не нейтральных) выходах классификатора. Именно эти группы — рабочий лексико-семан-тический фонд компьютера. Это как бы речевые ячейки языкового «сознания» машины. В них она ищет синонимические замены, с помощью слов этих, групп может выражать наиболее тонкие семантические оттенки в своей речи.

Обратите внимание на 1-ю группу — слова в ней подобраны на удивление точно и с явным эффектом «понимания» их смысла. То же самое наблюдается во 2-й и 5-й группах. Особенно тесна смысловая связь между словами 5-й, «философской», группы: это буквально набор контекстуальных синонимов, которые вполне могут встретиться как лексические варианты в конкретном тексте.

Три уровня качественной классификации — это, конечно, очень мало для практической работы компьютера с полученными группами, но возможности такой работы просматриваются уже и здесь. Скажем, на вопрос, чем является для науки философия, компьютер «самостоятельно» мог бы ответить, что это база, основа, основание науки. В своем ответе компьютер учел все три аспекта семантики — понятийный, поскольку слова взяты из одной понятийной группы, качественно-признаковый, поскольку синонимы подыскивались в группе слов с общими качественными ореолами, и, наконец, фоносемантический, так как из группы выбраны слова с индексом С — наиболее точные и выразительные.

А если спросить компьютер, какое понятие он может противопоставить социализму, он ответит: «Социализм и царь противостоят друг другу как совершенно несовместимые понятия». В этом случае компьютер «рассуждал» так: слово социализм находится в группе, образовавшейся на выходе «хорошее и сильное», этому выходу противопоставлен тот, который собрал «плохие и сильные» слова, а это выход 7, где помещено слово царь; значит, социализм и царь в данном случае оценочно противопоставлены.

Ясно, что при работе с большими массивами слов и с использованием многоуровневых классификаторов семантические имитационные возможности компьютера резко возрастут.

Поделиться:
Популярные книги

На границе империй. Том 9. Часть 3

INDIGO
16. Фортуна дама переменчивая
Фантастика:
космическая фантастика
попаданцы
5.00
рейтинг книги
На границе империй. Том 9. Часть 3

Не ангел хранитель

Рам Янка
Любовные романы:
современные любовные романы
6.60
рейтинг книги
Не ангел хранитель

Право налево

Зика Натаэль
Любовные романы:
современные любовные романы
8.38
рейтинг книги
Право налево

Студент из прошлого тысячелетия

Еслер Андрей
2. Соприкосновение миров
Фантастика:
героическая фантастика
попаданцы
аниме
5.00
рейтинг книги
Студент из прошлого тысячелетия

Первый среди равных. Книга III

Бор Жорж
3. Первый среди Равных
Фантастика:
попаданцы
аниме
фэнтези
6.00
рейтинг книги
Первый среди равных. Книга III

Фараон

Распопов Дмитрий Викторович
1. Фараон
Фантастика:
попаданцы
альтернативная история
5.00
рейтинг книги
Фараон

Инквизитор Тьмы

Шмаков Алексей Семенович
1. Инквизитор Тьмы
Фантастика:
попаданцы
альтернативная история
аниме
5.00
рейтинг книги
Инквизитор Тьмы

Барон устанавливает правила

Ренгач Евгений
6. Закон сильного
Старинная литература:
прочая старинная литература
5.00
рейтинг книги
Барон устанавливает правила

Сопротивляйся мне

Вечная Ольга
3. Порочная власть
Любовные романы:
современные любовные романы
эро литература
6.00
рейтинг книги
Сопротивляйся мне

Сам себе властелин 2

Горбов Александр Михайлович
2. Сам себе властелин
Фантастика:
фэнтези
юмористическая фантастика
6.64
рейтинг книги
Сам себе властелин 2

Возвышение Меркурия. Книга 3

Кронос Александр
3. Меркурий
Фантастика:
попаданцы
аниме
5.00
рейтинг книги
Возвышение Меркурия. Книга 3

Повелитель механического легиона. Том VI

Лисицин Евгений
6. Повелитель механического легиона
Фантастика:
технофэнтези
аниме
фэнтези
5.00
рейтинг книги
Повелитель механического легиона. Том VI

Личник

Валериев Игорь
3. Ермак
Фантастика:
альтернативная история
6.33
рейтинг книги
Личник

Наследница долины Рейн

Арниева Юлия
Любовные романы:
любовно-фантастические романы
5.00
рейтинг книги
Наследница долины Рейн