Чтение онлайн

на главную

Жанры

Шрифт:

Словарь Роджета при многочисленных своих переизданиях не раз и перерабатывался. Но общая схема его не менялась, добавлялись лишь новые слова и понятия. Между тем этой схемой невозможно охватить необыкновенно расширившуюся в нашем веке сферу науки и техники (напомним, что Роджет жил более ста лет назад). Вот почему, составляя современные тезаурусы, ученые стремятся избежать ограниченности словаря Роджета.

Наиболее полным словарем такого типа считается идеологический словарь немецкого языка, составленный Францем Дорнзайфом. В нем уже не шесть, как у Роджета, а двадцать основных категорий, каждая из которых делится на несколько десятков подклассов. Подклассов может быть от десяти до девяноста, но зато они являются последней рубрикой. В словаре Дорнзайфа нет подподклассов, излишне усложнявших тезаурус Роджета. (Так, первый класс Роджета абстрактные отношения делился на 1.1. Бытие. 1.1.1. Абстрактное. 1.1.1.1. Бытие. 1.1.1.2. Небытие. 1.1.2. Конкретное. 1.1.2.1. Вещественность. 1.1.2.2. Невещественность и т. д. Нетрудно запутаться во всех этих рядах единичек, точек и двоек.)

Сразу после заглавного слова, опять-таки в отличие от тезауруса Роджета, даются ссылки на другие классы и подклассы, что очень удобно для работы со словарем. Вот как выглядит самая краткая из словарных статей класса под номером тринадцать (Знак, Сообщение, Язык): 13.17. Значение, (см. 9.44. Значимость. 12.31. Понимать. 13.44. Объяснение. 13.53. Перевод. 14.12. Указатель слов). Это значит. Значит, Хочу сказать. Именно. Итак. В этом смысле. Собственно. Буквально. Выражать. Значить. Свидетельствовать. Означать. Обозначить. Иметь целью. Намекать. Извещать. Показывать. Иметь в виду. Относиться к. Служить для. Покрывать. Семантически. Семасиологически. Выражение. Значение. Содержание. Дух. Понимание. Значение слова. Смысл слова. «Синоним». Наука о значении. Семантика. Семасиология.

В словаре Дорнзайфа приведена классификация царства животных и растений, что создана современной наукой, дана систематика минералов, разработанная геологией, и систематика болезней, принятая медициной. При переиздании этот тезаурус пополняется новой лексикой (так, в последнее издание введены слова спутник, водородная бомба и т. д.). И все-таки как бы ни был полон словарь Дорнзайфа, он не в состоянии охватить всей поистине необозримой терминологии, что существует в современной науке и технике. Да и отношения между смыслами слов слишком общи для того, чтобы можно было вести направленный поиск информации по ним. Вот почему с начала шестидесятых годов в различных странах мира создаются специальные тезаурусы, цель которых — охватить терминологию той или иной области науки и техники. И не просто охватить, но и служить путеводителем в поисках научно-технической информации.

В наши дни созданы десятки тезаурусов в самых различных сферах. Есть тезаурус Евроатома, тезаурус терминов по целлюлозе и бумаге, химико-технологический тезаурус, тезаурус по металлургии и т. д. Принципы их построения совпадают с принципами классических тезаурусов-словарей. Они, как говорят специалисты по информатике, предназначены как для нахождения разных способов выражения одной и той же мысли, так и для оптимизации решения информационно-поисковых задач. Только, в отличие от словарей Роджета и Дорнзайфа, специализированные тезаурусы стремятся не к всеобщему охвату значений, а к детальному и углубленному охвату терминологии той или иной области науки и техники.

Как наполняют сокровищницу?

Как составляются тезаурусы?

Роджет ничего не знал и, разумеется, не мог знать, каких результатов достигнут науки, занимающиеся проблемой смысла, но он интуитивно понял основные принципы составления тезаурусов: сначала собираются слова из текстов или различных словарей. Затем слова эти выстраиваются по алфавиту, а после из них образуются определение группы, связанные по смыслу.

Какой может быть эта смысловая связь? Во-первых, одно и то же значение можно выразить с помощью разных слов или оборотов. Вполне понятно, что все синонимы будут объединены. Во-вторых, смыслы слов могут быть полностью противоположны (как антонимы типа холодный — горячий, мертвый — живой и т. п.) В-третьих, смысл одного слова может включать в себя смысл другого, или даже многих слов, например значение слова человек включает в себя наименования сотен различных национальностей нашей планеты. Смысловые связи между словами могут строиться по типу причина — следствие или часть — целое. Наконец значения слов между собой связаны самыми различными ассоциациями. Причем именно проблема ассоциаций является наиболее трудно разрешимой задачей при построении того или иного тезауруса.

Специалистам в данной области науки нетрудно выделить термины, которыми эта наука пользуется. Сложнее построить иерархию из слов-терминов по смыслу. Однако и эта задача разрешима логическим путем. Можно разграничить смысл слов и словосочетаний, которые образуют новые значения. Например, термины скорость бурения и бурение скоростное — это не синонимы, они имеют совершенно разные значения, так же как дюнный песок и песчаная дюна. Но специалисты по информатике с успехом ликвидируют подобного рода случаи (в первом случае бурение является аспектом, а во втором — атрибутом; в сочетании песчаная дюна песок — вещественная составляющая, а в сочетании дюнный песок — причина образования дюны).

С ассоциациями дело обстоит много сложней. Ибо здесь действуют законы не двузначной, а многозначной логики.

В тезаурусах группируются, например, понятия ранение — несчастные случаи — диагноз — медицина патология — терапия или чернила — краски — печатание — письмо. Интуитивно нам понятно, что объединение этих слов оправдано. Но попробуйте-ка доказать его путем формальной логики, и вы убедитесь, что это далеко не так просто, как на первый взгляд кажется. А ведь такие связи существуют не только между обычными словами языка, но и научными терминами.

Еще в 1942 году американский исследователь А. Л. Болдуин попытался внести количественные меры в изучение смысловых связей между словами. Он подсчитал совместную встречаемость слов в письмах, написанных одной женщиной, и показал, что частоты их могут быть указателями настроений этой женщины, круга ее интересов и т. п. С тех пор предложено несколько десятков формул, по которым можно вычислять смысловые связи слов.

Применяются для выявления этих связей и электронные вычислительные машины.

Конечно, как замечает один из специалистов по информатике — Р. М. Нидхем, «нельзя ожидать, что в результате нескольких часов работы ЭВМ. будет получено нечто, что могло бы сразу же заменить интуицию и труд ученого (который все равно необходим при выборе единиц анализа и интерпретации результатов). На что мы можем надеяться — так это на то, что выявятся группы слов, ранее не замеченные, но потенциально возможные».

Тезаурусы составляются учеными в «союзе» с машиной.

Сначала группа специалистов подчеркивает термины в данной области знания. Затем тексты вводятся в ЭВМ, которая выдает эти слова в исходной форме, то есть в именительном падеже, единственном числе и т. п. Потом специалисты разбивают на участки смысловое «поле», внутри этих участков производят более мелкое деление, а полученную схему оформляют в виде анкеты.

Анкета заполняется специалистами по каждому термину, а затем она поступает в ЭВМ, которая объединяет все термины, имеющие одинаковые признаки. И, наконец, человек составляет из них тезаурус.

Семантические множители

Нельзя ли использовать тезаурусы в качестве языка-посредника при машинном переводе? Этой мыслью задались английские ученые Кембриджской лингвистической группы.

В 1959 году один из крупнейших авторитетов в области машинного перевода, Бар-Хиллел, заявил, что высококачественный перевод с помощью ЭВМ принципиально невозможен. Ибо в нашем языке есть такая многозначность слов, которую нельзя ликвидировать, не обращаясь к внешнему миру, к внеязыковой, или, как говорят ученые, экстралингвистической ситуации, машине недоступной. Бар-Хиллел привел образец подобного рода принципиально непереводимой фразы… И в том же году сотрудники Кембриджской группы добились правильного машинного перевода этой фразы!

Популярные книги

Отец моего жениха

Салах Алайна
Любовные романы:
современные любовные романы
7.79
рейтинг книги
Отец моего жениха

Бывшая жена драконьего военачальника

Найт Алекс
2. Мир Разлома
Любовные романы:
любовно-фантастические романы
5.00
рейтинг книги
Бывшая жена драконьего военачальника

Измена. Верни мне мою жизнь

Томченко Анна
Любовные романы:
современные любовные романы
5.00
рейтинг книги
Измена. Верни мне мою жизнь

Скрываясь в тени

Мазуров Дмитрий
2. Теневой путь
Фантастика:
боевая фантастика
7.84
рейтинг книги
Скрываясь в тени

Законы Рода. Том 4

Flow Ascold
4. Граф Берестьев
Фантастика:
юмористическое фэнтези
аниме
5.00
рейтинг книги
Законы Рода. Том 4

Кодекс Крови. Книга II

Борзых М.
2. РОС: Кодекс Крови
Фантастика:
фэнтези
попаданцы
аниме
5.00
рейтинг книги
Кодекс Крови. Книга II

Идеальный мир для Лекаря 14

Сапфир Олег
14. Лекарь
Фантастика:
юмористическое фэнтези
попаданцы
аниме
5.00
рейтинг книги
Идеальный мир для Лекаря 14

Измена. Он все еще любит!

Скай Рин
Любовные романы:
современные любовные романы
6.00
рейтинг книги
Измена. Он все еще любит!

Темный Патриарх Светлого Рода 4

Лисицин Евгений
4. Темный Патриарх Светлого Рода
Фантастика:
фэнтези
юмористическое фэнтези
аниме
5.00
рейтинг книги
Темный Патриарх Светлого Рода 4

Ученик

Первухин Андрей Евгеньевич
1. Ученик
Фантастика:
фэнтези
6.20
рейтинг книги
Ученик

Кротовский, не начинайте

Парсиев Дмитрий
2. РОС: Изнанка Империи
Фантастика:
городское фэнтези
попаданцы
альтернативная история
5.00
рейтинг книги
Кротовский, не начинайте

Дело Чести

Щукин Иван
5. Жизни Архимага
Фантастика:
городское фэнтези
попаданцы
аниме
5.00
рейтинг книги
Дело Чести

Горькие ягодки

Вайз Мариэлла
Любовные романы:
современные любовные романы
7.44
рейтинг книги
Горькие ягодки

Чиновникъ Особых поручений

Кулаков Алексей Иванович
6. Александр Агренев
Фантастика:
попаданцы
альтернативная история
5.00
рейтинг книги
Чиновникъ Особых поручений