Чтение онлайн

на главную

Жанры

Шрифт:

Для того чтобы облегчить поиск публикаций по органической химии с помощью машин, разработан информационный язык, получивший название «ИЯ стандартных фраз». Специфика этого языка в том, что он имеет дело не с простыми текстами, представляющими линейную последовательность букв, а с химическими формулами. Формулы же органической химии, как известно, структурны, они располагаются в двумерном пространстве. Поэтому пришлось разрабатывать особый код, с помощью которого двумерные формулы превращались в линейную последовательность цифр.

Наиболее сложный и четкий по своей логике ИЯ был разработан в нашей стране группой сотрудников Института кибернетики АН УССР под руководством Э. Ф. Скороходько. Язык этот получил наименование БИТ. Термины на нем могут быть представлены в трех вариантах: в виде формул, графиков и таблиц. Первый вариант записи наиболее экономичен, второй — нагляден, третий—пригоден для машинной обработки текста (киевские кибернетики разработали специальные программы, которые позволяют ЭВМ переводить текст с естественного языка на искусственный язык БИТ).

В основе этого информационного языка лежит мысль о том, что структура внешнего мира состоит из единиц двух видов: предметов и их отношений. Эти первичные единицы порождают производные — ситуации. Предметы обозначаются символом X, который может иметь различные индексы вверху и внизу. Так, термин «изображение» получит символ Х0 024, где верхний нолик означает, что мы имеем дело с элементарным понятием, а нижнее число показывает номер данного термина в списке. Более узкий термин, например «полупроводниковый триод», закодируется в виде символа Х2301.

Отношения между предметами — релатемы — кодируются латинской буквой R, которой также приписаны верхние и нижние индексы. Ситуации на языке БИТ записываются в виде предложений, состоящих из соединения символов X и R, имеющих различные индексы. Словарь терминов в этом языке разработан для текстов по радиоэлектронике, но, судя по всему, БИТ может пополняться новыми терминами и понятиями.

Естественно, что появление нового предмета требует нового индекса. Для отношений это не обязательно: производные релатемы могут образовываться сочетанием основных (например, сочетание релатемы «быть местом» и «иметь субъект» образует релатему «быть местом действия»).

Информационный язык БИТ — это усовершенствованный вариант так называемого Кливлендского семантического кода. Код разрабатывался группой американских ученых в городе Кливленд для механизированного поиска информации по металлургии. Алфавитом кода служат не только латинские буквы, но и специальные знаки и числа от 000 до 999. Каждое знаменательное слово, то есть дескриптор, записывается в виде сочетания трех согласных букв. После второй согласной оставляется пробел, который заполняется какой-либо гласной. Вставная буква указывает на определенное отношение, например: А — это «принадлежность, быть предметом»; О — «производить» и т. п. Из простых дескрипторов строятся составные, более сложные. Так, для записи слова телефон используются дескрипторы прибор, передача, электричество, информация (ведь телефон — это и есть прибор, предназначенный для передачи информации при помощи электричества).

Таким образом, мы имеем дело с набором элементарных понятий, или, как назвали их создатели Кливлендского семантического кода, смысловыми множителями — по аналогии с физическими базисными величинами (хотя, конечно, никакого умножения тут не происходит, лишь из кирпичиков простых дескрипторов строятся более сложные).

Многие специалисты по информатике считают, что в первую очередь надо создавать не всеобщие ИЯ, а специализированные, нацеленные на какую-то одну область знания. Таков, например, язык «Коран», предназначенный для поиска сведений, содержащихся в священной книге мусульман. Словарь ИЯ «Коран» содержит около пятисот терминов, набитых на перфокарты с указанием, в каком месте священной книги встретилось то или иное слово. Любой отрывок из писания мусульман может быть закодирован на языке «Коран» в виде условных символов и ключевых слов: так, d1обозначает Аллаха, d4— ангелов, d5,— демонов, d6— джиннов и т. д.

Специальные ИЯ создаются также для записи неязыковой информации. Например, для поиска картографических материалов, различных объектов, интересных для археологов (ваз, монет, мозаики, орнамента, оружия), для классификации товарных знаков по изображению, цвету, геометрической форме.

Тезаурус — это сокровище!

Мы начали наш рассказ с Раймонда Луллия, жившего в эпоху, весьма далекую от эры ЭВМ, однако предвосхитившего идею механического «усилителя разума». В том же XIII веке была выпущена книга, давшая название теме, которая является самой актуальной в создании информационных языков (а те, в свою очередь, — ключ к решению основной задачи информатики). Речь идет о создании так называемых тезаурусов.

Термин этот происходит от греческого слова, имеющего значение: сокровище, богатство, клад, запас. От греков это слово попало и в латынь, где стало обозначать сокровищницу, кладовую, склад. Флорентиец Брунетто Латини, живший в XIII веке, назвал «Книгой о сокровище» свою систематизированную энциклопедию знаний той эпохи. В XVI столетии отец и сын Этьенны выпустили толковый словарь языка древних греков, озаглавленный «Сокровищница греческого языка». Этот труд не утратил своего значения и поныне.

А вслед за тем выходят тезаурусы-словари, которые являются своего рода «перевернутыми» толковыми словарями. В толковых словарях вроде знаменитого словаря Даля слова расположены в алфавитном порядке. Значения их раскрываются примерами, взятыми из обыденной речи, из художественной литературы, из народных говоров. В тезаурусах слова и выражения систематизированы не по написанию или произношению, а по их значению. Недаром же тезаурусы называют еще идеологическими словарями.

В 1808 году был выпущен тезаурус санскрита. Все слова в нем объединялись в классы: Небеса, Погода, Время, Добродетели, Пороки, Ад и т. д. А те, в свою очередь, делились на подклассы (например, Ад подразделялся на Ад как таковой, Души умерших, Страдание, Боль).

«Нельзя ли подобным образом рассортировать по смыслам слова не мертвого санскрита или древнегреческого, а живого английского языка?» — такой мыслью задался П. М. Роджет. Ведь подобный словарь принес бы большую пользу в смысла «облегчения выражения понятий», а также «при написании сочинений».,

Роджет выпустил свой «Тезаурус английских слов и фраз» в 1852 году. С той поры его словарь выдержал около сотни изданий. Тезаурус Роджета делит значения всех слов, входящих в него, на шесть основных категорий: абстрактные отношения, пространство, материя, разум, воля, чувственные и моральные силы. Категории эти подразделяются на двадцать четыре подкласса, те — на восемьдесят шесть подподклассов и т. д. Всего тезаурус включает тысячу различных категорий, по которым и разносятся значения слов. Если слово имеет несколько значений, то оно попадает в несколько рубрик. Например, слово кпо! входит в группу 45 (связь), а также 59 (запутанность), 72 (группа), 219 (пересечение), 249 (округлять), 321 (плотность), 704 (трудность) и т. д.

Популярные книги

Отец моего жениха

Салах Алайна
Любовные романы:
современные любовные романы
7.79
рейтинг книги
Отец моего жениха

Бывшая жена драконьего военачальника

Найт Алекс
2. Мир Разлома
Любовные романы:
любовно-фантастические романы
5.00
рейтинг книги
Бывшая жена драконьего военачальника

Измена. Верни мне мою жизнь

Томченко Анна
Любовные романы:
современные любовные романы
5.00
рейтинг книги
Измена. Верни мне мою жизнь

Скрываясь в тени

Мазуров Дмитрий
2. Теневой путь
Фантастика:
боевая фантастика
7.84
рейтинг книги
Скрываясь в тени

Законы Рода. Том 4

Flow Ascold
4. Граф Берестьев
Фантастика:
юмористическое фэнтези
аниме
5.00
рейтинг книги
Законы Рода. Том 4

Кодекс Крови. Книга II

Борзых М.
2. РОС: Кодекс Крови
Фантастика:
фэнтези
попаданцы
аниме
5.00
рейтинг книги
Кодекс Крови. Книга II

Идеальный мир для Лекаря 14

Сапфир Олег
14. Лекарь
Фантастика:
юмористическое фэнтези
попаданцы
аниме
5.00
рейтинг книги
Идеальный мир для Лекаря 14

Измена. Он все еще любит!

Скай Рин
Любовные романы:
современные любовные романы
6.00
рейтинг книги
Измена. Он все еще любит!

Темный Патриарх Светлого Рода 4

Лисицин Евгений
4. Темный Патриарх Светлого Рода
Фантастика:
фэнтези
юмористическое фэнтези
аниме
5.00
рейтинг книги
Темный Патриарх Светлого Рода 4

Ученик

Первухин Андрей Евгеньевич
1. Ученик
Фантастика:
фэнтези
6.20
рейтинг книги
Ученик

Кротовский, не начинайте

Парсиев Дмитрий
2. РОС: Изнанка Империи
Фантастика:
городское фэнтези
попаданцы
альтернативная история
5.00
рейтинг книги
Кротовский, не начинайте

Дело Чести

Щукин Иван
5. Жизни Архимага
Фантастика:
городское фэнтези
попаданцы
аниме
5.00
рейтинг книги
Дело Чести

Горькие ягодки

Вайз Мариэлла
Любовные романы:
современные любовные романы
7.44
рейтинг книги
Горькие ягодки

Чиновникъ Особых поручений

Кулаков Алексей Иванович
6. Александр Агренев
Фантастика:
попаданцы
альтернативная история
5.00
рейтинг книги
Чиновникъ Особых поручений