Чтение онлайн

на главную

Жанры

Шрифт:

Если все предыдущие работы по машинному переводу стремились игнорировать значение, полагая, что ЭВМ недоступно «понимание» смысла текста, то в работах Кембриджской группы акцент делался именно на перевод значения. Ведь его-то передача и является целью всякого перевода с языка на язык. Сделать же этот перевод по смыслу помог знаменитый тезаурус Роджета.

Перевод с помощью тезауруса происходит не так, как обычный человеческий или стандартный машинный перевод. Это перевод не отдельных слов или фраз. Переводятся целые абзацы. Вначале строится единая «формула смысла» данного абзаца, причем смысл фраз, входящих в него, кодируется номерами тезауруса. Затем для полученной «формулы» смысла находятся соответствующие «формулы смысла» того языка, на который переводится текст.

Работы подобного рода ведутся не только в Англии, но и в Италии, в Миланском центре кибернетики и лингвистики, а также в нашей стране. Несколько различаясь в деталях, методика везде едина: выявление своего рода «атомов смысла», семантических множителей, из которых слагается значение отдельных «молекул», слов языка.

Подобные семантические множители применялись, как вы помните, в информационном языке, созданном учеными из Кливленда (Кливлендский семантический код). Но там задача была проще: из набора элементарных понятий формировались более сложные термины. Речь шла именно о терминологии, а не о языке со всеми его оттенками смыслов и значений слов. Здесь же задача, так сказать, на порядок сложнее.

Кембриджская группа пользовалась тезаурусом Роджета. К глубокому сожалению, такого словаря для русского языка до сих пор никто не составил. Правда, сейчас в нашей стране создается не менее интересный словарь, значение которого для машинного перевода трудно переоценить.

Словарь этот — толково-комбинаторный. В нем приводятся все сочетания русских слов, смыслы которых образуют новый, невыводимый из их сложения смысл. Например, проливной дождь, грибной дождь, косой дождь, слепой дождь и т. д. Если в обычных словарях разъясняется смысл отдельного слова, то в новом словаре толкуются словосочетания.

Работа по созданию такого словаря требует очень много труда. Ведь число различных русских слов равно сотням тысяч. А сколько же различных словосочетаний, имеющих «третий смысл», может быть в нашем языке! Вероятно, их не меньше, а гораздо больше отдельных слов и достигает миллиона. Составление словаря продлится не один год, а то и не один десяток лет (в настоящее время удалось зафиксировать сочетания двухсот слов, так что вся работа еще впереди). Поэтому сейчас исследователи стремятся выявить наиболее общие смысловые множители русского языка. С их помощью они надеются определить своеобразную «геометрию смысла», законам которой подчиняется и наш язык, и, по всей видимости, любые другие языки, так как любое содержание, высказанное на одном языке, может быть передано средствами любого языка (опыт переводчиков убедительно это доказывает: стихи Пушкина понимает и «друг степей калмык», и финн, и эвенк, и граждане США, ФРГ, Мексики и т. д.).

Приведем образец одного из параметров смысла, который удалось выявить в русском языке. Условно он кодируется как Magn, от латинского magnus, то есть высокий, главный, большой, обширный и т. п. Параметр этот определяет слова, имеющие значения высокой степени. Точнее, наш Magn определяет тот или иной оттенок смысла слова, к которому он относится. Возьмем, например, слово друг. Друг может быть близкий, верный, большой, до гробовой доски, сердечный, закадычный, испытанный, старый… Синонимы? Разумеется, нет. Мой старый друг отличается от сердечного друга и от друга до гробовой доски. Но чем, собственно говоря, отличается?

Вот тут-то и начинается наша «геометрия смысла», определение в языке тех координат, которые позволяют нам в нашей жизненной практике считать друга Виталия закадычным, друга Евгения сердечным, а друга Володю испытанным. Как же выявить эти координаты? Очевидно, необходимо обратиться к носителям смысла, носителям языка, то есть к живым людям. И к текстам, которые пишутся на русском языке и понятны этим людям.

Вот какие оттенки удалось выявить в русском языке исследователям из лаборатории машинного перевода при Московском государственном педагогическом институте иностранных языков имени Мориса Тореза. Прежде всего «Magn вообще» делится на три подкласса. Первый — нулевой — подчеркивает значение слова, к которому он относится, вне зависимости от субъекта или объекта. Ограбление может быть дерзким или крупным, любить можно горячо или страстно. Второй подкласс подчеркивает усиление, относящееся к субъекту. Выражение «бежать быстро» нейтрально, оно относится к нулевому подклассу. А вот выражение «бежать изо всех сил» указывает на то, что бегущий изо всех сил старается использовать все свои возможности при беге (и тем не менее, как бы мы с вами ни старались бежать изо всех сил, бегущий Валерий Борзов нас легко опередит, хотя он будет бежать не изо всех сил, а просто быстро!).

Третий подкласс, в отличие от предыдущего, относится не к субъекту, а к объекту. Уничтожение может быть массовым, или тотальным; любовь — всеобъемлющей, капитуляция — полной, авторитет — общепризнанным, горе — народным, а враг — жестоким.

Однако в зависимости от степени или меры внутри каждого подкласса можно выделить несколько категорий или элементарных смыслов. Это — очень, большое количество, активность, длительность, выделение в своем классе. Чтобы каждый человек, владеющий русским языком, смог понять то, что формулируется на языке терминов (но термины тоже опираются на языковую интуицию носителей языка, именно она помогает нам понимать друг друга безо всяких лингвистических теорий), приведем несколько примеров.

«Очень» указывает на высокую степень того или иного признака предмета, но без сравнения его с другими предметами, которые обладают теми же признаками. Здоровье может быть крепким, и дружить можно крепко, а интересоваться— глубоко. Вторая категория — «большое количество» — указывает на увеличение объема. Выбор может быть широким, информация — обширной, ограбление — групповым, вред — огромным. Третья — «активность» — связана с интенсивностью того или иного процесса. Работать с душой можно и не активно, а вот работать не покладая рук — это значит трудиться активно. Выражение «огромная энергия» подчеркивает количество этой энергии, а «кипучая энергия» — ее активность.

Категорию «длительность» легко понять, если в качестве примера привести выражения «продолжительные аплодисменты», «старая дружба», «смеяться до упаду», «любовь до гроба», «древние традиции» и т. п. Наконец, последняя рубрика — «выделение в своем классе» — указывает на то, что смысл выделяется из такой же смысловой группы особым подчеркиванием: оборудование бывает уникальное, урожай — рекордным, красота — необыкновенной и бежать можно изо всех сил…

ЯП, МП, ИЯ

Вероятно, теперь вы и сами поняли, как трудно, а порой просто невозможно описать в терминах, понятных ЭВМ, всю нашу сложную и нелинейную систему значений. И тем не менее система существует, иначе человек не смог бы понимать человека и ни один ребенок не смог бы обучиться родному языку, не говоря уже об иностранных.

Что же получается в итоге? Человек, решив передать машинам механическую работу, обнаружил, что, казалось бы, самые обыденные дела, вроде разговора, требуют таких сложных алгоритмов, таких тонкостей, о которых не догадывались даже лучшие умы прошлых веков.

Популярные книги

Отец моего жениха

Салах Алайна
Любовные романы:
современные любовные романы
7.79
рейтинг книги
Отец моего жениха

Бывшая жена драконьего военачальника

Найт Алекс
2. Мир Разлома
Любовные романы:
любовно-фантастические романы
5.00
рейтинг книги
Бывшая жена драконьего военачальника

Измена. Верни мне мою жизнь

Томченко Анна
Любовные романы:
современные любовные романы
5.00
рейтинг книги
Измена. Верни мне мою жизнь

Скрываясь в тени

Мазуров Дмитрий
2. Теневой путь
Фантастика:
боевая фантастика
7.84
рейтинг книги
Скрываясь в тени

Законы Рода. Том 4

Flow Ascold
4. Граф Берестьев
Фантастика:
юмористическое фэнтези
аниме
5.00
рейтинг книги
Законы Рода. Том 4

Кодекс Крови. Книга II

Борзых М.
2. РОС: Кодекс Крови
Фантастика:
фэнтези
попаданцы
аниме
5.00
рейтинг книги
Кодекс Крови. Книга II

Идеальный мир для Лекаря 14

Сапфир Олег
14. Лекарь
Фантастика:
юмористическое фэнтези
попаданцы
аниме
5.00
рейтинг книги
Идеальный мир для Лекаря 14

Измена. Он все еще любит!

Скай Рин
Любовные романы:
современные любовные романы
6.00
рейтинг книги
Измена. Он все еще любит!

Темный Патриарх Светлого Рода 4

Лисицин Евгений
4. Темный Патриарх Светлого Рода
Фантастика:
фэнтези
юмористическое фэнтези
аниме
5.00
рейтинг книги
Темный Патриарх Светлого Рода 4

Ученик

Первухин Андрей Евгеньевич
1. Ученик
Фантастика:
фэнтези
6.20
рейтинг книги
Ученик

Кротовский, не начинайте

Парсиев Дмитрий
2. РОС: Изнанка Империи
Фантастика:
городское фэнтези
попаданцы
альтернативная история
5.00
рейтинг книги
Кротовский, не начинайте

Дело Чести

Щукин Иван
5. Жизни Архимага
Фантастика:
городское фэнтези
попаданцы
аниме
5.00
рейтинг книги
Дело Чести

Горькие ягодки

Вайз Мариэлла
Любовные романы:
современные любовные романы
7.44
рейтинг книги
Горькие ягодки

Чиновникъ Особых поручений

Кулаков Алексей Иванович
6. Александр Агренев
Фантастика:
попаданцы
альтернативная история
5.00
рейтинг книги
Чиновникъ Особых поручений