Чтение онлайн

на главную

Жанры

Шрифт:

И все-таки машины нужны для перевода! Современный мир, говорят ученые, сам по себе напоминает огромную переводческую машину, работающую со все увеличивающейся скоростью. Каждый день с печатных станков сходит около шестидесяти переведенных книг, открывается три или четыре международные встречи, выпускается на экран несколько дублированных фильмов; пишущие машинки печатают, а дикторы оглашают несчетное количество переведенных страниц; бесконечное число документов переводится в самом разнообразном виде с одних языков на другие.

Но для того, чтобы включить в гигантскую «переводческую машину», которой является наш современный мир с его несколькими тысячами языков, ЭВМ, мы должны прежде всего разобраться, хотя бы приблизительно, в работе нашей собственной «вычислительной машины» — мозга, причем под определенным углом зрения — лингвистическим. Не инженер, а лингвист должен найти формулы языка, алгоритмы нашего повседневного чуда — языка, которое предстает перед нами каждый день и каждый миг. Задача же эта необычайно сложна и трудна.

Причем на пути ученых встают трудности самого различного характера: технические, лингвистические, логические. Предположим, что нам удалось решить проблемы смысловых множителей, разложить любое слово на отдельные «атомы смысла», его составляющие. Сколько же слов понадобится вводить в память машины?

Мы уже говорили, что словари таких развитых языков, как русский или английский, включают около полумиллиона слов. Но ведь есть еще и так называемые фразеологизмы, непереводимые буквально выражения, идиомы. Их в языке много тысяч. Добавьте к ним также десятки тысяч специальных терминов, в словари литературного языка не вошедших. А такой развитой терминологией обладают все науки, будь то химия, медицина, электроника или сама лингвистика («Словарь лингвистических терминов» О. С. Ахмановой включает семь тысяч единиц, а в него вошли далеко не все термины современной науки о языке, например, нет в словаре ни «инженерной лингвистики», ни «нейролингвистики», то есть целых дисциплин, имеющих свою собственную терминологию!). Так что общее число слов будет, пожалуй, превышать миллион. А ведь к ним надо прибавить еще правила грамматики и программы, объем которых составит не менее трети машинной записи словаря!

Это, так сказать, трудность чисто техническая. Не за горами то время, когда ЭВМ будут обладать памятью, достаточно большой, чтобы вместить всю эту информацию. Но здесь встает следующая проблема — проблема времени. Для ввода одного слова в ЭВМ, снабженного всеми нужными признаками, смысловыми и грамматическими, необходим день работы одного исполнителя. Значит, чтобы ввести миллион слов в ЭВМ, нужен один миллион человеко-дней или тридцать лет работы коллектива, состоящего из ста человек.

Эта проблема, в свою очередь, порождает проблему, которую называют «парадоксом Ахиллеса и черепахи». Парадокс этот известен со времени античности: может ли быстроногий Ахиллес догнать черепаху, если в каждый конкретный момент времени черепаха также продвигается вперед? Если следовать правилам логики, Ахиллесу ее никогда не догнать! Не получится ли сходная ситуация и при машинном переводе: информация, заложенная в ЭВМ, будет устаревать к тому моменту, когда начнется практическое применение «электронного мозга?» Ведь слова, как известно, меняются со временем. И никакому Ахиллесу-роботу не догнать наш неспешный, но постоянно изменяющийся язык-черепаху…

Более того, слова не являются, строго говоря, отдельными изолированными единицами языка. Смысл их связан со смыслом других слов, все слова как бы прошиты незримыми нитями ассоциаций. Причем границы между этими связями нечетки, они как бы размыты. Приведем такой пример. В нашем языке есть группа прилагательных, относящихся к возрасту человека: детский, отроческий, юношеский, молодой, средних лет, пожилой, старый. Но попробуйте-ка четко и однозначно распределить смысл этих слов по строгой шкале лет, и вы убедитесь сами, насколько размыты границы между детским и отроческим, отроческим и юношеским, юношеским и молодым, молодым и средних лет, средних лет и пожилым, пожилым и старым у разных людей, в зависимости от их собственного возраста (вспомните журналиста из «Двенадцати стульев», считавшего стариком всякого, чей возраст превысил двадцать лет!).

Теория нечетких множеств — так называется новая область математики, одна из самых интересных и перспективных, которая родилась в связи с описанием языка. Ее аппарат начинает применяться и для машинного перевода, и для информационного поиска. А надежной точкой опоры становятся те холодные числа, данные статистики, о которых рассказывал наш первый очерк. И если первые опыты по машинному переводу были в полном смысле слова опытами, то в наши дни начинается промышленная эксплуатация МП.

Диалог продолжается…

Конечно, никто из ученых не пытается сейчас дать совершенный перевод с помощью машины, подобный переводу человеческому. И переводится не любой текст, а текст по какой-либо узкой специальности, например химии полимеров или низкотемпературной плазме. Но ведь именно такой подстрочный, так сказать, рабочий перевод текстов по специальности и необходим в первую очередь ученым, инженерам, техникам, работающим в той же химии полимеров или в области низкотемпературных плазм.

Первая в нашей стране промышленная эксплуатация МП была осуществлена в 1976 году в Чимкентском пединституте по заказу Института химии Академии наук Казахской ССР. ЭВМ системы «Минск» переводит английский текст длиной в тысячу слов, то есть около трех страниц, за двадцать — двадцать пять минут. И это, учитывая ввод текста в машину и вывод его из машины в виде отпечатанного русскими буквами перевода!

В конце 1977 года в Алмаатинском энергетическом институте проходила VII Всесоюзная конференция по генераторам низкотемпературной плазмы. Участвовали в ней и гости из других стран. Делегатам и гостям были вручены три компактные книжечки в красном переплете: англо-русский и русско-английский, французско-русский и русско-французский, немецко-русский и русско-немецкий словари-минимумы. Предназначены они для чтения научных текстов по плазме, а также для разговора с зарубежными коллегами. Автором же этих словарей была… вычислительная машина и, естественно, коллектив программистов и языковедов, составивших машинную программу. За три месяца ЭВМ проделала работу, на которую потребовалось бы несколько лет труда сектора научного учреждения.

Перед нами широкий лист бумаги. Вверху напечатан запрос: «Прошу определить общую тему документа». Далее следует французский текст статьи по технологии окраски. Внизу дается ответ на русском языке: «Документ относится к теме «электрофорез». Затем снова запрос: «Прошу дать машинный реферат документа». На него тут же дан развернутый ответ.

«В этом диалоге, казалось бы, нет ничего удивительного, — пишет профессор Р. Г. Пиотровский, руководитель группы «Статистика речи». — Именно таким образом сотни референтов-переводчиков ведут беседу со своими заказчиками. Однако приведенный текст представляет собой человеко-машинный диалог, в котором вопросы формулировал человек, а ответы на правильном русском языке без всякой подсказки выдавала машина. Учителями компьютера были языковеды, химики и математики из лаборатории инженерной лингвистики Ленинградского педагогического института имени А. И. Герцена и Кишиневского политехнического института».

Лишь совсем недавно человеческий мозг создал «мозг» электронный, вычислительные машины. На первых порах диалог человека с ЭВМ казался фантастикой. Затем настала пора радужных надежд и горьких разочарований. Но работа продолжается, продолжаются поиски подходов и методов, с помощью которых вычислительные машины включатся в человеческое общество и «электронный мозг» станет не просто чудо-счетчиком, по и надежным и верным помощником в тысяче других дел. Путь к этому — обучить машины человеческому языку.

Популярные книги

Отец моего жениха

Салах Алайна
Любовные романы:
современные любовные романы
7.79
рейтинг книги
Отец моего жениха

Бывшая жена драконьего военачальника

Найт Алекс
2. Мир Разлома
Любовные романы:
любовно-фантастические романы
5.00
рейтинг книги
Бывшая жена драконьего военачальника

Измена. Верни мне мою жизнь

Томченко Анна
Любовные романы:
современные любовные романы
5.00
рейтинг книги
Измена. Верни мне мою жизнь

Скрываясь в тени

Мазуров Дмитрий
2. Теневой путь
Фантастика:
боевая фантастика
7.84
рейтинг книги
Скрываясь в тени

Законы Рода. Том 4

Flow Ascold
4. Граф Берестьев
Фантастика:
юмористическое фэнтези
аниме
5.00
рейтинг книги
Законы Рода. Том 4

Кодекс Крови. Книга II

Борзых М.
2. РОС: Кодекс Крови
Фантастика:
фэнтези
попаданцы
аниме
5.00
рейтинг книги
Кодекс Крови. Книга II

Идеальный мир для Лекаря 14

Сапфир Олег
14. Лекарь
Фантастика:
юмористическое фэнтези
попаданцы
аниме
5.00
рейтинг книги
Идеальный мир для Лекаря 14

Измена. Он все еще любит!

Скай Рин
Любовные романы:
современные любовные романы
6.00
рейтинг книги
Измена. Он все еще любит!

Темный Патриарх Светлого Рода 4

Лисицин Евгений
4. Темный Патриарх Светлого Рода
Фантастика:
фэнтези
юмористическое фэнтези
аниме
5.00
рейтинг книги
Темный Патриарх Светлого Рода 4

Ученик

Первухин Андрей Евгеньевич
1. Ученик
Фантастика:
фэнтези
6.20
рейтинг книги
Ученик

Кротовский, не начинайте

Парсиев Дмитрий
2. РОС: Изнанка Империи
Фантастика:
городское фэнтези
попаданцы
альтернативная история
5.00
рейтинг книги
Кротовский, не начинайте

Дело Чести

Щукин Иван
5. Жизни Архимага
Фантастика:
городское фэнтези
попаданцы
аниме
5.00
рейтинг книги
Дело Чести

Горькие ягодки

Вайз Мариэлла
Любовные романы:
современные любовные романы
7.44
рейтинг книги
Горькие ягодки

Чиновникъ Особых поручений

Кулаков Алексей Иванович
6. Александр Агренев
Фантастика:
попаданцы
альтернативная история
5.00
рейтинг книги
Чиновникъ Особых поручений