Алло, робот
Шрифт:
Программа, вложенная в «память» машины, должна учитывать грамматику языка, с которого переводится текст. Точно так же нужно учесть и грамматику языка, на который переводится текст; конечно же, нужен англо-русский словарь, если переводят с английского на русский язык, и т. п.
Все это — и правила грамматики, и словарь — записывается в виде чисел. В последовательность чисел преобразуется и текст, который нужно переводить. Сделать
Первый опыт машинного перевода в нашей стране был проделан под руководством Д. Ю. Панова. Машина БЭСМ переводила с английского языка на русский. Вот как выглядели некоторые английские слова в числовой записи:
the = 212608 (21 — t, 26 —h, 08—е);
method = 110821262830 (11 —m, 08 —e, 21—t, 26 —h, 28 —o, 30 —d).
Встретив в тексте, который нужно переводить, последовательность чисел 212608 110821262830, машина легко может сопоставить их с записанными в «памяти» такими же последовательностями чисел и дать русский перевод — «метод».
А как быть с записью грамматики? Например, в английском языке есть артикли, а в русском их нет. Зато в русском языке есть показатель рода, отсутствующий в английском. В других языках, например полинезийских, вообще отсутствуют грамматические формы склонения,
спряжения, рода — их передают служебные слова, а не грамматические окончания.
Поэтому в словарь для машинного перевода рядом со словами ставят целый ряд их дополнительных признаков. Например, указывают род, склонение, обозначает ли данное слово одушевленный предмет. Вот часть из такого англо-русского машинного словаря:
31. Alternate — чередоваться (глагол I спряжения).
32. Altogether — вообще (наречие).
33. Among — среди (предлог-+-родительный падеж).
Конечно, в «памяти» машины эти грамматические категории также обозначаются числами: существительному соответствует число 1, глаголу — 2, и так далее.
Поиск слов в словаре машина делает с огромной скоростью. И точность ее действия весьма велика. С грамматикой дело сложней. Например, при переводе с английского машина «выдала» такую русскую фразу: «Так что хочем ли знать будущий путь Юпитера в небесах или путь электрона в электронном микроскопе». А при переводе с французского на русский: «Мы могем сделать».
Грамматика может хромать и у машины! Впрочем, машина здесь не виновата. Просто составители программы не включили нужное правило, вернее, исключение из правила. В самом деле, если фразы «я прыгаю», «я бегаю» во множественном числе будут «мы прыгаем», «мы бегаем», то почему бы «я могу» не стало во множественном числе «мы могем»? Машина так и сделала, подобно тому как иногда поступают и маленькие дети, обучающиеся языку. И дети, и электронная машина-переводчик добросовестно и последовательно соблюдают все правила языка и только потом узнают, что, кроме правил, есть еще и исключения из них.
ТЬМА-ТЬМУЩАЯ
Почти одновременно с опытом машинного перевода на БЭСМ был проделан
Первый машинный перевод, например, был сделан с помощью словаря из 250 слов. И лишь шесть грамматических правил «управляли» этими словами.
Одно и то же слово может иметь множество значений. В опытах по машинному переводу брались только те слова, которые имели одно, в крайнем случае, два значения. Но здесь возникает трудность — какие из значений выбрать? Машина переводит в полном смысле слова «автоматически», не понимая смысла текста. Какое, например, русское слово выбрать, переводя английское слово «instance», — «инстанция» или «пример»?
Для этого машина начинает «просматривать» окружение слова. Если перед «instance» стоит предлог «for», значит, нужно переводить сразу два слова: «for instance» — «для примера», «например», а не «инстанция».
Ну, а если таких грамматических и синтаксических показателей в окружении многозначного слова нет? Как быть тогда?
Приходится ориентироваться на другие признаки.
Например, английское «solution» может иметь два значения — «решение» и «раствор». Машина просматривает всю фразу, в которой встречалось это слово. Если в ней встречается слово «вопрос» или слово «проблема», то тогда она переводит «solution» русским словом «решение». Если же слов «вопрос» или «проблема» в фразе нет, то дает перевод «раствор».
Решение, конечно, грубое, но на первых порах пригодно и оно. Зато другие языковые тонкости и трудности даже приблизительно, в грубой форме преодолеть гораздо сложнее. Например, такую.
«Un joly papillon» по-французски значит «красивая бабочка». Можно сказать и несколько иначе: «Un papillon joly» — «бабочка красивая». Смысл фразы не изменится от перестановки слов. Но не всегда. Так, «un vrai conte» в переводе на русский язык — «настоящая сказка». A «un conte vrai» — «истинное происшествие», то есть с противоположным по смыслу значением. Как научить машину, переводящую с французского на русский, в одних случаях учитывать значимую перестановку слов, а в других — нет?
Еще пример. Лишь в одном случае из полутора тысяч существительное стоит после прилагательного. Казалось бы, порядок строгий и однозначный. Но только для научной речи. В обычном русском языке мы то и дело ставим прилагательное после существительного. «Друг дорогой», «тоска черная» и тому подобные обороты очень часты в нашей речи. Значит, правило «прилагательное стоит перед существительным» для перевода обычной прозы не годится.
А как быть с синонимами — словами, разными по звучанию, но одинаковыми по смыслу? Возьмем хотя бы одно простое слово «много». Тот же смысл в нашем языке имеют обороты и слова: «обильно», «видимо-невидимо», «по горло», «полон рот», «множество», «бездна», «уйма», «громада», «кипа», «целый короб», «целый лес», «прорва», «пропасть», «тьма», «тьма-тьмущая», «неисчислимое множество», «орава», «плеяда», «куча», «ряд», «сила», «масса» и т. д. и т. п. Как учесть эти слова?