Звуки и знаки
Шрифт:
В качестве языка-посредника предлагались самые распространенные языки мира, например английский или русский. Были проекты использовать какой-либо из искусственных международных языков, вроде эсперанто (ныне разработано несколько сотен подобных языков-посредников). Ленинградский лингвист Н. Д. Андреев предложил включать в язык-посредник только самые типичные, самые частые грамматические правила и слова, общие большинству языков мира. Такой язык-посредник будет представлять некое статистическое среднее этих языков. Есть и другая точка зрения: язык-посредник — это лишь система соответствий между различными языками мира, равнозначных друг другу слов и словосочетаний, а
Проблема создания языка-посредника оказалась тесно связанной с не менее важной проблемой специального языка для информационно-логических машин. Потребность в таких машинах с каждым годом ощущается все острее. Ибо с каждым годом неудержимо нарастает лавина информации, которая обрушивается на современного человека. Особенно это относится к науке и технике. В конце концов мы можем и не знать о том, как сыграли футболисты «Спартака» или сколько градусов мороза нынче в Антарктиде, — ущерб от этого невелик. А вот ущерб от незнания научных или технических новинок может исчисляться миллионами рублей и годами потраченного напрасно труда. Читать же всю литературу, выходящую даже по его прямой специальности, инженер или ученый в наши дни просто не в состоянии.
«Человек так же неспособен выучить наизусть все книги, хранящиеся в библиотеке, как и взвалить их себе на спину», — очень метко сказал академик В. М. Глушков. И не только выучить, но и просто-напросто прочитать. Число научно-технических журналов в наше время уже превысило пятьдесят тысяч и продолжает расти. Добавьте к ним еще семьдесят пять тысяч книг по науке и технике, издаваемых ежегодно. Плюс более трехсот тысяч описаний к авторским свидетельствам и патентам. Плюс сотни тысяч ежегодных научно-технических отчетов. И все это море информации кодируется не на одном, а на многих языках мира, причем и число таких языков науки и техники постоянно увеличивается. Если десяток лет назад было достаточно знания европейских языков, то теперь ценная научно-техническая информация публикуется на арабском, хинди, японском, турецком, персидском языках…
Обуздать Ниагару книг, потоки информации с помощью машин — машин-переводчиков или информационно-логических машин, хранящих в своей электронной памяти сведения из самых различных областей знания; создать общий язык для машины-переводчика и машины-информатора, некий универсальный код науки; научить электронный мозг не только хранить и выдавать по требованию информацию, но и обрабатывать ее, делать новые выводы, умозаключения, сопоставления; включить ЭВМ как мощнейший усилитель нашего мышления в цивилизацию XX столетия — таковы были грандиозные и благородные идеи, которыми руководствовались кибернетики, лингвисты, социологи, логики после первых опытов машинного перевода.
Казалось, время осуществления этих идей не так уж далеко. Пройдет каких-нибудь десять—двадцать лет, и начнется одна из самых крупных научно-технических революций в истории человечества…
Идея перевода с помощью ЭВМ была высказана в 1949 году. Со времени первого публичного перевода машиною с языка на язык прошло почти четверть века. Что же происходит в наши дни, в последней четверти двадцатого столетия?
…где ваша сладость?
Нет, кибернетическая революция, о которой мечтали четверть века назад и которую связывали прежде всего с машинным переводом и созданием информационно-логических машин, до сих пор не произошла. ЭВМ не переводят с языка на язык ни технические, ни тем более научные тексты. И хранителями знаний по-прежнему служат полки библиотек, а не блоки электронной памяти машин.
Более того. По свидетельству самих специалистов по машинному переводу, в наши дни свое основное внимание они сосредоточивают не на переводе, не на машине и не на алгоритме, формальной программе перевода!
В чем же тут дело? В порочности самой идеи, будто машина может переводить с языка на язык? Нет, идея эта подавляющим большинством ученых признается верной.
Тогда, быть может, все дело в технических трудностях: слишком маленькой оперативной памяти ЭВМ, недостаточной скорости, трудности ввода информации? Опять-таки псе эти проблемы не имеют отношения к реальным проблемам машинного перевода.
На исследования в этой области отпускались большие средства, над машинным переводом работали целые лаборатории. Случалось, что попадали в них люди, далекие от науки, видевшие в МП лишь легкую поживу. Но ведь в основном и в нашей стране, и за рубежом проблемой автоматического перевода занимались крупные ученые, причем и математики, и языковеды, и логики… И все-таки проблема эта не решена до сих пор.
Почему? Да потому что обманчивая простота механизации перевода вступила в совсем необманчивую сложность нашего человеческого языка. Чтобы сделать машинный перевод не проблемой, а реальностью, нужно сделать науку о языке достаточно точной, иначе нельзя перевести ее положения на формулировки программ ЭВМ. Вполне понятно, что ни десяти, ни двадцати лет не хватит для такой коренной перестройки. Да и вообще возможна ли она до конца — это тоже еще под вопросом.
Ну, а как же первые переводы с помощью машины? — спросит читатель. Ведь переводила же ЭВМ с русского на английский, с английского на русский и т. д.?
Переводила, это бесспорный факт. Но вот что она переводила — это другое дело. Есть такая шутка: «Черное, с крыльями, жужжит, жук — что это такое?» Ответ однозначен — жук, потому что он содержался в самом вопросе. Нечто подобное было и в первом опыте публичного машинного перевода, осуществленного в рекламных целях фирмой ИБМ. Текст был тщательным образом отпрепарирован, предельно упрощен. Правила грамматики также были элементарны. И словарный запас минимален.
Когда же стали увеличивать объем словаря, усложнять грамматику и пытаться перевести не препарированные, а подлинные тексты, перед исследователями стали задачи, неразрешимые на уровне современных знаний о языке. Проблем было сотни: слова, имеющие несколько значений, и слова-омонимы; грамматические правила и неизбежные в любом языке исключения из правил; многообразие не только слов, но и грамматических форм, В русском языке насчитывается сто пятьдесят семь различных глагольных окончаний, в немецком — триста пятьдесят четыре, а в языке аранта — около тысячи (правда, пока что аранта не имеют письменности и поэтому проблема машинного перевода для этого языка Австралии неактуальна).
Перечень подобного рода проблем можно было бы продолжить, но вам, пожалуй, ясна наша главная мысль: язык оказался слишком сложен для машины, а лингвистика — слишком «гуманитарна», чтобы изложить накопленные ею сведения о языке в виде формул и алгоритмов. Больше того, даже для информационно-логических машин, которые, казалось бы, должны иметь дело со строгими и однозначными терминами науки, по сей день не удалось найти приемлемого кода, языка-посредника между информацией, накопленной человечеством, и электронной памятью ЭВМ. А причина этого все та же: наш человеческий язык. Ведь именно на этом языке «закодирован» весь океан современной информации — научной, технической и просто житейской.