Алло, робот
Шрифт:
Мысль о «всеобщем языке» с давних пор волнует многих людей. В самом деле, на земном шаре существует несколько тысяч различных языков. Чтобы преодолеть языковые барьеры, чтобы добиться взаимопонимания, сотням и тысячам людей приходится тратить драгоценное время на изучение чужого языка. Есть люди, владеющие сорока, пятьюдесятью, восемьюдесятью и более иностранными языками! И все же это лишь капля в многотысячном море языков.
Нельзя ли создать искусственным образом язык, который был бы понятен всем людям на Земле? Вспомогательный язык-посредник, на который любой человек может переходить при разговоре с иностранцами, к какой бы нации они ни принадлежали?
В настоящее время имеется почти полтысячи проектов всеобщего языка: «волапюк», «новиаль», «интерлингва»,
Оказывается, структура языка, его простота или трудность усвоения — не главное. Важнее другое — нужды общества, социальные причины. Японец или немец, турок или бразилец будет изучать сложный русский язык, а не простой эсперанто. Ведь техническая, научная, художественная литература издается на русском языке, а не на эсперанто. Точно так же поступают советские ученые и инженеры, изучая английский, французский, немецкий языки, очень сложный и трудный японский язык с его иероглифической письменностью. Химик и врач, металлург и математик, зная иностранные языки, могут и должны следить за текущей литературой по их специальности. А вся техническая, научная и тем более художественная литература, как мы уже сказали, выходит в свет не на искусственных, а на живых языках.
И все же идея всеобщего языка-посредника имеет смысл. Только не для людей, а для машин. В самом деле, иметь такой универсальный язык-посредник гораздо выгодней, чем составлять отдельные программы для машинного перевода с английского на русский, с немецкого на русский, с русского на немецкий и т. д. А чтобы перевести с немецкого на английский или с английского на немецкий, опять-таки нужна новая программа перевода, новый автоматический словарь. Добавится новый язык, допустим японский, нужны новые программы — японско-русская, английско-японская, русско-японская, нужны новые словари.
А ведь языков на свете несколько тысяч. Сколько же времени и сил отнимет составление программ и словарей!
Вот тут-то и нужен язык-посредник. Не эсперанто, разумеется, и не блая-зимондаль, а специальный язык-посредник для машин. Иностранный текст сначала переводится на этот язык. Затем с машинного языка-посредника можно переводить на любой другой язык мира.
Вспомните схему машинного перевода с английского на русский, которую мы приводили в начале главы: «ввод английского текста — анализ английского текста — синтез русского текста — выдача русского текста». С помощью языка-посредника не нужно составлять различных схем (а значит, и программ перевода) для разных языков. Схема получается единой, единая программа для любого языка:
«АТОМЫ СМЫСЛА»
Создать язык-посредник, конечно, очень трудно. Он должен вместить в себя все богатство нескольких тысяч языков, все грамматические формы, все падежи, суффиксы, приставки, формы единственного, множественного, двойственного и тройственного чисел.
Пока что такого удивительного языка-посредника для машинного перевода еще не существует. Но ученые разрабатывают различные проекты этого «всеобщего языка». Например,-создается «универсальная грамматика»: она должна показать самые общие законы, присущие всем языкам мира. Мы расскажем здесь лишь о наиболее увлекательной и многообещающей области машинного перевода. Это создание «языка смысла», с помощью которого ученые надеются научить машину понимать переводимый ею текст!
Как переводит человек с языка на язык? Разумеется, по смыслу. Поиск в словаре нужных слов — это важная, но отнюдь не главная часть перевода. И она, как вы сами
Решить эту, казалось бы, неразрешимую задачу помогают так называемые «смысловые множители».
«Паровоз», «пароход», «самолет», «вездеход», «вертолет»... Состав этих сложных слов ясен. Ясны и те «единицы смысла», из которых образуется их значение. Ну, а если взять не сложные слова, а простые? Можно ли в них найти «единицы смысла»? Или, может быть, значение отдельного слова (разумеется, простого, а не сложного) как раз и является тем самым «атомом смысла», из которого затем строятся «молекулы» сложных слов и целых предложений?
Этим вопросом занялись сотрудники лаборатории машинного перевода при Первом московском педагогическом институте иностранных языков. По их предположению, «атомом смысла», является не слово, а более мелкие единицы — «смысловые множители».
Вот как выявлялись эти «атомы смысла». Сначала брали два одинаковых по значению высказывания. Например, «он недомогает» и «он нехорошо себя чувствует».
Затем из этих фраз извлекали смысловые множители. Первый— «отрицание» (из слова «нехорошо»); второй — «положительность» (из того же слова); третий — «ощущение» (из слова «чувствовать»). Значение слова «недомогать» можно тогда выразить как сочетание трех смысловых множителей: «отрицание» — «положительность» — «ощущение».
Точно так же можно записывать смысл и других слов, и целых фраз, после того как извлечены другие смысловые множители, новые «атомы смысла». Например, слова «да», «конечно», «так», «верно», «истинно», «правильно», «ей-ей», «как же», «совершенно верно», «именно», «согласен» записываются одним семантическим множителем — «утверждение». Из одних и тех же смысловых множителей могут состоять не только слова, но и целые фразы.
Например, приведенные нами фразы: «он недомогает», «он нехорошо себя чувствует» и, кроме них, «плохо себя чувствует» — имеют одни и те же смысловые множители:
«отрицание» — «положительность» — «ощущение». «Он болеет»: «отрицание» — «положительность» — «ощущение»
(ведь болезнь — это и есть отрицание «хорошего чувствования»), «Он занемог» — те же множители, и т. д. Иногда число фраз, составленных из одних и тех же «атомов смысла», может доходить до четырехсот — настолько богат русский язык.
Зная «атомы смысла», машина-переводчик может анализировать текст, записывать его в виде единиц смысла. Затем мы можем дать ей команду записать этот же смысл, но уже в виде слов другого языка. Ведь основные «атомы смысла», вроде приводимых нами «отрицание» — «положительность» — «ощущение», во всех языках мира одни и те же. Подобно тому как бесконечное многообразие нашего мира строится из «горстки» атомов и молекул, бесконечное многообразие фраз и слов всех языков мира строится из небольшого количества «атомов смысла». Они-то и могут быть «словами» машинного языка-посредника.
Более того: осуществляя перевод с помощью смысловых множителей, машина, по существу, делает то же, что и человек-переводчик, — она переводит по смыслу!
Поиск «атомов смысла» только начат. Часть слов как русского, так и других языков мира потребует особой записи. Например, собственные имена, названия видов животных и растений, домашней утвари, вероятно, будут записываться не в виде смысловых множителей, а обозначаться номерами. Эти номера будут храниться в «памяти» машины.
Большие трудности доставят ученым и стилистические особенности речи. На языке смысловых множителей фразы «ничтожный человек», «маленький человек», «человечек», «ничтожество», «человек без способностей», «бездарность» будут записывать одними и теми же «атомами смысла». Но любому ясно, что это не совсем так — эмоциональная окраска придает словам и фразам различные оттенки смысла, увы, пока что невыразимые в «атомах смысла».