Алло, робот
Шрифт:
Под влиянием родителей и окружающих близких детский лепет превращается в человеческую речь. Русский ребенок заучивает «а», «о», «э» и другие звуки русского языка. Маленький англичанин заучивает «ти эйч», маленький бушмен — щелкающие звуки бушменской речи.
Первоначально, как мы уже говорили, в детском лепете можно найти почти все звуки речи любого языка. Но под влиянием взрослых, под влиянием коллектива остаются только нужные звуки, звуки того языка, на котором говорят окружающие. И этот язык становится родным.
Поток звуков речи непрерывен. Каждый язык как бы просеивает его сквозь «сито». Этим «ситом»
От 10 до 80 фонем — таковы пределы, в которых расположено число «атомов языка». Из этих «атомов» строятся затем «молекулы» — корни слов, частицы и другие значимые единицы языка, называемые морфемами. В любом языке мира их не больше двух тысяч.
Из морфем строятся слова: их число, как мы уже говорили, превышает десятки и сотни тысяч. А число возможных предложений, которые можно построить из этих тысяч слов, практически бесконечно.
Таким образом, из нескольких десятков «атомов»-фонем строится все неисчерпаемое богатство и разнообразие человеческой речи. И, чтобы воспринимать ее, человеческому мозгу не нужно хранить в своей памяти (да он и не смог бы сделать этого!) колоссальное количество особенностей речи. Достаточно, чтобы в «воспринимающем устройстве» хранились признаки фонем, «сито», через которое проходит поток звуков.
Точно так же, «по-человечески», предполагают ученые научить машину воспринимать звуковую речь.
ГОВОРЯЩИЕ МАШИНЫ
Вместо «эталонов слов», которые хранятся в машинной «памяти», в нее будут помещены «эталоны фонем». С ними-то и будет сопоставляться поток звуков речи. И даже не целых фонем, а их составных частей.
Мы называли фонемы «атомами языка». Но и атом состоит из более простых элементарных частиц: протонов, электронов, нейтронов. Почти точно так же и фонемы состоят из более мелких единиц.
Чем отличается звук «д» от звука «т»? Почему мы отличаем «дом» от «тома», «трава» от «дрова», «дот» от «тот»? Потому, что звук «д» произносится звонко, а «т» — глухо. Так же, благодаря звонкости или глухости, различаются «б» и «п», «с» и «з» в русском языке, да и во многих других языках мира. Значит, принцип «звонкость — глухость» будет одной «элементарной частицей», составляющей отдельные атомы-фонемы.
Звуки речи могут быть гласными или согласными. Об этом вы узнали еще в первых классах на уроках русского языка. Точно так же и во всех языках мира. Значит, найден еще один всеобщий признак, еще одна «элементарная частица».
Современной физике известно свыше 30 элементарных частиц. А лингвисты сумели найти во всех языках мира лишь 12 различительных признаков, «элементарных частиц» языка, из которых строятся фонемы. И если мы сумеем вложить в «память» машины эти признаки, она сможет «понимать по-человечески» на любом языке мира. Нетрудно сделать и обратную процедуру — научить машину выдавать ответы не на машинном языке чисел, а «по-человечески», в виде устной речи. Если мы сумеем научить ее слушать, то легко сможем научить и «разговаривать вслух».
Уже делаются первые опыты по созданию «говорящих машин». Задача усложняется тем, что человеческая речь несет не только смысловую информацию — информацию, которую нам дают «кодовые единицы», фонемы.
В
Наконец, по голосу мы можем судить даже о состоянии человека: сердится ли он или радуется, устал он или полон сил, здоров или болен. Короче говоря, количество информации, которое передается с помощью тембра голоса, громкости и интонации может быть очень велико. Ученые даже подсчитали, как соотносится количество смысловой, фонемной информации с общим количеством несмысловой.
При нормальном разговоре количество дополнительной, несмысловой информации, содержащейся в интонации, громкости, индивидуальных особенностях голоса равно примерно Зк от всей смысловой информации. При очень быстром разговоре, когда мы хотим как можно быстрее передать смысл сообщения, величина дополнительной, несмысловой информации резко уменьшается. Она равна лишь '/з смысловой.
Зато при медленном разговоре, когда есть возможность подчеркнуть то или иное слово интонацией, тембром голоса или другими выразительными средствами, несмысловая информация может в полтора раза превышать количество смысловой!
Как видите, дополнительные средства выразительности в языке могут нести даже большее количество информации, чем основные. К тому же эта несмысловая информация может изменить содержание всей смысловой. Например, когда мы говорим иронически: «Голова!» или «Здравствуйте!» Благодаря интонации совершенно меняется смысл восклицаний.
Учесть все особенности несмысловой информации, которую передает человеческая речь, очень трудно. На первых порах, очевидно, мы будем разговаривать с машинами ровным, бесстрастным голосом, отчетливо произнося слова, безо всякой скороговорки. Но и такой разговор вслух сулит поистине сказочные возможности.
Человек сможет обходиться без пультов, кнопок, ручек и рычагов для управления «умными машинами». Летчик не будет смотреть на приборы: автомат
сам доложит ему о курсе, скорости и высоте полета. Такие же «говорящие приборы» появятся и в диспетчерской комнате, и в кабине космического корабля. То, о чем ныне пишут фантасты, станет обычной житейской практикой.
Придет время, когда и особенности интонации смогут быть изучены с помощью чисел. Тогда автоматы смогут стенографировать и переводить устную речь с одного языка на другой. «Умные машины» смогут обучать правильным оборотам речи, произношению, богатству интонации.
«Сезам, отворись!» — говорил когда-то сказочный Али-Баба, и волшебная дверь открывалась. Точно так же открывалась она и для любого другого человека, который знал нужное слово.
G помощью кибернетики и точного языкознания эти чудеса арабской сказки могут быть превзойдены. Волшебная дверь будет открываться лишь тогда, когда голос хозяина произнесет заветные слова. Ведь каждый человек имеет свои индивидуальные особенности голоса, которые могут быть записаны в «память» машины. И машина сможет узнавать людей по их голосу!