Вторая эра машин. Работа, прогресс и процветание в эпоху новейших технологий
Шрифт:
Однако его сообщение в блоге Gizmodo завершалось предостережением: «Все это звучит довольно круто. Однако в случае Siri нужно помнить одно важное слово – „если“ это работает как надо». [27] После выпуска этой программы многие пользователи обнаружили, что этот вроде бы разумный личный ассистент работал недостаточно хорошо. Он не понимал, что они говорят, постоянно просил уточнений, давал странные или неточные ответы или отделывался фразами вроде: «Прошу прощения, но прямо сейчас я не могу обрабатывать новые запросы. Попробуйте связаться со мной чуть позже». Аналитик Джин Мюнстер смог составить целый список вопросов, с ответами на которые у Siri возникали проблемы:
27
Там же.
• На вопрос «Где Элвис похоронен? (Where is Elvis buried?)» программа отвечала: «Я не могу ответить на этот
• «Когда вышел фильм „Белоснежка“?» Вместо ответа программа предложила осуществить поиск кинотеатров через Yelp.
• «Когда в следующий раз комета Галлея? (When is the next Halley’s Comet?)» Программа ответила: «У вас нет встреч с человеком по имени Галлей» (You have no meetings matching Halley’s).
• «Я хочу отправиться на озеро Супериор (Lake Superior)». Программа выдала инструкции по проезду к офису компании Lake Superior X-ray. [28]
О странных и неудовлетворительных ответах Siri стало известно довольно быстро, однако сила технологий все же неоспорима. Технологии приходят вам на помощь именно тогда, когда нужно. Мы убедились в этом на своем собственном примере во время поездки на беспилотном автомобиле Google. После встречи в Сан-Франциско мы сели в арендованный автомобиль, чтобы доехать до штаб-квартиры Google в городе Маунтин-Вью. У нас был с собой портативный GPS– навигатор, однако мы его не включили, поскольку посчитали, что и так знаем, как добраться до следующей точки путешествия.
28
“Minneapolis Street Test: Google Gets a B+, Apple’s Siri Gets a D – Apple 2.0 – Fortune Tech”, CNNMoney,(по состоянию на 23 июня 2013 г.).
На самом деле мы, конечно, не знали. Столкнувшись с эшеровским лабиринтом шоссе, съездов и улиц, мы начали плутать, раздражаясь все больше и больше от неспособности найти нужную дорогу. В тот момент, когда наша встреча в Google, весь проект по созданию этой книги и наши профессиональные отношения были уже на грани краха, Эрик достал свой телефон и попросил Siri показать, как добраться до шоссе 101 в направлении на юг. Телефон ответил моментально и безошибочно: экран превратился в карту, на которой были показаны наше местоположение и стрелки, направлявшие на нужную нам развилку.
Конечно, мы могли бы включить наш портативный GPS– навигатор и подождать, пока он создаст план нашего маршрута, но нам не хотелось обмениваться информацией таким образом. Мы хотели задать вопрос, а затем услышать и увидеть ответ (в форме карты). Siri смогла пообщаться с нами именно на том языке, на котором мы хотели. Созданный в 2004 году обзор всех исследований в области автоматического распознавания речи (важнейшей части обработки естественного языка) за последнюю половину столетия начинался с признания о том, что «распознавание машинами речи на том же уровне, на котором это делают люди, представляется нам труднодостижимой целью», однако менее чем через 10 лет все основные элементы этой цели уже были достигнуты. Apple и другие компании сделали технологию обработки естественного языка доступной для сотен миллионов людей через их мобильные телефоны. [29] По замечанию Тома Митчелла, возглавляющего кафедру машинного обучения в университете Карнеги – Меллон, «мы находимся в начале десятилетнего периода, в течение которого перейдем от компьютеров, которые неспособны понимать наш язык, к компьютерам, которые понимают его почти на том же уровне, что и мы». [30]
29
Ning Xiang and Rendell Torres, “Architectural Acoustics and Signal Processing in Acoustics: Topical meeting on Spatial and Binaural evaluation of Performing Arts Spaces I: Measurement Techniques and Binaural and Interaural Modeling”, 2004, http://scitation.aip.org/getpdf/servlet/GetPDFServlet?filetype=pdf&id=JASmAn000116000004.
30
Цит. по John Markoff, “Armies of Expensive Lawyers, replaced by Cheaper Software”, New York Times, 4 марта 2011 г., http://www.nytimes.com/2011/03/05/science/05legal.html?pagewanted=all&_r=0.
Цифровая беглость: за дело берется Вавилонская рыбка
Программы по обработке естественного языка еще далеки от совершенства, а компьютеры не так хороши в сложной коммуникации, как люди, однако дело стабильно идет на лад. А в таких областях, как перевод с одного языка на другой, уже были достигнуты серьезные достижения: хотя коммуникационные способности компьютеров не настолько глубоки, как у обычного человека, они намного шире.
Человек, говорящий более чем на одном языке, обычно способен перевести фразу с одного на другой с достаточно высокой точностью. С другой стороны, автоматические сервисы, хотя и производят некоторое впечатление, редко делают свою работу без ошибок. Даже если вы плохо владеете французским языком, то не исключено, что вы можете
Скорее всего, вам не удастся столь же успешно перевести это (или любое другое) предложение на венгерский, арабский, китайский, русский, норвежский, малайский, идиш, суахили, эсперанто или любой другой из 63 языков, помимо французского, с которыми работает сервис Google Translate. Однако Google при этом все же попытается перевести текст с любого из этих языков на любой другой непосредственно в веб-интерфейсе, мгновенно и без каких-либо затрат. [31] Приложение Translate для смартфонов позволяет пользователям общаться с телефоном более чем на 15 из этих языков. В ответ они получают устный перевод на паре десятков других языков. Мы почти с полной уверенностью можем сказать, что на такое неспособен даже самый многоязычный человек в мире.
31
“Spring Cleaning for some of our APIs”, The Official Google Code Blog, 3 июня 2011 г., http://googlecode.blogspot.com/2011/05/spring-cleaning-for-some-of-our-apis.html.
На протяжении многих лет различные способы моментального перевода обычно описывались только в научной фантастике (один из самых замечательных примеров – Вавилонская рыбка из книги «Автостопом по Галактике», странное создание, которое человек может запихнуть себе в ухо, после чего начинает понимать речь на любом языке). [32] Google Translate и другие аналогичные сервисы осуществляют эти мечты. Как минимум один из таких сервисов уже сейчас используется для обслуживания международных клиентов. Компания Lionbridge, предоставляющая переводческие услуги, разработала вместе с IBM онлайн-приложение GeoFluent, способное мгновенно переводить чаты между клиентами и специалистами по решению различных проблем, которые говорят на разных языках. В ходе первичных испытаний около 90 процентов пользователей GeoFluent сообщили, что качество перевода было достаточно хорошим для решения их задач. [33]
32
Douglas Adams, The Hitchhiker’s Guide to the Galaxy (New York: Random House, 2007), стр. 54.
33
По материалам личного разговора с Сарой Буда, вице-президентом Lionbridge, об отношениях с инвесторами и корпоративном развитии, сентябрь 2011 г.
Преимущества человека в «Своей игре»!
Компьютеры настолько хорошо научились совмещать анализ закономерностей со сложной коммуникацией, что порой побеждают людей на их собственном поле. В 2011 году одним из участников игрового шоу Jeopardy! был не человек, а суперкомпьютер по имени Watson. Он был разработан компанией IBM специально для участия в этой игре (и получил свое имя в честь легендарного руководителя компании IBM Томаса Уотсона-старшего). Игра Jeopardy! (ее российский лицензионный аналог называется «Своя игра») дебютировала в 1964 году, а к 2012-му стала пятой по популярности синдицированной (то есть переданной для трансляции сразу нескольким вещателям) телепрограммой в Америке. [34]
34
“Top 10 TV ratings / Top 10 TvShows / Nielsen”, Evernote, 18 августа 2012 г.,(по состоянию на 23 июня 2013 г.).
Обычно каждый выпуск программы, в ходе которой ведущий Алекс Требек задает простые вопросы на различные темы, а участники стараются опередить других, дав правильный ответ, смотрит почти семь миллионов человек. [35]
Долговечность и популярность шоу связаны с тем, что его легко понять, но в него невероятно сложно играть. Почти каждый человек знает ответы на некоторые вопросы в каждом отдельно взятом эпизоде, однако мало кто знает ответы на почти все из них. Вопросы охватывают широкий диапазон тем, и участники заранее не знают, какие темы им достанутся. Им нужно быть одновременно быстрыми, дерзкими и точными: быстрыми – поскольку они соревнуются друг с другом за шанс ответить на каждый вопрос; дерзкими – поскольку им приходится отвечать на множество вопросов, причем довольно сложных, для того чтобы собрать достаточно денег для победы; и точными – поскольку у них вычитаются деньги за каждый неверный ответ.
35
Точнее говоря, Требек зачитывает ответ, а участники должны сформулировать вопрос, на который может быть дан этот ответ.