Baidu. Как китайский поисковик с помощью искусственного интеллекта обыграл Google
Шрифт:
Современные карты собирают всевозможные географические данные, что позволяет расширить число интеллектуальных проектов. Технология навигации высокой четкости достигает точности до сантиметра. И поэтому была задействована в разработке беспилотных автомобилей. В 2016 году на Всемирном интернет-конгрессе беспилотный автомобиль Baidu был публично протестирован и введен в эксплуатацию в городе Ву. Опыт проходил в условиях движения города. Машина проехала 3,16 километра, 3 светофора и несколько поворотов. Она не только не сталкивалась с людьми, которые перемещались в различных направлениях, но и учитывала погодные условия – дождь, туман, дымку. Полученный результат не уступает успехам коллег из Кремниевой долины, которые проводили подобные испытания в Северной Америке. В рамках разработки беспилотного автомобиля эти успехи незначительны. Но для развития искусственного
ИИ не упал с неба. Ему предшествовали десятилетия работы над компьютерными сетевыми технологиями и технологиями обработки данных, а также сбор необходимой информации о человеческой жизни и деятельности. Baidu Search и Baidu Maps являются материальным результатом процесса развития.
ИИ не миф и не шутка
Сегодня в средствах массовой информации появляется множество новостей о роботах и масса шуток. Например, в недавнем выпуске новостей был сюжет о роботе, который ранит людей. На самом деле это был робот, который упал с платформы. Существует также мнение, что роботы – это игрушки. Но если взглянуть на ситуацию с точки зрения науки, обнаружится, что ИИ – не миф и не шутка. Он – результат человеческого труда. И он не нуждается ни в поклонении, ни в страхе.
Ученые в области искусственного интеллекта часто скромно описывают свои достижения. Ву Цзюнь, бывший инженер Google, рассказывал, что в 2003 году, когда он и его компаньоны работали над повышением точности вводимых ключевых слов в поисковике, основной проблемой стал подбор синонимов для удовлетворения запроса пользователя. Если компьютер не выдает необходимого результата при поиске информации, то человек будет продолжать подбирать ключевые слова. Но в этой ситуации пользователь фактически делает всю работу самостоятельно. Нужно было усовершенствовать технологию, чтобы ускорить процесс поиска и улучшить механизм обратной связи. Инженер сказал: «Может показаться, что у нас нет соответствующих технологий для решения проблемы. На протяжении многих лет пользователи сами подбирали ключевые слова для поиска. Но в 2003 году во время долгих выходных в честь Дня Независимости Соединенных Штатов мы приостановили работу одного из пяти крупнейших центров обработки данных. И за 4 дня сделали обработку каждого ключевого слова. По сути, это был метод исчерпывания. Мы выявили сочетания слов, которые часто использовались для того, чтобы сузить результат поиска. Теперь, когда поступает аналогичный запрос, система дает более точные результаты гораздо быстрее».
Чтобы идти в ногу со стратегией поиска, использующей метод исчерпывания, машинный перевод и другие области технической логики должны иметь сходства. В июне 2016 года на заседании бюро переводов Google активно обсуждалась статья в «Нью-Йорк Таймс», в которой сообщалось о результатах исследований в области машинного перевода, опубликованных Baidu. Высказывание Майка Шустера привело конференц-зал в чувство: «Да, Baidu выпустила новую статью. И такое чувство, что кто-то видит то, что происходит в наших стенах. Потому что все тезисы имеют аналогичную нашим структуру и результат». Баллы BLEU Baidu (оценка качества искуственного перевода в сравнении с человевеческим) в основном совпадали с результатами, достигнутыми Google во внутренних тестах в феврале и марте. Квок Вей Ле, ведущий исследователь Google, не был расстроен. Он пришел к выводу, что исследования двигаются в правильном направлении. «Их система очень похожа на нашу», – прошептал он.
Квок Вей Ле – докторант Ву Энда. И он, вероятно, не знает, что результаты исследований не имеют к профессору никакого отношения и совершенствование перевода осуществлялось независимо. Статья в «Нью-Йорк Таймс», конечно, не получила широкой огласки. Ву Энда считает, что и отечественные СМИ должны изменить свои привычки и перестать подсознательно считать, что новые технологии всегда являются продуктом более сильной зарубежной страны. На самом деле, многие ведущие открытия в области искусственного интеллекта китайцы делают первыми.
Baidu leading выпустила систему перевода на основе NMT. А спустя год, в 2016 году, Google последовал нашему примеру и выпустил аналогичную программу. Таким образом, основные технологии исследователей, которые находятся на передовых позициях в этой сфере, почти всегда одинаковы. Но отметьте, кто накопил и кто оптимизировал данные, чтобы выпустить стоящий продукт.
Сегодняшние идеи ИИ отличаются от прошлых в правилах мышления компьютера при работе с данными и стратегиями решений. В прошлом мы хотели создать идеальную логику для компьютеров, постоянно абстрагируя правила человеческой логики и внедряя их в машины. Сегодня искусственный интеллект основывается на базе данных и алгоритмах. То есть современные достижения ИИ опираются на интернет-достижения конца 1990-х. С интернетом у нас появились необходимые объемы информации. И обратите внимание, эти данные (имя, возраст, адрес, хобби и т. п.) пользователь вводит неосознанно. Они генерируются при использовании интернета. Каждый клик, каждый запрос, каждое перемещение порождают данные.
Китай уже является крупнейшей в мире производственной державой. Теперь нам необходимо расширить влияние «мягкой силы». Дух и культура – это «мягкая сила». Вычисления и данные – это также «мягкая сила». Когда «мягкая сила» накладывается на производственные мощности, рождается сила, называемая «умной». Это скажется на всех сферах нашей жизни.
Должно быть так
У каждого предприятия своя стратегия и тактика. В 2013 году начало подъем отечественное интернет-предпринимательство. Множество бизнесменов вливают огромные средства в эту «бездонную яму», тем самым демонстрируя свою стратегическую храбрость. Baidu сфокусировался на долгосрочной научной стратегии. В то время не многие заметили, что наша компания занялась развитием искусственного интеллекта. А сегодня в мире ИИ часто отмечают твердость и целенаправленность стратегического планирования Baidu. Компания заранее оценивает природу информационной интернет-индустрии и неуклонно двигается вперед, не заботясь о мнении посторонних. Возникновение макета Baidu multipart – это прорыв в сфере искусственного интеллекта. Сейчас направлению ИИ в Китае уделяется большое внимание. Baidu находится на передовых позициях.
Вместо того, чтобы участвовать в развитии таких инструментов, как Go и Predictive Singer, мы сосредоточились на преобразовании искусственного интеллекта в практические средства, которые должны улучшить человеческую жизнь. Мы не только применяем глубокое обучение в таких областях, как распознавание речи, машинный перевод и распознавание номеров домов и улиц, но и успешно используем технологию для того, чтобы усовершенствовать пользовательский опыт.
В 2013 году мы выпустили в мир Baidu Navigator – первый китайский навигатор, доступный для обычных пользователей. Они могут использовать технологии позиционирования и решения от Baidu Maps, чтобы сэкономить значительное количество ресурсов в сравнении с традиционным GPS-трекером. Курьерская компания может использовать программу для планирования оптимального маршрута доставки. У разработчиков игр появилась возможность создавать такие игры, как PokemonGo. Мы открываем Baidu для того, чтобы люди могли использовать его глаза и уши в своих интересах. Мы открываем платформу глубокого обучения PaddlePaddle, чтобы больше людей могли создавать собственные сервисы с функциями ИИ. Мы хотим, чтобы самый неосведомленный в технических новинках и средствах человек научился использовать данные и оптимизировал свою работу, подчеркнул свою индивидуальность и продолжил двигаться к своим мечтам и идеалам.
Многие абитуриенты, кажется, используют приложения-ассистенты для того, чтобы помочь себе выбрать экзамены для поступления в колледж в соответствии с интересами. В Китае многие прибегают к этой технологии. В мои годы учебы люди называли вступительные экзамены «изнурительным мостом». Приложения-ассистенты с технологией глубокого обучения, подобно картографическим данным, реагируют на желания и тревоги кандидатов и стараются дать свой точный ответ. Здесь искусственный интеллект записывает не траекторию движения в физическом пространстве, а психическую траекторию роста студентов.
В начале 1990-х я отправился в Америку изучать компьютерные технологии. В то время многие молодые люди с желанием менять мир с помощью кода путешествовали между Китаем и США, как птицы. Сейчас было бы интересно взглянуть на карту этих трансокеанских перемещений. Теперь, когда ученые, занимающиеся развитием ИИ, вернулись на родину, я думаю, что пламя технологий будущего разгорится с новой силой. Потому что в Китае достаточно необходимого топлива. Огромное количество образованного населения, быстрое распространение компьютеров и мобильных устройств, большое количество данных дают Китаю уникальные преимущества в развитии и применении технологий глубокого обучения. С этими преимуществами мы можем создать легендарное войско исследователей по аналогу Кремниевой долины 90-х.