Вторая эра машин. Работа, прогресс и процветание в эпоху новейших технологий
Шрифт:
Экспоненциальный прогресс многое значил для достижений, которые мы обсуждали в предыдущей главе. Компьютер Watson производства IBM запускает массу умных алгоритмов, однако он не смог бы быть конкурентоспособным без компьютерного «железа», в сто раз более мощного, чем у его предшественника, шахматного компьютера Deep Blue, победившего в 1997 году чемпиона мира Гарри Каспарова. Приложения для распознавания речи типа Siri требуют немалых вычислительных мощностей, которые стали доступными лишь на мобильных телефонах типа iPhone 4S производства Apple (первый телефон с установленной в нем программой Siri). Фактически по своей мощности iPhone 4S был вполне сопоставим со знаменитым ноутбуком Powerbook G4, выпущенным той же компанией всего десятью годами ранее. Как показывают все эти инновации, экспоненциальный прогресс позволяет технологиям стремиться вперед и превращать научную фантастику в реальность на второй половине шахматной доски.
Дело не ограничивается компьютерами, или Насколько широки пределы закона Мура
Еще одно сравнение между поколениями компьютеров позволяет выявить не только силу закона
76
Matt Gemmell, “iPad Multi-Touch”, 9 мая 2010 г., http://mattgemmell.com/2010/05/09/ipad-multi-touch/.
77
“Company News; Cray to Introduce a Supercomputer”, New York Times, 11 февраля 1988 г.,(по состоянию на 26 июня 2013 г.).
Впихнуть весь этот функционал в iPad 2 удалось благодаря значительным переменам, произошедшим в последние десятилетия: из аналогового мира в цифровой перекочевали такие сенсорные устройства, как микрофоны, камеры и акселерометры. По сути, они стали компьютерными чипами. И, соответственно, их развитие подчинилось закону Мура.
Цифровые устройства для записи звука использовались уже в 1960-е годы, а в 1975-м один инженер из компании Eastman Kodak сконструировал первую современную цифровую камеру. [78] Первые устройства такого рода были дорогими и неуклюжими, однако их качество быстро улучшалось, а цены падали. Первая цифровая однообъективная зеркальная фотокамера компании Kodak, DCS 100 на момент выхода на рынок в 1991 году стоила около 13 000 долларов; она обладала максимальным разрешением в 1,3 мегапикселя и хранила изображения на отдельном диске весом около 4,5 кг, который пользователю приходилось носить в сумке на плече. Однако количество пикселей в расчете на доллар стоимости цифровой камеры удваивалось почти каждый год (это явление известно под названием «закона Хэнди» – в честь работника австралийского офиса Kodak Барри Хэнди), а сами камеры и аксессуары становились со временем, в согласии с экспоненциальным законом, меньше, легче, дешевле и лучше. [79] Цифровые сенсоры улучшились настолько, что Apple через 20 лет после появления DCS 100 добавила в iPad 2 две крошечные камеры, способные снимать фото и видео. А когда компания на следующий же год представила новую модель iPad, разрешение задней камеры улучшилось более чем в 7 раз.
78
Thomas Fine, “The Dawn of Commercial Digital Recording”, ARSC Journal 39 (Spring 2008): 1–17; Jurrien Raif, “Steven Sasson named to CE Hall of Fame”, Let’s Go Digital, 18 сентября 2007 г., http://www.letsgodigital.org/en/16859/ce-hall-of-fame/.
79
“Hendy’s Law”, Nida Javed, 7 декабря 2012 г., http://prezi.com/v-rooknipogx/hendys-law/.
Глаза машины
Закон Мура работает для развития процессоров, памяти, сенсоров и многих других элементов компьютерного оборудования (заметным исключением являются батареи, рабочие показатели которых не улучшились по экспоненте, поскольку, в сущности, они представляют собой химические устройства, а не цифровые). Однако согласно этому закону вычислительные устройства становятся не только быстрее, дешевле, меньше по размеру и легче. Они также начинают делать прежде недоступные вещи.
Исследователи искусственного интеллекта уже давно увлекались (чтобы не сказать – были одержимы) проблемой одновременной локализации и картографирования (simul-taneous localization and mapping, SLAM). Это процесс создания ментальной карты незнакомого здания непосредственно в момент, когда вы перемещаетесь по нему – где находятся двери? а лестницы? обо что тут можно споткнуться? – и отслеживания, в каком месте здания вы находитесь (что позволяет найти путь к выходу). У подавляющего большинства людей процессы SLAM происходят при минимальном участии сознания. Однако научить этому машину было значительно сложнее.
Исследователи много думали о том, какими сенсорами снабдить робота (камерами? лазерами? сонарами?) и каким образом интерпретировать массу данных, которые он передает, однако прогресс в этой работе был достаточно медленным. В одном из обзоров работы в этом направлении, сделанном в 2008 году, утверждалось, что SLAM «представляет собой одну из фундаментальных проблем робототехники… [однако] нам представляется, что почти все нынешние подходы неспособны привести к созданию достаточно точных карт для обширных территорий, в основном из-за увеличения стоимости вычислений и роста уровня погрешности, что в случае расширения сценария делает работу невозможной». [80] Если говорить коротко, то основные проблемы, мешавшие развитию машинного SLAM, заключались в том, что было невозможно быстро собрать данные о достаточно большой территории и немедленно обработать их. Точнее, было невозможно – до тех пор, пока всего через два года после
80
Josep Aulinas et al., “The SlAM Problem: A Survey”, in Proceedings of the 2008 Conference on Artificial Intelligence Research and Development: Proceedings of the 11th International Conference of the Catalan Association for Artificial Intelligence (Amsterdam: IoS Press, 2008), стр. 363–371, http://dl.acm.org/citation.cfm?id=1566899.1566949.
В ноябре 2010 года Microsoft впервые предложила в качестве дополнения к игровой платформе Xbox сенсорное устройство Kinect, которое могло отслеживать движения двух активных игроков, сканируя при этом движения примерно 20 суставов. Если один игрок становился перед другим, устройство самостоятельно оценивало скрытые от него движения второго игрока и сразу же находило все его суставы, как только он вновь оказывался на виду. Kinect мог также распознавать лица, голоса и жесты в самых разных условиях освещенности и при разном уровне шума. Достигалось это с помощью цифровых сенсоров, внешнего микрофона (способного находить источник звука лучше, чем встроенный микрофон), стандартной видеокамеры и системы глубинного восприятия, умевшей одновременно и излучать, и принимать сигнал в инфракрасном спектре. Несколько встроенных процессоров и огромное количество проприетарных программ позволяли конвертировать данные, поступавшие с этих сенсоров, в информацию, которую могли бы использовать разработчики игр. [81] На момент выхода продукта на рынок все эти возможности были упакованы в устройство высотой 10 см и шириной менее 30 см, которое продавалось в рознице за 149,99 доллара.
81
Dylan McGrath, “Teardown: Kinect has Processor After All”, EE Times, 15 ноября 2010 г.,– kinecthas-processor-after-all.
В течение 60 дней после выпуска продукта было продано более 8 миллионов устройств Kinect (намного больше, чем айфонов или айпадов). В настоящее время Kinect удерживает рекорд «Книги Гиннеса» как самое быстро продаваемое компьютерное устройство на потребительском рынке. [82] Поначалу семейство Kinect позволяло играть в дартс, заниматься физическими упражнениями, гулять по виртуальным улицам и произносить заклинания на манер Гарри Поттера. [83] Однако система была способна на большее. В августе 2011 года на конференции SIGGRAPH (специальной группы по графическим и интерактивным методам Ассоциации вычислительных устройств) в Ванкувере команда сотрудников Microsoft и ученых использовала Kinect, чтобы наконец-то решить одну из самых сложных проблем в области роботехники.
82
“Microsoft Kinect Sales Top 10 million, Set New Guinness World Record”, Mashable, 9 марта 2011 г.,(по состоянию на 26 июня 2013 г.).
83
“Xbox Kinect’s Game launch lineup revealed”, Mashable, 18 октября 2010 г.,(по состоянию на 26 июня 2013 г.).
SIGGRAPH – самый крупный и престижный конгресс в области теории и практики цифровой графики. Его посещают исследователи, разработчики игр, журналисты, предприниматели и другие профессионалы, интересующиеся этой темой. Словом, это самое подходящее место для того, чтобы компания Microsoft могла представить здесь то, что сайт Creators Project назвал «самовзломом, который может изменить буквально все» [84] . [85] Речь идет о Kinect Fusion, проекте, в котором Kinect использовался для решения проблемы SLAM.
84
“KinectFusion: The Self-hack that Could Change Everything”, The Creators Project, 18 августа 2011 г.,(по состоянию на 26 июня 2013 г.).
85
В данном контексте под словом «взлом» (hack) понимаются попытки проникновения внутрь какого-либо элемента программного обеспечения, чтобы использовать его для решения непредусмотренных задач. «Самовзлом» (self-hack) – это такая же попытка, предпринятая по заказу компании-производителя для обнаружения уязвимостей в системе безопасности.
В видеофильме, показанном на SIGGRAPH-2011, демонстратор поднимал Kinect и водил им вдоль стен типичного кабинета – со стульями, растением в горшке, настольным компьютером и монитором. [86] В ходе этого процесса видео разделялось на несколько экранов, на которых было показано все, что способен почувствовать Kinect. Сразу же становится ясно, что если Kinect и не полностью решает проблему SLAM для комнаты, то достаточно близок к этому. В режиме реального времени Kinect создает трехмерную карту комнаты и всех объектов в ней, включая сотрудников. Он распознает слово DELL, выдавленное в пластике на задней панели компьютерного монитора, хотя эти буквы не раскрашены и имеют глубину всего 1 мм. Устройство знает, где именно в комнате оно находится, и даже способно рассчитать, как будут отскакивать виртуальные шарики для пинг-понга, если их бросить в комнату сверху. В статье технологического блога Engadget, написанной после проведения SIGGRAPH, говорилось: «Kinect сделал трехмерное восприятие достоянием мейнстрима и более того: из обычного потребительского продукта сотворили нечто такое, от чего просто крышу срывает». [87]
86
Sarah Kessler, “KinectFusion HQ – Microsoft Research”,(по состоянию на 26 июня 2013 г.).
87
“Microsoft’sKinectFusionResearch Project offers Real-time 3D Reconstruction, Wild at Possibilities”, Engadget, 9 августа 2011 г.,(по состоянию на 26 июня 2013 г.).