Журнал "Компьютерра" №750
Шрифт:
Одно из решений этой проблемы можно найти все в том же списке победителей конкурса приложений для Android, который проводил Google. Как и Navicam Рекимото, программа AndroidScan интерпретирует машиночитаемые коды как гиперссылки, ведущие к информации об объекте. Только в данном случае используются не специально расклеенные в стратегических местах ярлыки, а обычные штрихкоды, которые и так есть на каждой упаковке или обложке. AndroidScan разбирает снятый с помощью камеры смартфона код, выясняет, какому товару он соответствует, и добывает в Интернете информацию о нем - отзывы покупателей, цены, а для аудиодисков - даже соответствующие MP3-файлы на пробу.
Идея,
Поисковая система Linkoln, которую разрабатывают в Microsoft Research, - это следующий логический шаг. Она справляется не только с машиночитаемыми кодами. Для Linkoln подойдут любые плоские изображения - например, афиши или обложки дисков.
Если картинка содержится в ее базе данных, Linkoln сможет ее отличить.
В распознавании образов видят будущее мобильной дополненной реальности и в Nokia: в прошлом году компания приобрела калифорнийский стартап PIXTO, разработавший технологию Point&Find. Теперь над нею работают в той же лаборатории, где была создана MARA. Телефон с поддержкой Point&Find выделяет на снимке, полученном с помощью встроенной камеры, характерные детали и сверяет их базой данных, хранящейся на сервере. Хотя основа технологии - распознавание образов, информация со встроенного в телефон приемника GPS тоже способна помочь делу. Если известно, где сделан снимок, круг поиска можно ограничить. По фотографии достопримечательности телефон Point&Find выдаст историческую справку и туристическую информацию, а если в объектив попадет афиша фильма, пользователь получит список ссылок на его трейлер и расписание киносеансов.
Создатели похожей системы, которую разрабатывали в Neven Vision, зашли еще дальше: их детище умеет различать не только предметы, но и людей. Впрочем, в этом нет ничего странного, если знать историю компании. Уникальная система распознавания лиц, способная работать на маломощных карманных устройствах, долгое время оставалась "дойной коровой" компании, а основатель Neven Vision Хартмут Невен считался одним из ведущих экспертов в этой области. Пять лет назад Neven Vision начала работу над адаптацией своих патентованных алгоритмов для распознавания мест и предметов и, похоже, преуспела в этом: сообщалось, что уже в 2005 году программа уверенно идентифицировала известные ей объекты и спотыкалась лишь на предметах, которые легко спутает и человек - например, она могла не уловить тонкие различия между похожими моделями сумочек. Невен говорил, что его цель - создание "визуального Google", работающего в реальном мире, а не в Интернете.
Но для этого мало иметь эффективный алгоритм распознавания. Даже если предположить, что эта задача успешно решена, остается еще одна проблема, и не меньшая, - поисковый индекс. Если он неполон, все остальные усилия бесполезны. Можно, конечно, на первых порах ограничиться малым - например, собрать базу данных по книжным обложкам или киноафишам не так уж трудно. Но что дальше? Кому под силу создать достаточно обширную базу данных мест и объектов? Разве что самому Google - и как тут не вспомнить фургончики Google StreetView, второй год колесящие по городам Америки, Японии и Европы и методично фиксирующие облик каждого дома, улицы и переулка. Кто-то уже в шутку сравнивал их с "пауками"-гуглботами, которыми поисковик индексирует сайты. И как знать, возможно, в этом сравнении есть доля правды. В конце концов, Хартмут Невен теперь тоже работает в Google.
Во времена Великой депрессии у американских бродяг был особый жаргон, кодекс чести и даже набор значков-иероглифов, которые они оставляли в местах, где побывали. Три диагональные черты обозначали
В основе новомодных геосоциальных сетей для мобильных телефонов лежит тот же принцип: их участники оставляют на карте метки, которые потом могут увидеть другие, только используют для этого не мел, а специальную программу. Loopt, Nearby, Beetaun, Locly, Synchro Spot - списки приложений для iPhone 3G и Android пестрят разномастными реализациями одной и той же идеи.
Подключить самих пользователей к созданию геоконтента - важнейшая задача. К тому моменту, когда подоспеют мобильные системы дополненной реальности, он должен быть готов, ведь что толку в гиперссылках, если они никуда не ведут? С трехмерными моделями для дополненной реальности еще хуже: их изготовление обходится весьма недешево, и на откуп любителям эту задачу отдать труднее. Дело осложняется почти полным отсутствием общепринятых стандартов: информация, помещенная в одну систему, не годится для другой.
Ситуация в этой области напоминает период, предшествовавший распространению веба, когда каждый онлайновый сервис использовал несовместимое программное обеспечение. Момент, когда появится общепринятый и доступный стандарт, станет переломным в развитии геосервисов и мобильных систем дополненной реальности. Стоит ли пытаться предсказать, что произойдет дальше? Ни один прогноз из старых статей об augmented reality, которые я встретил, не сбылся. Вот и теперь все будет совсем не так, как мы представляем, - это единственное, в чем не приходится сомневаться.
Технологии массовых галлюцинаций
Автор: Тихонов Кирилл
Дополненная реальность - одна из важнейших технологий ближайших пяти лет, считают аналитики Gartner. Жизненный цикл всякой технологии они представляют в виде кривой, которая поначалу карабкается на "пик завышенных ожиданий", затем скатывается вниз и продолжает двигаться вперед уже без лишней шумихи, пока не достигает "плато продуктивности". Крикливо рекламировавшийся Web 2.0 сейчас как раз преодолел вершину пика и летит вниз; Tablet PC, электронные чернила и сервисы, чувствительные к местоположению, ползут к "плато", на котором, по мнению Gartner, уже находятся, например, обычные веб-сервисы. Место дополненной реальности на этой кривой - в самом начале. Она только движется к вершине, и говорить о ней будут все больше и больше (считайте публикацию этих строк доказательством правоты Gartner).
В предыдущей статье почти не затронута еще одна сфера применения дополненной реальности, причем не менее популярная. Далеко не всегда эту технологию используют для того, чтобы получить доступ к информации о реальных объектах. Иногда задача совсем другая: увидеть объекты, которых нет и не было. Зачем это нужно - другой вопрос.
Очевидный ответ - развлечения и реклама. Во французской фирме Total Immersion утверждают, что львиную долю доходов ей приносят именно эти применения дополненной реальности. Компания потратила два года на создание аттракциона "Животные будущего" для парка развлечений Futuroscope, а сейчас сотрудничает еще с несколькими парками развлечений, в том числе с Disneyland, Six Flags и немецким Europa Park. Кроме того, она проводит эффектные презентации с использованием дополненной реальности. На выставке Consumer Electronics Show в начале этого года именно технология Total Immersion использовалась при демонстрации дополненной реальности во время выступления главы Intel Пола Отеллини. В 2006 году доходы Total Immersion оценивались в 4 миллиона долларов и продолжали стремительно расти.