Великий переход: что готовит революция облачных технологий
Шрифт:
Большинство из нас, как и Тельма Арнольд, полагают, что в интернете мы действуем анонимно. Однако мы используем интернет не только как торговый центр и библиотеку, но и как личный дневник и даже исповедальню. Посещая сайты и осуществляя поиск, мы рассказываем не только о своей работе, хобби, семье, политических взглядах и здоровье, но и о секретах, фантазиях, навязчивых идеях, грешках, а в самых крайних случаях – о преступлениях. Однако наше ощущение анонимности в значительной мере иллюзорно. Подробная информация обо всем, что мы делаем в интернете, регулярно собирается, хранится в корпоративных или правительственных базах данных и связывается с нашей реальной личностью либо напрямую через наши имена пользователей, номера кредитных карт, а также IP-адреса, автоматически назначаемые нашим компьютерам, либо опосредованно через нашу историю поиска и посещений. Известная карикатура 1993 года в журнале New Yorker имела следующую подпись: «В интернете никто не знает, что вы собака». На самом деле известно не только то, что вы собака, но также и ваша порода, возраст, место проживания и любимая еда.
Чтобы связать конфиденциальную информацию с именами людей,
Имея два пятилетних ПК и стандартное домашнее интернет-соединение, Оуад смог загрузить более четверти миллиона списков пожеланий за один день. «Теперь у меня есть информация о читательских предпочтениях 260 000 граждан США», – написал он позднее на своем сайте. В каждом списке был закодирован уникальный идентификационный номер клиента Amazon, что позволило Оуаду легко рассортировать списки по пользователям. В получившейся базе данных он произвел поиск по названиям книг и другим ключевым словам, в частности, по ряду спорных или политически значимых книг и авторов от «Бойни номер пять» Курта Воннегута до Корана, от правых воззрений Раша Лимбо [41] до левых взглядов его коллеги Майкла Мура [42] . Зная имена и местонахождение владельцев списков, он через сервис для поиска людей Yahoo People Search определил адреса и телефоны многих из них. Затем с помощью Google Maps нанес на карту их адреса. В итоге получилась карта Соединенных Штатов, отображающая точное местоположение людей, интересующихся конкретными книгами и идеями. Он разместил на своем сайте карту с указанием адресов клиентов Amazon, которые выразили заинтересованность в книге «1984» Джорджа Оруэлла. А мог так же легко опубликовать карту, показывающую, где живут люди, которых интересуют книги о выращивании марихуаны или о том, как отдать ребенка на усыновление. «Раньше считалось, – заключает Оуад, – что для наблюдения за человеком или группой людей вы должны получить ордер. Сегодня становится все проще отслеживать идеи, которые затем можно соединить с конкретными людьми».
41
Раш Лимбо (род. 1951) – американский консервативный общественный деятель, ведущий The Rush Limbaugh Show, транслирующегося на территории США компанией Premiere Radio Networks и являющегося высокорейтинговым разговорным радиошоу.
42
Майкл Фрэнсис Мур (род. 1954) – американский журналист и кинорежиссер-документалист, работающий в жанре острой социальной и политической сатиры. Лауреат премии «Оскар» (2003), обладатель «Золотой пальмовой ветви» Каннского кинофестиваля (2004). Последней награды удостоился за фильм «Фаренгейт 9/11», ставший самой коммерчески успешной картиной в истории документального кино.
Оуад потратил изрядное количество времени на организацию и проведение своего эксперимента. Ему пришлось написать собственный код для загрузки данных и вручную произвести поиск по базе данных. Однако то, что Оуад сделал вручную, можно более эффективно выполнить автоматически, используя алгоритмы интеллектуального анализа данных, которые позволяют извлекать информацию одновременно из многих различных сайтов. Одна из основных характеристик компьютерной сети – взаимосвязь разнообразных хранилищ информации. «Открытость» баз данных представляет собой основной источник мощи Всемирного компьютера. Однако это также позволяет легко обнаружить скрытые взаимосвязи между отдельными фрагментами данных. Проанализировав эти отношения, можно обнаружить на удивление обширный кладезь конфиденциальной информации о веб-пользователях.
В 2006 году на конференции ученых в области компьютерных наук, состоявшейся в Сиэтле на той же неделе, когда в прессе появилась информация о личности Тельмы Арнольд, пять ученых из Миннесотского университета представили документ под названием «Вы есть то, что вы говорите: угрозы конфиденциальности, связанные с публичными высказываниями» (You Are What You Say: Privacy Risks of Public Mentions). Они описали, как можно использовать программы для объединения онлайновых баз данных. Находя пересекающиеся данные, эти программы создают подробные личные профили людей, даже когда те предоставляют информацию анонимно. Такое программное обеспечение базируется на простом и очевидном принципе: люди, как правило, выражают свои интересы и мнения на разных сайтах в интернете. Они могут, например, купить альбом в музыкальном магазине iTunes, включить этот альбом в свой плейлист на сервисе Last.fm, оценить его на сайте Rate Your Music и упомянуть о нем в комментарии в музыкальном блоге. Или же отредактировать статью в энциклопедии Wikipedia, посвященную их любимому актеру, написать рецензию на его новую биографию на сайте Amazon, стать его «другом» в социальной сети MySpace и отметить его фотографии на сервисе Flickr. Сложные алгоритмы определяют такие соответствия и используют их для очень точного определения конкретных личностей, как это сделали исследователи из Миннесоты. Проанализировав всего две базы данных: одну с сайта, содержащего рейтинги фильмов, и вторую из форума, посвященного обсуждению фильмов, – они обнаружили, что их алгоритм смог успешно идентифицировать 60 % из тех, кто упомянул восемь или более фильмов.
«В современном богатом данными сетевом мире, – объясняют они в своей статье, – люди рассказывают в интернете о многих аспектах своей жизни. Обычно эти аспекты рассредоточены: вы можете писать вольные рецензии на фильмы в своем блоге под псевдонимом и в то же время участвовать в обсуждениях на форуме или сайте, посвященном медицинской этике, под своим реальным именем. И все-таки эти отдельные личности могут быть связаны» с помощью алгоритмов интеллектуального анализа данных. Такой автоматизированный процесс идентификации, утверждают они, «создает для пользователей серьезные угрозы конфиденциальности». Даже если люди нигде не проявляют свои настоящие личности, их имена, как правило, легко выяснить, если они выдают очень небольшое количество идентифицирующих характеристик. Авторы отмечают, что имя и адрес подавляющего большинства американцев могут быть определены, если известны лишь их почтовый индекс, день рождения и пол – три фрагмента информации, которые люди регулярно предоставляют при регистрации на сайте.
«У вас больше нет частной жизни, – заметил еще в 1999 году Скотт Макнили, бывший исполнительный директор компании Sun Microsystems. – Смиритесь с этим». Бытует мысль о том, что за удобство интернета приходится платить потерей конфиденциальности, и в этом есть доля правды. Однако мало кто из нас осознаёт, в какой степени мы раскрываем подробности нашей личности и жизни, равно как и то, что эти детали могут быть извлечены из журналов поиска или других баз данных и связаны с нами. И, несмотря на наше отношение к потере конфиденциальности, это далеко не единственная и даже не самая внушительная угроза современного интернета. Математики и программисты продолжают совершенствовать алгоритмы анализа данных и находят новые способы предсказания реакций людей на информацию или другие стимулы, предоставляемые онлайн. Они учатся не только определять нашу личность, но и манипулировать нами, и их открытия в настоящее время применяются на практике компаниями и правительствами, не говоря уже о мошенниках.
Вполне естественно воспринимать интернет как технологию эмансипации. Он дает нам беспрецедентную свободу самовыражения, обмена идеями и увлечениями, поиска и общения с родственными душами и нахождения информации практически на любую тему, которую только можно себе представить. Для многих людей выход в интернет представляет собой переход к новому, радикально иному виду демократического государства, освобожденного от физических и социальных ограничений, которыми характеризуется реальный мир. То, что Всемирная паутина «расширяет возможности» каждого человека, признают даже те, кто сожалеет о ее коммерциализации или осуждает грубость большей части ее содержимого. В начале 2006 года редакторы интернет-журнала Cato Unbound Института Катона опубликовали специальный выпуск о состоянии Сети. Они сообщили, что «провидцы», работавшие над изданием, казалось, были «единодушны во мнении, что интернет в будущем сохранит за собой роль освободительной силы». В июле 2007 года в своем эссе ученый Клэй Ширки написал: «Интернет производит данные, но его продукт – свобода, много-много свободы». Дэвид Вайнбергер в своей книге «Неплотно соединенные маленькие части» (Small Pieces Loosely Joined, 2002) простыми словами подытожил миф об освободительной силе интернета: «Всемирная паутина – это мир, который мы создали друг для друга».
Это волнующая мысль, но, как и большинство мифов, в лучшем случае полуправда, а в худшем – фантазия. Компьютерные системы в целом и интернет в частности отдают огромную власть в руки отдельных людей, но еще большую власть они дают компаниям, правительствам и другим учреждениям, чей бизнес заключается в контроле над людьми. Компьютерные системы по своей сути не технологии эмансипации, а технологии управления. Они разработаны как инструменты мониторинга и воздействия на поведение человека для контроля над тем, что и как делают люди. Чем больше времени мы проводим в интернете, заполняя базы данных подробной информацией о нашей жизни и желаниях, тем проще программному обеспечению обнаруживать и использовать модели нашего поведения. Люди или организации смогут понять, чего мы хотим, что нами движет и как мы реагируем на различные стимулы. Клише, которое в этом случае может оказаться правдой, поможет им узнать о нас больше, чем мы знаем о самих себе.
Да, Всемирный компьютер дает нам новые возможности и инструменты для самовыражения и самореализации, но он также дает другим людям беспрецедентную способность влиять на то, как мы думаем и что мы делаем, чтобы направить наше внимание и действия на достижение их целей. В конечном итоге последствия применения технологии для общества и отдельных людей будут в значительной степени определяться тем, как разрешится конфликт двумя сторонами ее природы – освобождением и контролем.
Все живые системы от амеб до государств поддерживают себя за счет переработки вещества, энергии и информации. Они берут материалы из окружающей среды, используют энергию для превращения этих материалов в различные полезные вещества и избавляются от отходов. Это непрерывное превращение сырья в продукт контролируется путем сбора информации, ее интерпретации и манипуляции ею. Процесс контроля также имеет два направления. Он включает в себя измерение – сравнение текущего и требуемого состояний системы и двустороннюю связь – передачу инструкций и сбор сведений о результатах. Обработка информации для целей управления может привести к выбросу гормона в кровь, увеличению производственных мощностей завода или к запуску ракеты с военного корабля, однако в любой живой системе она работает одним и тем же образом.