Чтение онлайн

на главную

Жанры

Голая статистика. Самая интересная книга о самой скучной науке
Шрифт:

Чтобы сегодня оценить потенциал имеющихся у нас данных, достаточно рассмотреть пример сети розничной торговли Target. Подобно большинству компаний, Target стремится повысить прибыль за счет лучшего понимания своих клиентов. Для этого она нанимает специалистов по статистике, перед которыми ставится задача выполнить своего рода «упреждающий анализ» (о нем уже упоминалось в этой книге); они используют данные продаж в сочетании с другой информацией о потребителях, чтобы выяснить, кто, что и почему покупает. Ничего изначально плохого во всем этом нет: просто это означает, что ближайший к вам магазин Target хочет знать, что вам как потребителю может понадобиться.

Но давайте рассмотрим хотя бы один пример того, что могут «вычислить» специалисты по статистике, обосновавшиеся в плотно зашторенных комнатах цокольного этажа корпоративной штаб-квартиры. Target выяснила, что беременность – особенно важное время с точки зрения построения моделей покупательского поведения. У беременных женщин вырабатываются определенные «отношения с розничной торговлей», которые могут длиться десятилетиями. В результате Target хочет выявить беременных женщин – особенно тех, кто на четвертом – шестом месяцах, – и заманить их в свои магазины, чтобы они посещали их как можно чаще. Один из журналистов The New York Times Magazine наблюдал за тем, как бригада специалистов по упреждающему анализу компании Target пыталась это сделать {114} .

114

Charles Duhigg, How Companies Learn Your Secrets, New York Times Magazine, February 16, 2012.

Первая часть задачи решалась достаточно просто. У Target есть специальный реестр, в котором беременные женщины регистрируются, чтобы еще до рождения ребенка приобрести все товары, необходимые для новорожденного. Эти женщины уже являются клиентками Target, и они, по сути, сами сообщают магазину о своей беременности. Но здесь есть одна статистическая уловка: компания «вычислила», что другие женщины, которые демонстрируют аналогичное покупательское поведение, также, вероятно, беременны. Например, беременные женщины зачастую переходят на использование неароматизированных лосьонов, начинают покупать витаминные добавки, огромные упаковки ватных тампонов. Специалисты по упреждающему анализу компании Target выявили двадцать пять наименований товаров, которые в совокупности составляют «признак, позволяющий предсказать беременность». Цель этого анализа заключалась в том, чтобы послать беременным женщинам соответствующие купоны в надежде сделать их постоянными покупательницами Target.

Насколько эффективной оказалась данная стратегия? The New York Times Magazine поведал своим читателям историю о мужчине из Миннеаполиса, который зашел в один из магазинов Target, чтобы поговорить с менеджером. Мужчина был разгневан тем, что Target буквально бомбардировал его дочь-старшеклассницу купонами для беременных женщин. «Она еще учится в школе, а вы присылаете ей купоны на детские кроватки и одежду для новорожденного! Может быть, вы предлагаете ей побыстрее забеременеть?!» – возмущался мужчина.

Менеджер извинялся и заверял мужчину, что это не более чем досадная ошибка. Через несколько дней менеджер еще раз позвонил этому мужчине, чтобы извиниться. На сей раз мужчина вел себя гораздо спокойнее и в свою очередь тоже посчитал нужным извиниться. «Понимаете, у меня в доме небольшой переполох, – сказал он. – Одним словом, она должна родить в августе».

Статистики Target узнали, что его дочь беременна, раньше, чем он!

Может быть, они суют нос не в свои дела – или все-таки это их дела? Иногда складывается впечатление, что их внимание к нам чрезмерно. Именно поэтому некоторые компании пытаются делать вид, что знают о нас гораздо меньше, чем им известно на самом деле. Если, например, вы – женщина и находитесь на четвертом – шестом месяце беременности, то в вашем почтовом ящике могут появиться купоны на детскую кроватку и бумажные полотенца – вместе с предложением скидки на газонокосилку и купоном на бесплатные носки для боулинга (при условии покупки любой пары обуви для боулинга). Появление в вашем почтовом ящике купонов для беременных в сочетании с рекламой других товаров, не имеющих никакого отношения к беременности, может показаться вам чистой случайностью. В действительности компания знает, что вы не увлекаетесь боулингом и не стрижете лужайку перед домом. Просто она пытается «замести следы», делая вид, что знает о вас гораздо меньше, чем ей известно на самом деле.

Facebook, компания, у которой практически нет физических активов, стала одной из самых дорогих в мире. С точки зрения инвесторов (в отличие от пользователей), Facebook располагает одним колоссальным активом – данными. Инвесторам не нравится Facebook, поскольку из-за этой компании они иногда наталкиваются в сети на своих бывших одноклассниц. Инвесторам нравится Facebook, так как каждый щелчок мышью приносит им данные о месте проживания пользователей, о магазинах, где они обычно совершают покупки, о том, какие покупки они делают, и о том, кого они знают и как проводят свободное время.

Крис Кокс, производственный вице-президент Facebook, сказал в интервью The New York Times: «Проблема информационной эпохи заключается в том, как распорядиться информацией» {115} .

Вот так-то.

Что же касается публичной сферы, то слияние данных и технологий порождает еще большие проблемы. Во многих крупных городах мира в общественных местах установлены тысячи камер видеонаблюдения, многие из которых вскоре будут обладать способностью распознавать лица людей. Правоохранительные органы могут отслеживать маршрут движения любого автомобиля, куда бы он ни направлялся (и сохранять соответствующую информацию в архивной памяти), прикрепляя к автомобилю то или иное устройство глобального позиционирования, а затем отслеживая его перемещения с помощью спутника. Является ли это достаточно дешевым и эффективным способом слежения за действиями преступных элементов? А может быть, это не что иное, как использование государством современных технологий для ограничения нашей личной свободы? В 2012 году Верховный суд США единогласно постановил, что это действительно посягательство на нашу свободу, и запретил правоохранительным органам прикреплять устройства слежения на личные транспортные средства без соответствующего ордера [79] .

115

Somini Sengupta and Evelyn M. Rusli, Personal Data’s Value? Facebook Set to Find Out, New York Times, February 1, 2012.

79

Судебный процесс The United States vs. Jones.

Между тем, многие государства обзавелись огромными базами данных ДНК, которые являются мощным инструментом, позволяющим раскрывать уголовные преступления. Чьи ДНК должны храниться в таких базах данных? Всех осужденных преступников? Каждого, кто подвергался аресту (даже если впоследствии был признан невиновным)? Или всех граждан без исключения?

Мы лишь приступаем к решению проблем, которые находятся на пересечении технологий и персональных данных. Ни одна из них не была настолько актуальна, когда соответствующая информация хранилась на пыльных стеллажах в подвалах серьезных государственных учреждений, а не в цифровых базах данных, в которые в принципе может забраться любой желающий. Статистика в наши дни играет даже более важную роль, чем когда-либо прежде, поскольку сейчас у нас появилось больше возможностей для эффективного использования данных. Однако сами по себе формулы не подскажут нам наилучшие способы их использования. Иными словами, математика не может заменить суждение.

Учитывая вышесказанное, давайте завершим эту книгу, попытавшись найти связь между следующими словами: огонь, ножи, автомобили, крем для удаления волос. Каждая из этих вещей служит важной цели. Каждая делает нашу жизнь лучше. И каждая может создать серьезные проблемы в случае неосторожного с ней обращения.

Теперь вы можете добавить статистику в этот список. Она наверняка поможет вам лучше понять многие явления нашей жизни при условии, что вы будете пользоваться статистическими инструментами разумно и по назначению!

Приложение

Статистическое программное обеспечение

Подозреваю, что вы не будете выполнять статистический анализ с помощью карандаша, бумаги и карманного калькулятора. Ниже приведен краткий обзор программных пакетов, наиболее широко используемых для решения задач, описанных в этой книге.

Microsoft Excel

Microsoft Excel – пожалуй, самая широко используемая программа для вычисления простых статистических показателей, таких как среднее значение и среднеквадратическое (стандартное) отклонение. Кроме того, с помощью Excel можно выполнять базовый регрессионный анализ. Большинство компьютеров комплектуется пакетом Microsoft Office, поэтому Excel, скорее всего, уже есть на жестком диске вашего ПК. В сравнении с более сложными статистическими программными пакетами Excel довольно дружественна к пользователю. Основные статистические вычисления можно выполнять с помощью строки формул.

Популярные книги

Сердце Дракона. Том 9

Клеванский Кирилл Сергеевич
9. Сердце дракона
Фантастика:
фэнтези
героическая фантастика
боевая фантастика
7.69
рейтинг книги
Сердце Дракона. Том 9

Совок 11

Агарев Вадим
11. Совок
Фантастика:
попаданцы
7.50
рейтинг книги
Совок 11

Райнера: Сила души

Макушева Магда
3. Райнера
Любовные романы:
любовно-фантастические романы
7.50
рейтинг книги
Райнера: Сила души

Его нежеланная истинная

Кушкина Милена
Любовные романы:
любовно-фантастические романы
5.00
рейтинг книги
Его нежеланная истинная

Кодекс Охотника. Книга XXIII

Винокуров Юрий
23. Кодекс Охотника
Фантастика:
боевая фантастика
попаданцы
5.00
рейтинг книги
Кодекс Охотника. Книга XXIII

Сам себе властелин 2

Горбов Александр Михайлович
2. Сам себе властелин
Фантастика:
фэнтези
юмористическая фантастика
6.64
рейтинг книги
Сам себе властелин 2

Огненный князь 4

Машуков Тимур
4. Багряный восход
Фантастика:
попаданцы
аниме
5.00
рейтинг книги
Огненный князь 4

Кодекс Охотника. Книга XVI

Винокуров Юрий
16. Кодекс Охотника
Фантастика:
фэнтези
попаданцы
аниме
5.00
рейтинг книги
Кодекс Охотника. Книга XVI

Кровь Василиска

Тайниковский
1. Кровь Василиска
Фантастика:
фэнтези
попаданцы
аниме
4.25
рейтинг книги
Кровь Василиска

Он тебя не любит(?)

Тоцка Тала
Любовные романы:
современные любовные романы
7.46
рейтинг книги
Он тебя не любит(?)

Сын Петра. Том 1. Бесенок

Ланцов Михаил Алексеевич
1. Сын Петра
Фантастика:
попаданцы
альтернативная история
6.80
рейтинг книги
Сын Петра. Том 1. Бесенок

Сердце Дракона. Предпоследний том. Часть 1

Клеванский Кирилл Сергеевич
Сердце дракона
Фантастика:
фэнтези
5.00
рейтинг книги
Сердце Дракона. Предпоследний том. Часть 1

Физрук-4: назад в СССР

Гуров Валерий Александрович
4. Физрук
Фантастика:
попаданцы
альтернативная история
5.00
рейтинг книги
Физрук-4: назад в СССР

Идеальный мир для Лекаря

Сапфир Олег
1. Лекарь
Фантастика:
фэнтези
юмористическое фэнтези
аниме
5.00
рейтинг книги
Идеальный мир для Лекаря