Революция в аналитике. Как в эпоху Big Data улучшить ваш бизнес с помощью операционной аналитики
Шрифт:
Что касается первого вопроса, то правительство США утверждает, что данные о местоположении абонентов сотовой связи и данные автомобильной телематики не являются частными. Правительство заявляет: когда люди включают сотовый телефон или садятся в машину, они заведомо знают о том, что все их перемещения могут быть отслежены, и, таким образом, отказываются от своего права на защиту конфиденциальности данных. Частично логика рассуждений правительства основывается на том, что данные фактически уже собираются компаниями, а поэтому не принадлежат людям и не подпадают под защиту законов. В сентябре 2013 г. было вынесено два судебных решения. В первом случае суд постановил, что для доступа к информации о местоположении абонента правоохранительные органы должны были получить судебный ордер {54} . Во втором случае суд вынес решение, что такой ордер не требовался {55} . Этот вопрос в конечном итоге станет рассматривать Верховный суд, и его окончательное решение
54
См.: “Warrant Needed for Metadata Tracking,” Big Data Republic, 24 июля 2013 г.
55
См.: David Kravets, “Cops Can Track Cellphones Without Warrants, Appeals Court Rules,” Wired, 30 июля 2013 г., на www.wired.com/threatlevel/2013/07/warrantless-cell-tracking/
Что касается второго вопроса, то АНБ утверждает, что оно имеет право собирать широкий спектр информации о гражданах, даже если они не подозреваются в правонарушениях. Широта охвата подобной деятельности АНБ стала неприятной неожиданностью для большинства людей. Как и в вышеописанной ситуации с данными о местоположении сотовых абонентов, мнения судов по этому вопросу разделились. Один суд вынес решение, что деятельность АНБ является совершенно законной, тогда как другой суд через несколько недель счел такую деятельность незаконной {56} . Этот вопрос также будет рассматриваться в Верховном суде для вынесения окончательного решения.
56
См.: David Kravets, “Judge Rules NSA Bulk Telephone Metadata Spying Is Lawful,” Wired, 27 декабря 2013 г., на www.wired.com/threatlevel/2013/12/judge-upholds-nsa-spying/; и David Kravets, “Court Says NSA Bulk Telephone Spying Is Unconstitutional,” Wired, 16 декабря 2013 г., на www.wired.com/threatlevel/2013/12/bulk-telephone-metada-ruling/
Напоследок стоит упомянуть еще один удивительный факт. В Соединенных Штатах 87 % населения может быть однозначно идентифицировано только на основе имени, даты рождения и почтового индекса {57} . Если такой минимальной информации достаточно для точного определения того, кто вы есть, представьте, как легко идентифицировать вас при помощи всех прочих данных, которые собираются сегодня. Хотя мнения о том, где именно должны быть проведены зыбкие границы, могут разниться, несомненно одно – мы должны где-то провести эти границы.
57
См.: Nate Anderson, “Anonymized” Data Really Isn’t – and Here’s Why Not,” Ars Technica, 8 сентября 2009 г., на http://arstechnica.com/tech-policy/2009/09/your-secrets-live-online-in-databases-of-ruin/
Но довольно пессимизма. Теперь давайте рассмотрим некоторые практические примеры соблюдения конфиденциальности. После этого обсудим, что конкретно должна делать ваша организация, чтобы поддерживать правильный баланс в этой важной области.
Установите стандарты конфиденциальности
Как создать такие стандарты конфиденциальности, чтобы ваша организация не оказалась в центре громкого скандала в связи с нарушением неприкосновенности частной жизни? Я рекомендую организациям принимать во внимание три критерия, чтобы гарантировать, что они не нарушают доверие своих клиентов и широкой общественности {58} :
58
На основе статьи в моем блоге для Международного института аналитики: «Полезные или страшные? Обращайтесь осторожно с большими данными» (“Helpful or Creepy? Avoid Crossing the Line with Big Data”), 7 мая 2013 г., на http://iianalytics.com/2013/05/helpful-or-creepy-avoid-crossing-the-line-with-big-data/
1. Что является законным?
2. Что является этичным?
3. Что является приемлемым для клиентов и широкой общественности?
В идеальном мире эти три критерия должны полностью совпадать. Но сегодня они не совпадают совсем. Постепенно регулирование должно охватить все аспекты конфиденциальности, а люди должны стать более осведомленными. К сожалению, сейчас рамки законного выходят далеко за рамки этичного, а рамки этичного могут выходить за рамки приемлемого для людей.
Крупная компания розничной торговли Target демонстрирует нам наглядный пример того, как можно успешно пройти два первых теста и с треском провалиться на третьем. У Target есть программа лояльности, которая по всем меркам соответствует действующим законам. Когда потребители регистрируются в этой программе, они соглашаются с тем, что им будут делаться целевые предложения на основе их покупательского поведения. Поскольку такие предложения оговариваются в соглашении, Target не выходит за рамки этики, когда использует данные о потребителях для изучения их покупательских привычек и предложения им товаров. Ошибка Target состояла в том, что в своем использовании аналитики она вышла за пределы комфортной зоны покупателей, хотя ее действия оставались законными и этичными.
При оценке приемлемости анализа с точки зрения конфиденциальности убедитесь в том, что он проходит три разных теста. Анализ должен быть: (1) законным, (2) этичным и (3) приемлемым для клиентов. Последнее условие часто является самым строгим.
Target научилась выявлять беременность на очень ранних стадиях – настолько ранних, что компания могла узнать о беременности еще до того, как сама покупательница сообщала о ней другим. В результате это привело к истории, описанной в New York Times, когда отец 17-летней дочери получил адресованное ей письмо с предложением товаров для беременных {59} . Отец отправился к директору местного магазина Target и обрушился на него с обвинениями в том, что такие неподобающие товары предлагаются девушке-подростку. Через неделю отец вернулся и извинился перед директором магазина за свои нападки. Оказалось, что его дочь действительно была беременна. Однако широкая общественность склонилось не на сторону Target. Люди посчитали подобное использование аналитики недопустимым.
59
См.: Charles Duhigg, “How Companies Learn Your Secrets,” New York Times, 16 февраля 2012 г., на www.nytimes.com/2012/02/19/magazine/shopping-habits.html?pagewanted=all&_r=2&
Всегда помните: недостаточно определить, что законно и что этично. Нужно задуматься и о том, что подумают о ваших действиях клиенты и широкая общественность.
«Уловки-22» [4] применительно к конфиденциальности
На частном мероприятии, где я присутствовал, генеральный директор больничной сети поведал историю о том, в каком рискованном положении может оказаться организация из-за неоднозначности сегодняшних законов и этических норм касательно использования данных {60} . Речь шла о сборе и хранении генетических данных, а также о грузе обязательств, которые несет с собой эта деятельность.
4
«Уловка-22» (Catch-22) – название романа Джозефа Хеллера. Выражение “Catch-22” вошло в лексикон американцев, обозначая всякое затруднительное положение. – Прим. ред.
60
На основе статьи в моем блоге для Big Data Republic под названием «Юридические и этические условия использования больших данных» (“The Legal & Ethical implications of Big Data”), 24 мая 2013 г.
Предположим, что клиника сохраняет результаты анализа вашей ДНК у себя в файле. Но что если спустя три года будет сделано важное открытие, которое свяжет определенные генетические признаки с серьезным заболеванием? Обязана ли клиника по закону или с точки зрения медицинской этики провести анализ всей своей базы данных о ДНК с целью выявления пациентов, находящихся в зоне риска? Как часто необходимо проводить такой ретроспективный анализ и каковы будут связанные с ним затраты?
Неоднозначность правовых и этических норм, прописывающих, что приемлемо или надлежит делать в тех или иных ситуациях, только увеличивает риски, связанные со сбором данных. Организация вполне может оказаться в ситуации, когда она проиграет судебный иск, какое бы решение до этого ни приняла. Будьте предельны осторожны в таких ситуациях, которые могут закончиться «уловкой-22».
Невозможно спрогнозировать затраты на выполнение неизвестного количества анализов неизвестной сложности для всего объема данных, хранимых в базе данных клиники. Будущие затраты на хранение данных нельзя в полной мере оценить сейчас, поскольку невозможно заранее предсказать, сколько корреляций может быть открыто учеными и насколько трудно будет осуществить анализ, чтобы определить риски. Это также создает ситуацию в духе «уловки-22». Кое-кто может подать на клинику в суд, если она проанализирует персональные данные и проведет новые тесты без разрешения. Они предпочли бы не знать о плохих новостях, особенно в тех случаях, когда помочь невозможно. Другие подадут в суд, если у клиники была возможность выявить проблему посредством такого анализа, но она этого не сделала. Вполне вероятно, что в обоих случаях суд признает клинику виновной. Кроме того, существуют риски, связанные с кражей или ненадлежащим использованием данных ДНК. Все эти неопределенные факторы, сопряженные с хранением генетических данных, вызывали у генерального директора серьезную обеспокоенность.
Он рассказал нам об удивительном решении этой проблемы. Больничная сеть планирует отказаться от хранения данных ДНК за пределами того срока, который требуется для проведения неотложных тестов. Учитывая многочисленные неопределенные факторы, связанные с юридическими и финансовыми последствиями хранения генетических данных, больничная сеть не хочет хранить их дольше, чем необходимо. Пока эти факторы не будут четко определены, компания решила, что возможные риски намного перевешивают возможные выгоды.