Проклятие эффективности, или Синдром «шахты». Как преодолеть разобщенность в жизни и бизнесе
Шрифт:
Первая по-настоящему хорошая возможность апробировать некоторые свои идеи на практике представилась Флауэрсу как раз в свете пожара в доме 2321 по Проспект-авеню в Бронксе. Вскоре по прибытии Флауэрс опубликовал на сайте Craigslist.org объявление о приеме на работу молодых специалистов по обработке массивов данных. Для правительства Нью-Йорка такой подход к подбору персонала был в диковинку. Флауэрс же быстро подобрал себе команду из недавних студентов, которую составили Бен Дин, Кэтрин Кван, Крис Коркоран и Лорен Талбот [28] . «Мне нужны были именно недавние выпускники колледжей со знанием математической экономики, чтобы помочь мне взглянуть на все свежим взглядом», – говорит Флауэрс, разместивший своих «ребяток» (как он их прозвал) непосредственно при электронном архиве мэрии.
28
Конференция организации Code for America 2012, выступление Майка Флауэрса, первый день, 4 октября, 2012.
Через несколько дней после пожара, повлекшего гибель семьи Гарсиа, Флауэрс попросил свою команду изучить все имеющиеся в городской базе данные о причинах возникновения
Нет ли какого-то более надежного способа предугадывать места возникновения пожаров? А не поискать ли другие источники данных за пределами Управления пожарной охраны? – задумался Флауэрс и попросил своих ребяток оторваться от компьютеров и «покататься» несколько дней по городу с инспекторами патрульной службы, полиции, пожарного, жилищного и строительного надзора и вместе с ними задаться вопросами, каковы основные признаки пожароопасности и как их распознать.
Поначалу многие инспектора относились к «ребяткам» с недоверием. Управление пожарной охраны Нью-Йорка, например, гордится своей долгой, славной историей, и тамошние инспектора недолюбливают посторонних, лезущих в их дела. На мэрию там привыкли смотреть свысока; наплодили правил, ограничивающих функции жилищной инспекции выявлением строго очерченного круга нарушений и проблем, а контроль соблюдения требований пожарной безопасности оставили всецело в ведении пожарного надзора. Но Флауэрс твердо решил эти барьеры сломать, а из своего багдадского опыта он вынес твердое убеждение, что для понимания сути проблемы не обойтись без прямого наблюдения процессов, разворачивающихся в реальной жизни. Ведь жизненные реалии не разложишь по аккуратным коробочкам теоретических схем, не рассмотришь из окна кабинета, не смоделируешь при помощи компьютерных программ; тут нужно желание всматриваться и вслушиваться в происходящее в окружающем мире – и переосмысливать свои гипотезы и предположения.
Вот он и дал своим ребятам строгий наказ: вести себя тише воды, ниже травы, но держать глаз и ухо востро – и не упускать ничего, что могло бы подсказать полезное решение, как прогнозировать пожары. «Мы внимательно выслушивали пожарных, полицейских, инспекторов строительного надзора, управления по охране и развитию жилищного фонда, управления водоснабжения. Вопрос всем задавался один и тот же: „Вот вы прибываете на объект – и сразу видно, что это трущоба, бывает так? И по каким ключевым признакам это видно?“ И мы слушали, слушали и слушали их ответы…» – И постепенно вырисовалась закономерность. Самыми пожароопасными, как удалось выяснить ребятам, оказались жилые дома, возведенные до 1938 года, когда в Нью-Йорке были ужесточены строительные нормы и правила. Расположены они обычно в беднейших кварталах, часто относятся к арестованному недвижимому имуществу просрочивших ипотечные кредиты домовладельцев, а также являются рассадником всевозможных грызунов и паразитов, на что регулярно жалуются жители соседних домов [29] .
29
Thor Olavsrud, How Big Data Saves Lives in New York City, CIO, October 25, 2012.
Соответственно, ребята Флауэрса принялись поднимать данные по такого рода вопросам. Оказалось, что дело это на удивление непростое. Это в теории Нью-Йорк – золотая жила для любителей всевозможной статистики, поскольку там сорок с лишним управлений и служб напрямую подчинены мэрии и десятилетиями отчитываются перед ней о проделанной работе, сообщая, в частности, детальные цифровые показатели. Чиновники мэрии так гордились этими залежами данных, что Блумберг, когда он согнал их всех в один большой загон, распорядился развесить по стенам – прямо между историческими картинами маслом – плазменные панели для отображения столь любимых здешними обитателями статистических показателей. Но вот незадача: нужная информация хранилась в десятках разрозненных баз данных, причем они велись отдельно не только каждым управлением, но и каждым структурным подразделением! Цифры оказались настолько же фрагментированными, как и человеческие ресурсы.
По базе данных учета поступлений налогов на землепользование PLUTO [30] ребята составили выборку из 640 000 малоэтажных нью-йоркских домов, в каждом из которых, по регистрационным данным мэрии, проживало от одной до трех семей. Из-за причудливости законов города Нью-Йорка Управление пожарной охраны отвечало за проверку противопожарной безопасности примерно половины из них; вторую половину контролировало Управление жилищного строительства. Ребятам, однако, удалось поднять из архивов обоих управлений (опять же раздельных!) все данные и о пожарах в жилых домах, и о поступивших жалобах на незаконные перепланировки. Кроме того, они выудили из Финансового управления и Следственного управления (первое занималось налогами, второе – финансовыми махинациями) информацию о ранее выявленных невыплатах налогов и ипотечных кредитов и сверили ее с полученным из Управления жилищного строительства списком жилых домов, построенных до 1938 года. Наконец, данные из всех источников были ими сведены в единый массив и подвергнуты статистической обработке. Постепенно стала вырисовываться закономерность. По адресам, где присутствовали все четыре фактора риска одновременно, и пожары и
30
Данные PLUTO см.: http://www.nyc.gov/html/dcp/html/bytes/applbyte.shtml
С этими данными Флауэрс, заручившись поддержкой Голдсмита, отправился к инспекторам Управления жилищного строительства и попросил провести адресную проверку выявленных домов, построенных с нарушением строительных норм и правил и, в целом, неблагополучных по совокупности проанализированных данных. «Поначалу идея им совсем не понравилась, нас просто назвали чокнутыми, – вспоминает Флауэрс. – Но все-таки Управление жилищного строительства удалось взять измором, и инспектора отправились проверять адреса по нашим спискам». Результаты ошеломили. Традиционно по результатам проверок реальные проблемы у них выявлялись лишь по 13 % адресов. По новому методу нарушения были обнаружены в 70 % случаев [31] . Как по мановению волшебной палочки – и без дополнительных затрат – эффективность проверок соблюдения норм противопожарной безопасности выросла в четыре раза.
31
Kenneth Cukier and Viktor Mayer-Schoenberger, The Rise of Big Data, Foreign Afairs, May 1, 2013. См. также: Cukier and Mayer-Schoenberger, Big Data: A Revolution That Will Transform How We Live, Work, and Think (Eamon Dolan: Mariner, 2014).
Может, это случайно так подфартило? Ребята испытали тот же прием на многоквартирных домах. С первого раза ничего путного не вышло. Тогда Флауэрс снова отрядил часть молодых исследователей в совместные разъезды с инспекторами для разведки дополнительных данных на местах: чем же таким особенным большие дома отличаются от небольших? Дни шли, а ключа к разгадке все не находилось. И вдруг один из неутомимых искателей данных случайно услышал мимолетно обороненную бывалым инспектором реплику относительно большого жилого дома, к которому они подъехали: «Здесь точно все в порядке, по кладке видно!» Компьютерщик переспросил, какое отношение к делу имеет кирпичная кладка. Инспектор объяснил, что за долгие годы убедился: домовладельцы, не скупящиеся на новые кирпичи для латания кладки, не терпят и пожароопасных непорядков. Ребята сразу взяли след – и подняли кое-какие данные по поставкам кирпича по всему Нью-Йорку (нашлась и такая залежь в бездонных архивах нью-йоркской бюрократии). Дополнив ими карту статистики пожаров, они сразу же убедились в правильности своей догадки. Сами по себе данные о поставках кирпича ничего не раскрывали, а вот в сочетании с другими исходными данными они производили просто-таки взрывной эффект.
После этого найденный подход стал широко применяться, а горизонтальные связи выстраиваться и в других сферах. Хорошей иллюстрацией служит пример с незаконным оборотом сигарет. Контрабанду табачных изделий в Нью-Йорке не могли побороть десятилетиями, поскольку нью-йоркские цены на них были вдвое выше, чем в той же Виргинии (из-за более высокой ставки акцизного налога), а на 14 000 киосков с лицензиями на право продажи табачных изделий приходилось всего пятьдесят шерифов, призванных контролировать их торговлю [32] . Для резкого повышения раскрываемости команде Флауэрса хватило перекрестной сверки списка киосков с табачными лицензиями и данных о налоговых мошенничествах. Аналогичный фокус был проделан и для выявления точек незаконной безрецептурной продажи оксикодона, сильного обезболивающего, пользующегося популярностью у наркоманов. Аптек в городе тысячи, и обычными выборочными проверками незаконную продажу сильнодействующего препарата без рецепта было не обнаружить. Однако, сведя воедино и сопоставив ранее разрозненные базы данных, команда Флауэрса определила, что всего на один процент аптек приходится 24 % компенсационных выплат за отпуск оксикодона по рецептам в рамках покрытия расходов населения на лекарства по государственной программе Medicaid [33] . Раскрываемость резко пошла в гору.
32
Интервью с Майком Флауэрсом, http://radar.oreilly.com/2012/06/predictive-data-analytics-big-data-nyc.html
33
Alex Howard, Predictive Data Analytics in Saving Lives and Taxpayer Dollars in New York City, Radar Online, June 26, 2012; Mayor Moves Against Drugs, Wall Street Journal, December 13, 2011.
Ребятки углубились даже в столь малоаппетитную проблему, как загрязнение городской канализации «желтым жиром» [34] . В Нью-Йорке около 24 000 ресторанов, и большинство предлагает в том числе и блюда во фритюре. «Только представьте себе весь этот картофель-фри, роллы в тесте, да кучу всего!» – любил говаривать Флауэрс, указывая на свой животик. По закону нью-йоркским ресторанам полагалось сдавать отработанный жир на утилизацию, заключив для этого контракт с одной из уполномоченных компаний по вывозу отходов. На деле же многие привычно игнорировали этот закон и продолжали сливать отработанное масло в канализационные люки.
34
Отработанное растительное масло с предприятий пищевой промышленности и общественного питания, сливаемое из фритюрниц и подлежащее утилизации и промышленной переработке (на мыло, косметику, кормовые добавки, биотопливо и т. п.).