Голая статистика. Самая интересная книга о самой скучной науке
Шрифт:
3. Дезориентирующее описание
«Он – выдающаяся личность!» и другие истинные, но вводящие в заблуждение утверждения
Каждого, кому когда-либо приходилось выбирать себе спутника жизни, фраза «Он – выдающаяся личность!» обычно заставляет насторожиться – и вовсе не потому, что такое описание не соответствует действительности, а потому, что за подобным заявлением человек может что-то скрывать, например факт отсидки в тюрьме или «не до конца» оформленный развод с бывшей женой. Мы не сомневаемся, что этот парень и впрямь выдающаяся личность, но беспокоимся о том, чтобы справедливое в принципе утверждение не использовалось в качестве ширмы с целью замаскировать информацию, выставляющую лицо, о котором идет речь, в неприглядном свете, и тем самым не вводило нас в заблуждение (предполагается, что большинство женщин предпочло бы не встречаться с бывшими уголовниками и брачными аферистами). Утверждение «Он – выдающаяся личность!» само по себе не является
То же самое касается и статистики. Несмотря на то что статистика как область знаний коренится в математике, а математика, как известно, относится к числу точных наук, использование статистики для описания сложных явлений не может быть точным. Это оставляет немалый простор для манипуляций и искажения реального положения вещей. Марк Твен сказал однажды фразу, ставшую впоследствии знаменитой: «Есть три вида лжи: ложь, наглая ложь и статистика» [14] . Как объясняется в предыдущей главе, большинство явлений можно описать множеством разных способов. Если существуют разные способы описания одного и того же явления (например, «он – выдающаяся личность» или «он был осужден за мошенничество с ценными бумагами»), то описательные статистики, которые мы используем (или не используем) при этом, будут оказывать огромное влияние на итоговое впечатление. Кто-то из гнусных побуждений может обыграть даже самые невинные факты и численные показатели ради весьма сомнительных выводов, не имеющих ничего общего с реальной ситуацией.
14
Марк Твен приписывал эти слова британскому премьер-министру Бенджамину Дизраэли; впрочем, каких-либо документальных свидетельств, подтверждающих авторство Дизраэли, не обнаружено.
Для начала давайте определим разницу между такими понятиями, как «точность» и «достоверность». Они не взаимозаменяемы. Словом «точность» мы обозначаем математическую точность того или иного явления. В описании протяженности вашего маршрута от дома до работы значение 41,6 мили будет более точным, чем «примерно 40 миль», которое, в свою очередь, намного точнее словосочетания «этот чертовски долгий путь на работу». Если вы спросите меня, как далеко до ближайшей автозаправки, я отвечу, что до нее 1,265 мили на восток. Это будет точный ответ. Но есть один нюанс: он может оказаться совершенно неточным, если вы ошибетесь в определении направления движения и поедете не строго на восток, а слегка отклонитесь. С другой стороны, если я скажу вам: «Едьте примерно десять минут, пока не увидите закусочную, а еще через пару сотен ярдов справа будет АЗС. Но если на вашем пути встретится ресторанчик Hooters, значит, вы уже проскочили автозаправку», то мой ответ окажется менее точным, чем «1,265 мили на восток», но более содержательным и полезным, поскольку я указал вам путь именно в направлении АЗС. Достоверность – это показатель того, соответствует ли истине рассматриваемое численное значение. Отсюда опасность путаницы между точностью и достоверностью. Если какой-либо ответ достоверный (правильный), то чем больше точность, тем, как правило, лучше. Однако даже самая высокая точность не в состоянии компенсировать недостоверности ответа.
На самом деле точность может маскировать – случайно или вполне намеренно – недостоверность, вызывая у нас ложное ощущение определенности. Паранойя, охватившая Джозефа Маккарти, сенатора от штата Висконсин и ярого антикоммуниста, достигла своего апогея в 1950 году, когда он не только утверждал, что в Госдепартамент США внедрились коммунисты, но и доказывал, что располагает поименным списком этих людей. Во время своего выступления в г. Уиллинг Маккарти потрясал в воздухе листком бумаги, заявляя: «Я держу в руке список из 205 фамилий членов Коммунистической партии. Они известны госсекретарю. Тем не менее эти люди продолжают работать в Госдепе, более того, они формируют внешнюю политику страны!» {12} Впоследствии выяснилось, что Маккарти держал в руке чистый листок бумаги, однако указание точного числа (205) придало словам сенатора большую достоверность, несмотря на столь наглую ложь.
12
Robert Griffith, The Politics of Fear: Joseph R. McCarthy and the Senate, 2nd ed. (Amherst: University of Massachusetts Press, 1987), p. 49.
Я уяснил важное различие между точностью и достоверностью в менее негативном контексте. Однажды жена подарила мне на Рождество лазерный дальномер, чтобы я мог определять на поле для гольфа расстояния от мяча до лунки. Расстояние измеряется посредством лазерного луча: я становлюсь рядом с мячом на гладком поле (или неровной площадке) и навожу устройство на флажок, установленный на лужайке; при этом дальномер вычисляет расстояние, на которое мне предстоит отправить мяч. Это считается более удобным способом, чем стандартные маркеры, обозначающие расстояния в ярдах и только до центра лужайки (таким образом, маркеры позволяют получить правильный, но менее точный результат). С помощью дальномера я мог, например, узнать, что нахожусь в 147,2 ярда от лунки. Я рассчитывал, что точность, обеспечиваемая этой продвинутой технологией, улучшит мои результаты во время игры в гольф. Однако в действительности они заметно ухудшились.
У меня возникли две проблемы. Во-первых, я пользовался этим глупым устройством три месяца, прежде чем до меня дошло, что оно измеряет расстояния не в ярдах, а в метрах; таким образом, каждое точное вычисление (147,2) было неправильным. Во-вторых, иногда я непреднамеренно наводил лазерный луч на деревья позади лужайки, а не на флажок, отмечающий лунку, в результате чего мой «идеальный» удар преодолевал именно то расстояние, которое и должен был преодолеть: мяч пролетал над лужайкой и оказывался в лесу. Урок, который я извлек, касается всего статистического анализа и заключается в том, что даже самые точные измерения или вычисления не должны противоречить здравому смыслу.
Рассмотрим пример ситуации с более серьезными последствиями. Многие из моделей управления рисками, использовавшиеся на Уолл-стрит до финансового кризиса 2008 года, были довольно точными. Концепция «рисковой стоимости» (VaR) позволяла компаниям точно вычислить величину своего капитала, которая может быть потеряна в случае реализации тех или иных сценариев. Проблема состояла в том, что такие сверхсложные модели были эквивалентны настройке моего дальномера в метрах, а не в ярдах. Используемая в этом случае математическая модель была сложной и запутанной. Ответы, которые можно было получить с ее помощью, казались обнадеживающе точными. Однако предположения относительно того, что может случиться с глобальными рынками, встроенными в эти модели, были изначально неверными, в результате чего выводы, полученные с помощью этих моделей, были совершенно неправильными, что привело к дестабилизации не только Уолл-стрит, но и всей мировой экономики.
Даже самые точные описательные статистики могут стать жертвой более фундаментальной проблемы: недостаточной ясности того, что именно мы пытаемся определить, описать или объяснить. У статистических рассуждений и доказательств очень много общего с неудачными браками: участники дискуссии просто не понимают друг друга. Рассмотрим важный экономический вопрос: насколько успешны американские производственные отрасли? Нередко приходится слышать, что количество рабочих мест в них резко сокращается в результате появления новых рабочих мест в Китае, Индии и других странах с низким уровнем заработной платы. Также нередко приходится слышать, что в Соединенных Штатах высокотехнологичное производство по-прежнему процветает и Америка остается одним из ведущих мировых экспортеров товаров промышленного производства. Что же происходит на самом деле? Похоже, это тот случай, когда скрупулезный анализ надежных исходных данных мог бы примирить между собой эти противоречащие друг другу утверждения. Остаются ли американские производственные отрасли прибыльными и конкурентоспособными в глобальном масштабе или проигрывают в борьбе с сильными зарубежными конкурентами?
Верно и то и другое. Британскому журналу экономических новостей The Economist удалось примирить эти две полярные точки зрения на ситуацию в американских производственных отраслях с помощью приведенного ниже графика.
Кажущееся противоречие обусловлено разной трактовкой «благополучия» в американских производственных отраслях. По объему выпускаемой продукции – то есть общему количеству произведенных и проданных товаров – производственный сектор США демонстрировал неуклонный рост в начале 2000-х годов, затем испытал серьезный удар во время Великой рецессии, а теперь уверенно компенсирует потери. Это согласуется с данными, приведенными в справочнике-альманахе ЦРУ The World Factbook («Всемирная книга фактов»), которые показывают, что Соединенные Штаты являются третьим по величине экспортером продукции промышленного производства в мире (после Китая и Германии), то есть по-прежнему остаются одним из мировых локомотивов производства.
Но на графике, приведенном в журнале The Economist, есть еще одна линия, отражающая уровень занятости в производстве. Количество рабочих мест в производственной сфере США неуклонно сокращалось: за последнее десятилетие примерно на шесть миллионов. Указанные две тенденции – рост объема выпускаемой продукции и сокращение занятости – в совокупности объясняют реальную ситуацию в американских производственных отраслях. В производственной сфере Соединенных Штатов наблюдается стойкий рост производительности труда, а это означает, что заводы выпускают все больший объем продукции силами все меньшего числа работников. Это хорошо с точки зрения глобальной конкуренции, поскольку делает американскую продукцию более конкурентоспособной по сравнению с товарами, выпускаемыми в странах с низким уровнем заработной платы. (Одним из способов успешно конкурировать с компанией, выплачивающей работникам 2 доллара в час, является создание эффективного производственного процесса, где один работник, зарабатывающий 40 долларов в час, может делать в двадцать раз больше.) Однако это сопровождается сокращением рабочих мест в производственной сфере, что становится настоящим ударом для тех, кого уволили.