Голая статистика. Самая интересная книга о самой скучной науке, Уилан Чарльз

Голая статистика. Самая интересная книга о самой скучной науке

на обложку

Уилан Чарльз

Шрифт:

Эта история произошла в контексте так называемого синдрома внезапной смерти младенцев во время сна (СВСМ) – явления, когда вполне здоровый малыш умирает в своей кроватке. (У британцев СВСМ принято называть «смертью в колыбели».) Долгое время СВСМ оставался медицинской загадкой, которая привлекала к себе все большее внимание по мере снижения детской смертности по другим причинам [31] . Поскольку СВСМ настолько таинственен и малопонятен, его феномен породил всевозможные подозрения. Иногда они потдверждались. Время от времени ссылки на СВСМ использовались, чтобы скрыть факты небрежного выполнения родительских обязанностей или даже предумышленного убийства, так как вскрытие далеко не всегда позволяет отличить смерть в силу естественных причин от убийства. Британские прокуроры и суды были убеждены, что один из способов правильно определять причины СВСМ – повысить внимание к семьям с повторными случаями «смерти в колыбели». Сэр Рой Мидоу, известный британский педиатр, часто привлекался к рассмотрению подобных случаев в качестве эксперта. Как поясняется в британском журнале The Economist: «Мысль, которая пришла в голову Рою Мидоу и стала впоследствии известной как “закон Мидоу” (суть ее в том, что одна младенческая смерть – это трагедия, две смерти вызывают подозрение,

а три – это убийство), основывается на том, что если какое-либо событие является достаточно редким, то два или большее число его наступлений в одной и той же семье настолько маловероятны, что нет никаких оснований считать это простой случайностью» {47} . Сэр Рой Мидоу объяснил присяжным, что вероятность внезапной смерти от естественных причин двух младенцев в одной семье чрезвычайно мала и равняется примерно одному шансу из 73 миллионов. Он толковал свои подсчеты так: поскольку случаи «смерти в колыбели» встречаются довольно редко (1 из 8500), вероятность наступления двух смертей в колыбели в одной и той же семье составляет (1/8500)2, что равняется примерно одному шансу из 73 миллионов. Так что здесь явно попахивает предумышленным убийством. Руководствуясь этими доводами, присяжные выносили свои вердикты. В результате, основываясь на статистике смертей в колыбели, присяжные отправили за решетку немалое число родителей (зачастую без учета каких-либо медицинских свидетельств, указывающих на их неумелое обращение с ребенком). В некоторых случаях у родителей, относительно которых возникали подозрения, вызванные необъяснимой смертью кого-либо из их детей в младенческом возрасте, последующих детей отбирали сразу же после рождения.

СВСМ по-прежнему остается медицинской загадкой, хотя многие из факторов риска, связанных с этим феноменом, удалось выявить. Например, смертность у младенцев можно резко снизить, если ребенка укладывать спать на спину.

The Probability of Injustice, Economist, January 22, 2004.

The Economist объясняет, каким образом неправильная трактовка статистической независимости могла привести к ошибочным выводам в докладе, с которым Мидоу выступал перед присяжными:

Как указывает Королевское статистическое общество (Royal Statistical Society), в рассуждениях Мидоу есть очевидный изъян. Выполненный им подсчет вероятности был бы правильным, если бы смерти в колыбели носили совершенно случайный характер и не были бы связаны с каким-то неизвестным фактором. Но когда речь идет о столь загадочном феномене, как смерть в колыбели, вполне возможно наличие какой-то связи, например некоего генетического фактора, вследствие действия которого угроза потерять по той же причине еще одного ребенка в семье, уже лишившейся одного малыша, гораздо выше, (а не ниже), чем в семьях, где таких случаев не зафиксировано. После того как в результате повторных смертей в колыбели многие родители оказались за решеткой, ученые поверили в реальность существования такой связи.

В 2004 году британское правительство объявило о предстоящем пересмотре 258 приговоров, согласно которым родители, обвинявшиеся в умышленном лишении жизни своих детей, отбывают тюремный срок.

Непонимание, когда события ДЕЙСТВИТЕЛЬНО независимы друг от друга. Еще одна разновидность ошибок возникает, когда события, действительно независимые друг от друга, рассматриваются как взаимосвязанные. Если вы когда-либо окажетесь в казино (место, в котором, с точки зрения статистики, вам лучше вообще не появляться), то обязательно увидите людей, вперившихся взглядом в игральные кости или карты и заявляющих, что они «ожидают должное». Если шарик рулетки пять раз подряд остановился на черном поле, то всякому здравомыслящему человеку понятно, что на следующий раз должно выпасть красное. Нет, нет и еще раз нет! Вероятность того, что шарик остановится на красном поле, каждый раз будет одной и той же: 16/38. Уверенность в том, что это вовсе не так, иногда называют «заблуждением игрока». В действительности, если «правильную» монетку подбросить 1 000 000 раз и каждый раз будет выпадать решка, то вероятность того, что на 1 000 001-й раз выпадет орел, по-прежнему останется 1/2 . Само определение статистической независимости двух событий заключается в том, что исход одного события никак не сказывается на исходе другого. Даже если статистика не убеждает вас, обратитесь к физике соответствующего явления: каким образом выпадание решки несколько раз подряд может повлиять на вероятность выпадания орла в результате следующего подбрасывания монетки? [32]

Вместе с тем в теории вероятностей доказан факт, что если достаточно долго подбрасывать монету, то будут наблюдаться периоды преобладания выпадания орла или решки. Это так называемый первый закон арксинуса. Этот закон не отменяет сказанного автором, а только показывает структуру исходов в испытаниях Бернулли. О данном феномене см., например, классическую книгу В. Феллер. Введение в теорию вероятностей и ее приложения. Т. 1. Глава III. Прим. ред.

Даже в спорте представление о полосе удач и неудач может оказаться иллюзорным. В одной из самых знаменитых и интересных научных статей, посвященных вероятностям, опровергается общепринятое утверждение о том, что в течение одной игры у баскетболистов периодически возникает некая «полоса везения», когда один за другим следуют удачные броски по кольцу (в таких случаях говорят, что игрок «набил себе руку»). Несомненно, большинство спортивных болельщиков станут вас уверять, что игрок, попавший по кольцу, с большей вероятностью попадет по нему при выполнении следующего броска, чем игрок, «промазавший» перед этим. Однако исследование, проведенное Томасом Гиловичем, Робертом Валлоне и Амосом Тверски, которые протестировали феномен «набитой руки» тремя разными способами, говорит об обратном {48} . Во-первых, они проанализировали данные о результатах бросков, сделанных в ходе домашних игр командой НБА «Филадельфия Севенти Сиксерс» (сезон 1980–1981 годов). (На момент его проведения аналогичные данные для других команд НБА отсутствовали.) И «не обнаружили каких-либо свидетельств положительной корреляции между результатами

бросков, следующих друг за другом». Во-вторых, они проделали такое же исследование относительно результатов штрафных бросков в команде «Бостон Селтикс» и пришли к аналогичным выводам. Наконец, они провели управляемый эксперимент с членами мужской и женской баскетбольных команд Корнелльского университета, игроки которых в среднем попадали по кольцу с игры в 48 случаях из 100, когда предыдущий бросок игрока был удачным, и в 47 случаях из 100, когда предыдущий бросок был неудачным. Для четырнадцати игроков в возрасте 26 лет корреляция между результатом выполнения одного броска и результатом выполнения следующего броска оказалась отрицательной. Лишь у одного баскетболиста обнаружилась значительная положительная корреляция между результатом выполнения двух следующих друг за другом бросков.

Thomas Gilovich, Robert Vallone, and Amos Tversky, The Hot Hand in Basketball: On the Misperception of Random Sequences, Cognitive Psychology 17, no. 3 (1985): 295–314.

Разумеется, такой результат полностью расходится с мнением любителей баскетбола. Например, 91 % любителей баскетбола, опрошенных исследователями в Стэнфордском и Корнелльском университетах, согласились с утверждением, что вероятность попадания игроком по кольцу после того, как он выполнил перед этим два или три удачных броска, будет выше, чем в случае, если перед этим он два или три раза промазал. Важный вывод относительно феномена «набитой руки» заключается в наличии разницы между восприятием и эмпирической реальностью. Исследователи замечают, что «интуитивные представления людей о случайности или закономерности тех или иных событий систематически расходятся с положениями теории вероятностей». Нам подчас свойственно усматривать закономерности там, где их и в помине нет.

Как, например, в случае с раковыми кластерами.

Кластеры действительно встречаются. Вы, наверное, читали в газетах (или видели репортаж по телевизору) о том, что в некоем регионе отмечена повышенная заболеваемость редкой формой рака. Возможно, причиной тому является вода, расположенная поблизости атомная электростанция или вышка сотовой связи. Разумеется, любой из перечисленных факторов может реально обусловить развитие столь опасной болезни. (В последующих главах я постараюсь показать, как с помощью статистики можно идентифицировать подобные причинно-следственные связи.) Однако этот кластер (совокупность) случаев заболеваний также может оказаться результатом чистой случайности, даже когда количество заболевших подозрительно велико. Да, вероятность того, что пять человек в одном и том же учебном заведении, или церковном приходе, или на одном предприятии заболеют одной и той же редкой формой лейкемии, может составлять один шанс из миллиона, однако не следует забывать, что существуют миллионы учебных заведений, церковных приходов и предприятий. Не так уж маловероятно, что пять человек могут заболеть одной и той же редкой формой лейкемии в одном из этих мест. Мы просто забываем о всех школах, церковных приходах и предприятиях, где этого не случилось. Возьмем другую разновидность того же исходного примера – вероятность выигрыша в мгновенной лотерее; хотя она может составлять 1 шанс из 20 миллионов, никто из нас не удивляется тому, что кому-то удается выиграть: действительно, что же здесь удивительного, если были проданы миллионы билетов! (Несмотря на мое недоверие к лотереям в целом, меня восхищает лозунг иллинойсской мгновенной лотереи: «Кто-то должен выиграть; возможно, этим человеком окажетесь вы!». И впрямь, почему бы и нет?)

Ниже описан эксперимент, который я провожу со своими студентами, чтобы подтвердить этот базовый постулат. Чем больше аудитория, тем лучше. Я предлагаю каждому из присутствующих вынуть монетку и встать. Затем все подбрасывают монетку, и те, у кого выпадает решка, садятся. Допустим, в аудитории находится 100 студентов; примерно 50 из них займут свое место после первого подбрасывания. Потом мы выполняем это упражнение еще раз, в результате чего останутся стоять примерно 25 студентов. И так далее. Чаще всего после пяти или шести подбрасываний остается всего один человек, у которого пять или шесть раз подряд выпал орел. Я спрашиваю этого уникума: «Как вам это удалось?», или «Вам, наверное, известна какая-то особая методика тренировок, позволяющая достигать определенного результата?», или «Вы, возможно, придерживаетесь какой-то особой диеты, помогающей добиться такого исхода?» Все присутствующие, конечно, воспринимают это как шутку, поскольку наблюдали процесс подбрасывания монетки собственными глазами, к тому же неплохо знают друг друга и понимают, что у человека, которому удалось пять раз подряд поймать монетку орлом вверх, нет никаких особых талантов в этом занятии, а результат, которого он добился, не более чем случайное совпадение. Однако каждый раз, когда мы видим какое-либо аномальное событие вне конкретного контекста, в котором оно произошло, у нас поневоле возникает подозрение, что здесь, помимо чистой случайности, замешано что-то еще.

Ошибка прокурора. Допустим, в суде вы услышали показания, которые сводятся к следующему: 1) образец ДНК, найденный на месте преступления, совпадает с результатами анализа ДНК обвиняемого и 2) существует лишь один шанс из миллиона, что образец ДНК, найденный на месте преступления, совпадет с образцом ДНК, взятым у кого-либо другого (не у обвиняемого). (Ради простоты будем полагать, что вероятности, на которые опирается обвинение, соответствуют действительности.) Готовы ли вы вынести вердикт «виновен» на основе таких доказательств?

Надеюсь, вы не станете торопиться.

Ошибки обвинения случаются, когда контекст статистических доказательств игнорируется. Ниже описаны два сценария, каждый из которых может объяснить доказательства виновности обвиняемого, базирующиеся на результатах анализа ДНК.

Обвиняемый 1. Этот обвиняемый – влюбленный, отвергнутый своей жертвой, – был схвачен полицией за три квартала от места преступления; при нем было найдено орудие убийства. После ареста у него был взят образец ДНК, который совпал с образцом ДНК, взятым с волоска, найденного на месте преступления.

Обвиняемый 2. Этот обвиняемый был осужден несколько лет назад за аналогичное преступление, совершенное в другом штате. Когда суд признал его виновным, у него взяли образец ДНК, который был включен в общенациональную базу данных ДНК (в ней хранятся образцы ДНК более миллиона опасных уголовных преступников). Образец ДНК, взятый с волоска, найденного на месте преступления, сравнили с образцами, хранящимися в базе данных, и обнаружили совпадение с ДНК обвиняемого 2. Однако следствию не удалось обнаружить какую-либо связь последнего с жертвой преступления.