Чтение онлайн

на главную - закладки

Жанры

Голая статистика. Самая интересная книга о самой скучной науке
Шрифт:

Все это выглядит особенно убедительно в перерыве матча за Суперкубок, если дегустацией руководит бывший арбитр NFL (в соответствующей униформе). Вместе с тем это действо происходит в прямом телеэфире. Даже если статистикам из Joseph Schlitz Brewing Company предварительно удалось выяснить (в результате многочисленных дегустаций, проводившихся в частном порядке), что типичный любитель Michelob в половине случаев предпочтет пиво Schlitz, то как быть, если 100 любителей пива Michelob «начудят» во время дегустации в прямом эфире? Конечно, слепая дегустация равноценна подбрасыванию монетки, но все же как быть, если большинство дегустаторов чисто случайно выберут Michelob? В конце концов, если бы мы собрали тех же 100 парней и попросили их подбросить монетку, то вполне возможно, что в 85 или даже в 90 случаях из 100 выпала бы решка. Такая случайность во время дегустации в прямом эфире стала бы для бренда Schlitz подлинной катастрофой (не говоря уж о потере 1,7 миллиона долларов, затраченных на покупку телевизионного рекламного времени).

Но на помощь пришла статистика! Если бы в нашем мире существовал некий супергерой статистики [19] , то именно сейчас должен был бы появиться в штаб-квартире Joseph Schlitz Brewing Company и поведать о том, что статистики называют биномиальным экспериментом (или экспериментом Бернулли).

Ключевые характеристики биномиального эксперимента таковы: наличие некоего фиксированного числа испытаний (например, 100 дегустаторов), каждое с двумя возможными исходами (Schlitz или Michelob), и одинаковая вероятность «успеха» в каждом испытании. (Я предполагаю, что вероятность отдать предпочтение одному или другому сорту пива равна 50 %; кроме того, я определяю успех как выбор дегустатором пива Schlitz.) Мы также исходим из того, что все испытания независимы, то есть решение одного дегустатора не оказывает влияния на решение другого.

19

Я имею в виду «человека Шести Сигм». Строчной буквой греческого алфавита (сигма) обозначается среднеквадратическое отклонение. «Человек Шести Сигм» – это шесть среднеквадратических отклонений сверх нормы, выраженной в таких понятиях, как статистическая возможность, сила и ум.

Основываясь лишь на этой информации, наш статистический супергерой может вычислить вероятность всех исходов для 100 испытаний, например 52 Schlitz и 48 Michelob или 31 Schlitz и 69 Michelob. Те из нас, кто не претендует на звание супергероя, могут воспользоваться компьютером, чтобы получить тот же результат. Вероятность того, что все 100 дегустаторов выберут пиво Michelob, составляет 1 шанс из 1 267 650 600 228 229 401 496 703 205 376. Должен сказать, что вероятность того, что все дегустаторы погибнут вследствие падения астероида в перерыве матча за Суперкубок NFL, будет, пожалуй, даже меньше. Для нас гораздо важнее тот факт, что те же базовые вычисления позволяют определить суммарную вероятность для целого ряда исходов, например вероятность того, что 40 или меньше дегустаторов предпочтут пиво Schlitz. Эти подсчеты наверняка развеют опасения сотрудников маркетингового отдела Joseph Schlitz Brewing Company.

Предположим, что Joseph Schlitz Brewing Company вполне бы устроило, если бы по меньшей мере 40 из 100 дегустаторов выбрали пиво Schlitz – впечатляющий результат слепой дегустации, если принять во внимание, что все 100 дегустаторов – любители пива Michelob. Между тем вероятность подобного (очень и очень неплохого) исхода весьма высока. Если такая дегустация действительно равноценна подбрасыванию монеты, то, согласно теории вероятностей, вероятность того, что по меньшей мере 40 из 100 дегустаторов выберут пиво Schlitz, равняется 98 %, а вероятность того, что пиво Schlitz предпочтут как минимум 45 из 100 дегустаторов, – 82 % [20] . Так что теоретически никакого особого риска в затее Joseph Schlitz Brewing Company не было.

20

Для всех этих подсчетов я воспользовался очень удобным биномиальным онлайн-калькулятором с сайта http://stattrek.com/Tables/Binomial.aspx.

Итак, чем же закончился этот трюк для Joseph Schlitz Brewing Company? В перерыве матча за Суперкубок NFL 1981 года в ходе слепой сравнительной дегустации ровно 50 % любителей пива Michelob отдали предпочтение Schlitz.

Из этого примера следуют два важных урока: во-первых, вероятность – чрезвычайно мощный инструмент, и во-вторых, многие ведущие сорта пива в 1980-е годы были практически неотличимы друг от друга. Но в этой главе мы сосредоточимся именно на первом уроке.

Теория вероятностей – это наука о событиях и исходах, содержащих элемент неопределенности. Инвестирование на рынке ценных бумаг сопряжено с неопределенностью. То же касается и подбрасывания монетки, в результате которого может выпасть орел или решка. Подбрасывание монетки четыре раза подряд порождает дополнительные уровни неопределенности, поскольку каждое из четырех подбрасываний способно привести к выпаданию орла или решки. Следовательно, вы не можете заранее знать исход этого эксперимента. Тем не менее я могу с некоторой долей уверенности говорить, что одни исходы (два раза орел, два раза решка) более вероятны, чем другие (четырежды орел). Как справедливо решили сотрудники Joseph Schlitz Brewing Company, выводы, основанные на теории вероятностей, могут оказаться чрезвычайно полезными. Вообще говоря, если вы поймете, почему вероятность выпадания орла четыре раза подряд равняется одному шансу из 16 (если, конечно, при этом не используется монетка со смещенным центром тяжести), то наверняка начнете понимать (приложив немного умственных усилий) буквально все, от принципа работы страховой индустрии до действий профессиональной футбольной команды в той или иной игровой ситуации (например, почему они совершили дополнительный удар после тачдауна или предпочли двухочковый переход).

Начнем с самого легкого: вероятности многих событий известны заранее. Вероятность выпадания орла при однократном подбрасывании «правильной» монетки равняется 1/2 , а единицы при однократном подбрасывании игральной кости – 1/6. Выводы относительно вероятности наступления других событий можно сделать на основе прошлых данных. Вероятность успешного выбивания дополнительного очка после тачдауна в профессиональном футболе составляет 0,94; это означает, что бьющие по мячу игроки совершают в среднем 94 из каждых 100 дополнительных попыток. (Очевидно, что эта величина может несколько разниться у разных игроков; кроме того, она зависит от погодных условий и прочих сторонних факторов, однако не может существенно отклоняться от 0,94.) Наличие такого рода информации и умение правильно ее оценить зачастую облегчает принятие решений и позволяет лучше уяснить риски. Например, Австралийский совет по безопасности на транспорте опубликовал отчет о количественной оценке фатальных рисков при авариях на разных видах транспорта. Несмотря на широко распространенную боязнь летать самолетами, риски, связанные с пассажирскими авиаперевозками, ничтожно малы. Начиная с 1960-х годов в гражданской авиации Австралии не зафиксировано ни одной катастрофы со смертельным исходом; таким образом, коэффициент смертности в расчете на каждые 100 миллионов километров «налета», по сути, равен нулю. Для автомобильного транспорта он составил 0,5. В этом отчете впечатляет показатель для мотоциклистов. Для тех, кого вдохновляет идея стать донором органов, сообщаем: у мотоциклистов доля несчастных случаев со смертельным исходом в расчете на каждые 100 миллионов километров пробега в тридцать пять раз выше, чем у автомобилистов {30} .

30

Australian Transport Safety Bureau Discussion Paper, Cross Modal Safety Comparisons, January 1, 2005.

В сентябре 2011 года 6,5-тонный спутник НАСА начал падение на Землю; ожидалось, что при прохождении плотных слоев атмосферы он распадется на части. Какой была вероятность того, что вам на голову упадет один из осколков этого спутника? Может быть, мне не следовало в те дни отправлять детей в школу? По оценке ученых-ракетчиков НАСА, вероятность попадания одного из фрагментов спутника в какого-то конкретного человека составляла 1 шанс из 21 триллиона. Тем не менее вероятность того, что кто-либо где-либо на Земле будет ушиблен куском этого спутника, оказалась не так уж мала – 1 шанс из 3200 [21] . В конечном счете спутник действительно развалился на части, но куда именно они упали, науке до сих пор неизвестно {31} . Зато известно, что никто не обращался за медицинской помощью по причине такого рода травмирования. Вероятность не говорит нам о том, что случится наверняка; она лишь предупреждает, что может произойти с высокой степенью вероятности или с менее высокой. Здравомыслящие люди могут использовать эти данные у себя на работе или в повседневной жизни. Например, когда вы слышите по радио сообщение о том, что на Землю падает очередной спутник, вовсе не обязательно мчаться домой на мотоцикле, чтобы предупредить семью.

21

Агентство НАСА также предупреждало граждан о том, что даже фрагменты упавшего на Землю спутника являются собственностью государства. Таким образом, каждый, кто найдет и спрячет их у себя (например для коллекции), будет считаться нарушителем закона – даже если найдет их в своем дворе.

31

Marcia Dunn,1 in 21 Trillion Chance Satellite Will Hit You, Chicago Sun-Times, September 21, 2011.

Когда речь заходит о риске, наши страхи не всегда бывают адекватны тому, что говорят нам числа о реальной опасности, которой мы подвергаемся, то есть о том, чего нам действительно следует бояться. Один из поразительных выводов сделали Стивен Левитт и Стивен Дабнер, авторы книги «Фрикономика» [22] (Freakonomics), заявив, что плавательный бассейн во дворе вашего дома гораздо опаснее, чем заряженный револьвер, хранящийся у вас в шкафу {32} . Левитт и Дабнер подсчитали: вероятность того, что ребенок в возрасте до десяти лет утонет в плавательном бассейне, в сто раз превышает вероятность того, что он случайно застрелится, играя с вашим револьвером (если, конечно, найдет его в шкафу) [23] . В интересной статье трех исследователей из Корнелльского университета – Гаррика Блалока, Вринды Кадияли и Дэниела Саймона – сообщается о том, что тысячи американцев, возможно, умерли после теракта 11 сентября из-за страха летать самолетами {33} . Мы никогда не узнаем подлинных рисков, связанных с терроризмом; однако нам доподлинно известно, что вождение автомобиля – опасное занятие. Когда после теракта 11 сентября американцы решили больше ездить наземным транспортом, чем летать, ежемесячное количество дорожно-транспортных происшествий в октябре, ноябре и декабре 2001 года, согласно оценкам авторов данного исследования, увеличилось на 344 случая (с учетом среднего количества погибших и факторов, которые обычно способствуют ДТП, например погодных условий). Со временем – предположительно в результате уменьшения боязни терроризма – этот эффект сам по себе сошел на нет, но, по оценкам исследователей, теракты 11 сентября как таковые привели к более чем 2000 дорожно-транспортных происшествий со смертельным исходом.

22

Левитт С., Дабнер С. Фрикономика. – М.: Манн, Иванов и Фербер, 2010.

32

Steven D. Levitt and Stephen J. Dubner, Freakonomics: A Rogue Economist Explores the Hidden Side of Everything (New York: William Morrow Paperbacks, 2009).

23

Левитт и Дабнер рассуждали примерно так. Каждый год тонут приблизительно 550 детей в возрасте до десяти лет, а 175 детей в возрасте до десяти лет погибают в результате неосторожного обращения с оружием. Левитт и Дабнер взяли за основу следующие коэффициенты смертности: один утонувший ребенок на каждые 11 000 плавательных бассейнов в сравнении с одним смертельным случаем в результате неосторожного обращения с оружием на каждые «миллион с хвостиком» единиц огнестрельного оружия. Что касается подростков, то указанные коэффициенты могут быть совершенно другими, во-первых, поскольку подростки лучше плавают и, во-вторых, могут гораздо чаще быть виновниками трагедии, если у них в руках случайно окажется огнестрельное оружие. Однако в моем распоряжении нет соответствующих данных.

33

Garrick Blalock, Vrinda Kadiyali, and Daniel Simon, Driving Fatalities after 9/11: A Hidden Cost of Terrorism (неопубликованная рукопись, December 5, 2005).

Иногда вероятность может также говорить нам постфактум, что, по-видимому, произошло и что, по-видимому, не произошло – как в случае с анализом ДНК. Когда эксперты в телесериале CSI: Miami находят следы слюны на огрызке яблока рядом с жертвой преступления, в этой слюне нельзя обнаружить имя убийцы, даже если ее рассматривает через мощный микроскоп очень симпатичная девушка-эксперт. Однако эта слюна (или волос, или кусочек кожи или кости) содержит сегмент ДНК, в котором, в свою очередь, есть участки (локусы), специфические для каждого человека (за исключением однояйцовых близнецов, имеющих одну и ту же ДНК). Когда медэксперт заключает, что у некоего образца ДНК выявлено совпадение, это лишь часть того, что предстоит доказать следствию. Да, определенные локусы на образце ДНК, взятом с места преступления, должны совпадать с соответствующими локусами на образце ДНК, взятом у подозреваемого. Тем не менее следователям также предстоит доказать, что такое совпадение неслучайно.

ДНК у разных людей бывают похожи, как и многие другие характеристики: размер обуви, рост, цвет глаз. (Свыше 99 % ДНК у людей идентичны.) Если в распоряжении исследователей есть только малый образец ДНК, на котором можно проверить лишь пару-тройку участков, то вполне возможно, что у тысяч или даже миллионов людей окажется точно такой же генетический фрагмент. Следовательно, чем большее число локусов будет проверено и чем большее естественное генетическое отклонение будет в каждом из них обнаружено, тем определеннее окажется совпадение. Можно сказать и по-другому: тем меньше вероятность того, что данный образец ДНК совпадет с несколькими людьми {34} .

34

Источником общей информации о генетическом тестировании является Human Genome Project Information, DNA Forensics, http://www.ornl.gov/sci/techresources/Human_Genome/elsi/forensics.shtml.

Поделиться:
Популярные книги

Возвышение Меркурия. Книга 16

Кронос Александр
16. Меркурий
Фантастика:
попаданцы
аниме
5.00
рейтинг книги
Возвышение Меркурия. Книга 16

На изломе чувств

Юнина Наталья
Любовные романы:
современные любовные романы
6.83
рейтинг книги
На изломе чувств

Машенька и опер Медведев

Рам Янка
1. Накосячившие опера
Любовные романы:
современные любовные романы
6.40
рейтинг книги
Машенька и опер Медведев

Довлатов. Сонный лекарь

Голд Джон
1. Не вывожу
Фантастика:
альтернативная история
аниме
5.00
рейтинг книги
Довлатов. Сонный лекарь

Не грози Дубровскому! Том VII

Панарин Антон
7. РОС: Не грози Дубровскому!
Фантастика:
фэнтези
попаданцы
аниме
5.00
рейтинг книги
Не грози Дубровскому! Том VII

Великий князь

Кулаков Алексей Иванович
2. Рюрикова кровь
Фантастика:
альтернативная история
8.47
рейтинг книги
Великий князь

Случайная дочь миллионера

Смоленская Тая
2. Дети Чемпионов
Любовные романы:
современные любовные романы
7.17
рейтинг книги
Случайная дочь миллионера

Фиктивный брак

Завгородняя Анна Александровна
Фантастика:
фэнтези
6.71
рейтинг книги
Фиктивный брак

Ох уж этот Мин Джин Хо 2

Кронос Александр
2. Мин Джин Хо
Фантастика:
попаданцы
5.00
рейтинг книги
Ох уж этот Мин Джин Хо 2

Запределье

Михайлов Дем Алексеевич
6. Мир Вальдиры
Фантастика:
фэнтези
рпг
9.06
рейтинг книги
Запределье

Ваше Сиятельство 4т

Моури Эрли
4. Ваше Сиятельство
Любовные романы:
эро литература
5.00
рейтинг книги
Ваше Сиятельство 4т

Разбуди меня

Рам Янка
7. Серьёзные мальчики в форме
Любовные романы:
современные любовные романы
остросюжетные любовные романы
5.00
рейтинг книги
Разбуди меня

Идущий в тени 8

Амврелий Марк
8. Идущий в тени
Фантастика:
фэнтези
рпг
5.00
рейтинг книги
Идущий в тени 8

Ритуал для призыва профессора

Лунёва Мария
Любовные романы:
любовно-фантастические романы
7.00
рейтинг книги
Ритуал для призыва профессора