Шанс есть! Наука удачи, случайности и вероятности
Шрифт:
Автодром Херес, последний заезд «Формулы-1» 1997 года. В этом Гран-при Михаэль Шумахер на одно очко опережает своего давнего соперника Жака Вильнёва – благодаря блистательной тактике вождения своего товарища по команде «Феррари» Эдди Ирвайна, отлично проявившего себя в предыдущей гонке. Товарищ Вильнёва по «Уильямсу» Хайнц-Харальд Френтцен может проделать сегодня такой же трюк, так что квалификация в поул-позишн [6] еще важнее, чем обычно.
Что же происходит? Вильнёв, Шумахер и Френтцен финишируют с абсолютно одним и тем же результатом – 1 мин 21,972 с. Потрясенные комментаторы сочли это неслыханным, поразительным совпадением. Что ж, и вправду совпадение,
6
Поул-позишн («позиция у столба») – в автогонках первая позиция на стартовой решетке, дающая некоторое преимущество в силу того, что благодаря геометрии трека машина проходит при этом наименьшее расстояние до финиша. Понятно, что разница расстояний здесь очень невелика.
Подобные вопросы возникают не только в спорте. Они появляются повсюду. Порой они тривиальны, а порой имеют очень важное значение. Удивительно ли, что вы встретили свою двоюродную бабушку Луизу, проживающую в Швеции, в этом конкретном стрип-баре Сан-Франциско? Три участницы рождественской вечеринки явились в одинаковых платьях – вправду ли это такая неожиданность? В науке тоже много таких вопросов, и куда более серьезных. Насколько значим «лейкемический кластер»? Действительно ли сильная корреляция между раком легких и наличием курильщика в семье доказывает, что пассивное курение опасно?
Один из авторов этого опуса, Джек Коэн, специализируется в области репродуктивной биологии. Как-то раз его попросили объяснить два очень любопытных статистических наблюдения. Во время визита в Израиль ему сообщили, что 84 % детей пилотов израильских истребителей – девочки. «Что в жизни пилота истребителя предопределяет такое преобладание дочерей над сыновьями?» – поинтересовались у него. Другую цифру упо мянули в связи с проблемой оплодотворения in vitro. В наши дни клиники, которые занимаются этой процедурой, следят за овуляцией при помощи ультразвука и поэтому могут определить, из какого яичника берется яйцеклетка (и получающийся младенец) – из левого или из правого. В одной клинике обнаружили, что большинство девочек происходят из левого яичника, а большинство мальчиков – из правого. Революция в области выбора пола будущего ребенка? Или просто статистический выброс?
Решить эту проблему не так-то просто. Интуиция здесь бесполезна: когда речь идет о случайных событиях, незачем пытаться что-то «почуять нутром». Многие уверены, что лотерейные номера, которые долго не выпадали, выпадут в будущем с большей вероятностью, чем иные. Такие люди ссылаются на некий «закон средних величин» – мол, в долгосрочной перспективе все должно уравняться. На самом деле все иначе, хотя эта истина и противоречит нашей интуиции. Да, в долгосрочной перспективе у всех лотерейных номеров одинаковые шансы. Но у лототрона нет памяти. Рано или поздно доли выпавших шаров сравняются, но вы не можете заранее предсказать, когда наступит это «рано или поздно». Более того, если вы решите выбрать какое-то конкретное число попыток, каким бы большим оно ни было, самым точным прогнозом окажется следующий: «Всякий первоначальный дисбаланс останется неизменным».
Наша интуиция подвергается еще более тяжким испытаниям, когда речь заходит о совпадениях. Вы приходите в ближайший бассейн, и парень за стойкой наугад берет ключ из коробки, где их полно. Пройдя в раздевалку, вы с облегчением обнаруживаете, что задействованы лишь очень немногие ящики… и тут выясняется, что у трех посетителей ящики рядом с вами, и вы хором извиняетесь, когда соседние дверцы с грохотом ударяются друг о друга. Или, скажем, вы единственный раз в жизни прилетели на Гавайи – и вдруг столкнулись там с венгром, с которым вместе работали в Гарварде. Или вы проводите медовый месяц в Ирландии… и вместе со своей молодой женой встречаете на безлюдном пляже вашего директора департамента вместе с его молодой женой. Такое как раз случилось с Джеком.
Подобные совпадения кажутся ошеломляющими, поскольку мы ожидаем, что случайные события будут распределены равномерно. Вот почему статистические сгустки событий удивляют нас. Мы думаем, что «типичный» набор выпавших номеров в Британской национальной лотерее – что-нибудь вроде «5, 14, 27, 36, 39, 45», а набор «1, 2, 3, 19, 20, 21» кажется нам куда менее вероятным. На самом деле вероятность выпадения у двух этих наборов совершенно одинакова – 1 к 13 983 816. Более того – последовательности из шести случайных чисел будут даже с большей вероятностью «слипаться», нежели «не слипаться».
Откуда мы это знаем? Специалисты по теории вероятностей решают такие проблемы при помощи так называемых выборочных пространств. Выборочное пространство (пространство выборок, пространство элементарных событий) содержит в себе не только событие, которое нас занимает, но и все возможные альтернативы. К примеру, для броска игральной кости выборочное пространство – это «1, 2, 3, 4, 5, 6». Для Британской лотереи выборочное пространство – это множество всех последовательностей 6 различных целых чисел от 1 до 49 включительно. Каждому событию в выборочном пространстве присваивается числовое значение, именуемое его вероятностью и соответствующее тому, насколько возможно данное событие. При честной игре в кости все такие значения равны, и вероятность выпадения каждой цифры составляет одну шестую. То же самое и для лотереи, но там вероятность выпадения каждого номера – 1/13 983 816.
Полезно представить себе размеры выборочного пространства, чтобы оценить, таким ли удивительным является кажущееся совпадение. Вспомним совпадающее время в «Формуле-1». Гонщики высшего класса обычно все мчатся по трассе примерно с одинаковой скоростью, так что логично предположить, что три лучших результата будут отличаться друг от друга не более чем на одну десятую секунды. Если точность измерения составляет одну тысячную секунды, на интервале в одну десятую у нас 100 возможных результатов для каждого спортсмена: этот список и определяет наше выборочное пространство. Предположим для простоты, что вероятность каждого результата здесь одна и та же. Тогда существует вероятность 1/100, что второй гонщик придет в такое же время, что и первый, и вероятность 1/100, что третий придет в то же время, что и двое остальных, а значит, общая оценка вероятности совпадения всех трех результатов (получаемая путем перемножения двух вероятностей) составит 1/10 000. Достаточно малая величина, чтобы удивиться, но все-таки недостаточно низкая, чтобы так уж поражаться. Здесь примерно те же шансы, что и на попадание мяча в лунку с ти-бокса в гольфе.
Подобные оценки помогают объяснять фантастические совпадения, о которых любят писать в газетах: скажем, когда в бридже образуется perfect hand (идеальный расклад), при котором каждый игрок собирает по 13 карт – от двойки до туза. В каждой отдельной партии шансы для такого события исчезающе малы. Но каждую неделю во всем мире играется несметное число партий в бридж. Это число столь огромно, что за каждые несколько недель в ходе всех сыгранных партий обходится все выборочное пространство. Иными словами, следует ожидать, что хоть где-нибудь да выпадет идеальный расклад, и будет он выпадать в полном соответствии со своей малой, но все же ненулевой вероятностью.
Впрочем, использование выборочных пространств не всегда совсем уж прямолинейно. Статистики предпочитают иметь дело с так называемым очевидным выборочным пространством. К примеру, для вопроса об израильских пилотах истребителей они, конечно, включили бы в выборочное пространство всех детей израильских пилотов истребителей. Но это был бы неверный выбор. Почему? Мы зачастую склонны недооценивать (занижать) размер выборочного пространства. Потому-то совпадения и кажутся нам столь удивительными, хотя на самом деле ничего удивительного в них нет. Здесь все сводится к ключевому фактору, который называется «избирательным сообщением результатов» и который традиционная статистика, в общем-то, как правило, склонна игнорировать.