Чтение онлайн

на главную

Жанры

Голая статистика. Самая интересная книга о самой скучной науке
Шрифт:

Чтобы лучше уяснить ситуацию с ДНК, представьте, что ваше «число ДНК» состоит из вашего телефонного номера, присоединенного к номеру вашей карточки социального страхования. Эта последовательность из девятнадцати цифр идентифицирует вас уникальным образом. Допустим, что каждая такая цифра представляет собой «участок» с десятью возможностями: 0, 1, 2, 3 и т. д. Предположим также, что следователи обнаружили на месте преступления остаток некоего «числа ДНК»: _ _ 4 5 9 _ _ _ 4 _ 0 _ 9 8 1 7 _ _ _. Оказалось, что этот фрагмент в точности совпадает с вашим «числом ДНК». Итак, вы – преступник?

Следует обратить внимание на три вещи. Во-первых, все, что меньше чем полное совпадение с полным геномом, оставляет некоторый простор для неопределенности. Во-вторых, чем больше локусов, которые мы можем проверить, тем меньше неопределенность. И в-третьих, важен контекст. Выявленное совпадение было бы чрезвычайно убедительным, если бы нашлись свидетели того, как вы пытались скрыться с места преступления, или если бы у вас в кармане обнаружили кредитную карточку жертвы.

Когда следователи

располагают неограниченным временем и ресурсами, типичный процесс включает в себя проверку тринадцати разных локусов. Шансы, что профиль ДНК у двух разных человек совпадает по всем тринадцати локусам, чрезвычайно малы. Когда для идентификации останков, найденных во Всемирном торговом центре после терактов 11 сентября, использовался анализ ДНК, образцы, обнаруженные на месте трагедии, сравнивались с образцами, предоставленными членами семей жертв теракта. Вероятность, требовавшаяся для позитивной идентификации, равнялась один из миллиарда; то есть вероятность того, что останки принадлежат кому-то другому, а не идентифицируемой жертве, не превышает одного шанса из миллиарда. Впоследствии, по мере того как оставалось все меньше и меньше неидентифицированных жертв, с которыми могли бы быть спутаны останки, этот стандарт был ослаблен.

Если ресурсы ограниченны или имеющийся образец ДНК слишком мал или загрязнен, чтобы можно было проверить тринадцать локусов, ситуация становится более запутанной и спорной. В 2008 году газета Los Angeles Times опубликовала серию материалов, посвященных использованию ДНК при расследовании преступлений {35} . В частности, издание задалось вопросом, не недооценена ли возможность случайных совпадений при использовании стандарта вероятности, определяемого законом. (Поскольку профиль ДНК всего населения не знает никто, то вероятности, на которые ссылаются в суде ФБР и другие правоохранительные органы, носят лишь оценочный характер.) Весьма неоднозначную реакцию в обществе вызвала информация о том, что эксперт-криминалист из Аризоны, выполнявший тесты на основе базы данных ДНК этого штата, обнаружил совпадение ДНК на девяти локусах у двух опасных уголовных преступников, не являющихся родственниками; между тем, согласно ФБР, вероятность такого совпадения равна одному шансу из 113 миллиардов. Дальнейший поиск в других базах данных ДНК позволил выявить свыше тысячи пар людей с генетическими совпадениями на девяти и более локусах. Это может служить серьезным поводом к размышлению для правоохранительных органов и адвокатов. Пока же важный для нас урок заключается в том, что анализ ДНК, на который возлагаются столь большие надежды, хорош лишь настолько, насколько надежны значения вероятности, подкрепляющие его.

35

Jason Felch and Maura Dolan, FBI Resists Scrutiny of‘Matches’, Los Angeles Times, July 20, 2008.

Зачастую бывает очень полезно знать вероятность одновременного наступления нескольких событий. Какова вероятность исчезновения электричества в сети и выхода из строя автономного генератора? Вероятность одновременного наступления двух независимых событий представляет собой произведение их соответствующих вероятностей. Другими словами, вероятность наступления события A и события B равна вероятности наступления события A, умноженной на вероятность наступления события B. Чтобы вам стало понятнее, приведу соответствующий пример. Если вероятность выпадания орла при однократном подбрасывании монетки составляет 1/2 , то вероятность его выпадания при подбрасывании такой же монетки два раза подряд равняется 1/2 x 1/2 = 1/4 ; три раза подряд – 1/8 ; четыре раза подряд – 1/16 и т. д. (Понятно, что вероятность выпадания решки при подбрасывании монетки четыре раза подряд также составляет 1/16.) Это объясняет, почему системный администратор в вашем учебном заведении или офисе постоянно напоминает вам о необходимости усложнить пароль. Если вы используете шестизначный пароль, состоящий только из цифр, мы можем подсчитать количество возможных паролей: 10 x 10 x 10 x 10 x 10 x 10, что равняется 106, или 1 000 000. На первый взгляд, количество комбинаций настолько велико, что угадать пароль сложно, однако компьютер проверит все эти 1 000 000 вариантов за какую-то долю секунды.

Допустим, системный администратор убеждает вас включить в пароль буквы. На данном этапе для каждого из шести разрядов имеется 36 комбинаций: 26 букв английского алфавита и 10 цифр. Итак, количество возможных паролей возрастает до 36 x 36 x 36 x 36 x 36 x 36, или 366, то есть свыше двух миллиардов. Если ваш системный администратор требует, чтобы пароль состоял из восьми цифр, и призывает использовать символы #, @, % и! как в Чикагском университете, то количество потенциальных паролей увеличивается до 468, то есть свыше 20 триллионов.

Здесь нужно сделать одно важное замечание. Эта формула применима только если события независимы; иными словами, когда исход одного события не оказывает влияния на исход другого события. Например, вероятность того, что в результате первого подбрасывания монетки выпадет орел, не влияет на вероятность исхода второго подбрасывания той же монетки. С другой стороны, вероятность того, что сегодня пойдет дождь, не независима от того, был ли он вчера, поскольку грозовые фронты могут сохраняться на протяжении нескольких дней. Аналогично, вероятность того, что сегодня ваш автомобиль попадет в аварию, и того, что он попадет в нее в следующем году, также не независимы друг от друга. То, что привело к аварии вашего автомобиля в этом году, может спровоцировать ДТП и в следующем году: возможно, вы склонны садиться за руль в нетрезвом состоянии, или вам нравится устраивать гонки на дороге, или строчить эсэмэски во время вождения; наконец, не исключено, что вы просто плохой водитель. (Именно поэтому после каждого очередного ДТП ваша страховая ставка повышается; дело не столько в желании страховой компании компенсировать деньги, выплаченные ею согласно страховому договору, сколько в том, что теперь она располагает новой информацией о вероятности вашего попадания в дорожно-транспортные происшествия в дальнейшем, поскольку – после того как вы, заезжая в гараж, сильно поцарапали свой автомобиль – такая вероятность повысилась.)

Допустим, вас интересует вероятность наступления одного (исхода A) или другого (исхода B) события (опять же предполагая, что они независимы). В этом случае вероятность наступления события A или B равна сумме их индивидуальных вероятностей, то есть вероятность A плюс вероятность B. Например, вероятность выпадания 1, 2 или 3 в результате подбрасывания одной игральной кости равняется сумме их отдельных вероятностей: 1/6 + 1/6 + 1/6 = 3/6 = 1/2 . Это должно быть интуитивно понятно. При подбрасывании игральной кости есть шесть возможных исходов. Числа 1, 2 и 3 в совокупности составляют половину из них. Следовательно, вероятность выпадания 1, 2 или 3 вследствие подбрасывания одной игральной кости равняется 50 %. Если вы играете в кости в Лас-Вегасе, то вероятность выпадания 7 или 11 в результате однократного подбрасывания равна количеству комбинаций, составляющих в сумме 7 или 11, поделенному на общее число вариантов, которые могут выпасть в результате подбрасывания двух игральных костей, или 8/36 [24] .

24

Существует шесть способов выбросить 7 при подбрасывании двух игральных костей: (1,6); (2,5); (3,4); (6,1); (5,2) и (4,3) и лишь два способа выбросить 11: (5,6) и (6,5).

Между тем есть 36 возможных вариантов результата подбрасывания двух игральных костей: (1,1); (1,2); (1,3); (1,4); (1,5); (1,6). И (2,1); (2,2); (2,3); (2,4); (2,5); (2,6). И (3,1); (3,2); (3,3); (3,4); (3,5); (3,6). И (4,1); (4,2); (4,3); (4,4); (4,5); (4,6). И (5,1); (5,2); (5,3); (5,4); (5,5); (5,6). И наконец, (6,1); (6,2); (6,3); (6,4); (6,5) и (6,6).

Следовательно, вероятность выпадания 7 или 11 равняется количеству возможных способов выбросить любое из этих двух чисел, деленное на общее количество возможных вариантов при подбрасывании двух игральных костей, то есть 8/36. Между прочим, значительная часть ранних исследований вероятности выполнялась именно любителями азартных игр в попытках точно определить свои шансы.

Вероятность также позволяет подсчитать математическое ожидание – чрезвычайно полезный инструмент, используемый при принятии любых управленческих решений, особенно в сфере финансов. Математическое ожидание – это среднее значение случайной величины. Математическое ожидание, или отдача (функция выигрыша) от некоторого события, например покупки лотерейного билета, представляет собой сумму всех разных исходов, весовыми коэффициентами при каждом из которых являются вероятность исхода и выигрыш. Как обычно, приведем пример, чтобы прояснить смысл сказанного. Допустим, вам предложили сыграть в кости, причем подбрасывается только одна игральная кость. Функция выигрыша в этой игре такова: 1 доллар, если у вас выпадает 1; 2 доллара, если у вас выпадает 2; 3 доллара, если у вас выпадает 3 и т. д. Каково математическое ожидание в случае однократного подбрасывания игральной кости? Вероятность каждого из возможных исходов равняется 1/6, поэтому математическое ожидание вычисляется так:

1/6 ($1) + 1/6 ($2) + 1/6 ($3) + 1/6 ($4) + 1/6 ($5) + 1/6 ($6) = 21/6, или $3,50.

На первый взгляд, математическое ожидание 3,50 доллара кажется относительно бесполезной величиной. В конце концов, вы не можете фактически заработать 3,50 доллара в результате однократного подбрасывания игральной кости (так как ваш доход в любом случае должен равняться целому числу). На самом деле математическое ожидание представляет собой чрезвычайно мощный инструмент, поскольку он может сказать вам, является ли то или иное событие «справедливым», учитывая его цену и ожидаемый исход. Допустим, вам предлагают поучаствовать в описанной выше игре при ставке 3 доллара за каждое подбрасывание игральной кости. Имеет ли смысл соглашаться на такие условия? Да, поскольку математическое ожидание исхода (3,50 доллара) выше, чем стоимость игры (3,00 доллара). Это не означает, что вы обязательно заработаете деньги в результате однократного подбрасывания игральной кости, но помогает уяснить, на какой риск стоит пойти, а на какой – нет.

Этот гипотетический пример можно применить к профессиональному американскому футболу. Как указывалось ранее, после тачдауна команда может либо пробить и заработать дополнительное очко, либо попытаться выполнить двухочковую конверсию. Первый вариант предполагает такой удар по мячу с трехъярдовой линии, в результате которого мяч должен пройти между стойками ворот; второй вариант предполагает пробежку или передачу мяча в концевую зону с трехъярдовой линии, что значительно труднее. Команда может предпочесть более легкий вариант и заработать одно очко или выбрать более сложный вариант и заработать два очка. Как быть?

Поделиться:
Популярные книги

Возвышение Меркурия. Книга 16

Кронос Александр
16. Меркурий
Фантастика:
попаданцы
аниме
5.00
рейтинг книги
Возвышение Меркурия. Книга 16

На изломе чувств

Юнина Наталья
Любовные романы:
современные любовные романы
6.83
рейтинг книги
На изломе чувств

Машенька и опер Медведев

Рам Янка
1. Накосячившие опера
Любовные романы:
современные любовные романы
6.40
рейтинг книги
Машенька и опер Медведев

Довлатов. Сонный лекарь

Голд Джон
1. Не вывожу
Фантастика:
альтернативная история
аниме
5.00
рейтинг книги
Довлатов. Сонный лекарь

Не грози Дубровскому! Том VII

Панарин Антон
7. РОС: Не грози Дубровскому!
Фантастика:
фэнтези
попаданцы
аниме
5.00
рейтинг книги
Не грози Дубровскому! Том VII

Великий князь

Кулаков Алексей Иванович
2. Рюрикова кровь
Фантастика:
альтернативная история
8.47
рейтинг книги
Великий князь

Случайная дочь миллионера

Смоленская Тая
2. Дети Чемпионов
Любовные романы:
современные любовные романы
7.17
рейтинг книги
Случайная дочь миллионера

Фиктивный брак

Завгородняя Анна Александровна
Фантастика:
фэнтези
6.71
рейтинг книги
Фиктивный брак

Ох уж этот Мин Джин Хо 2

Кронос Александр
2. Мин Джин Хо
Фантастика:
попаданцы
5.00
рейтинг книги
Ох уж этот Мин Джин Хо 2

Запределье

Михайлов Дем Алексеевич
6. Мир Вальдиры
Фантастика:
фэнтези
рпг
9.06
рейтинг книги
Запределье

Ваше Сиятельство 4т

Моури Эрли
4. Ваше Сиятельство
Любовные романы:
эро литература
5.00
рейтинг книги
Ваше Сиятельство 4т

Разбуди меня

Рам Янка
7. Серьёзные мальчики в форме
Любовные романы:
современные любовные романы
остросюжетные любовные романы
5.00
рейтинг книги
Разбуди меня

Идущий в тени 8

Амврелий Марк
8. Идущий в тени
Фантастика:
фэнтези
рпг
5.00
рейтинг книги
Идущий в тени 8

Ритуал для призыва профессора

Лунёва Мария
Любовные романы:
любовно-фантастические романы
7.00
рейтинг книги
Ритуал для призыва профессора