Голая статистика. Самая интересная книга о самой скучной науке
Шрифт:
3. Поимка террористов. В этой ситуации неприемлема ни ошибка первого, ни ошибка второго рода. Именно поэтому в обществе продолжаются дебаты, связанные с поиском подходящего баланса между борьбой с терроризмом и защитой гражданских прав. Основная гипотеза в данном случае заключается в том, что человек не террорист. Как и в обычном уголовном контексте, нам не хотелось бы совершать ошибки первого рода и отправлять невиновных в тюрьму Гуантанамо. Однако в мире, где накоплено большое количество оружия массового поражения, даже одного террориста опасно оставлять на свободе (ошибка второго рода), поскольку это может повлечь за собой поистине катастрофические последствия. Именно поэтому – нравится вам это или нет – власти Соединенных Штатов удерживают в Гуантанамо людей, подозреваемых в терроризме, основываясь при этом даже на меньшей доказательной базе, чем могло бы
Статистический вывод – это не волшебная палочка и отнюдь не безошибочный метод. Тем не менее это замечательный инструмент для осмысления мира. Мы можем глубже понять многие явления нашей жизни лишь путем нахождения им наиболее вероятного объяснения. Многие из нас делают это постоянно (например, мы говорим: «Мне кажется, этот молодой человек, развалившийся на полу в окружении множества пустых банок из-под пива, хватил лишку», а не «Мне кажется, что этого молодого человека, развалившегося на полу в окружении множества пустых банок из-под пива, отравили террористы»).
Статистический вывод лишь формализует процесс.
Приложение к главе 9
Вычисление стандартной ошибки для разности средних значений
Формула для сравнения двух средних значений
где x– среднее значение выборки x
y – среднее значение выборки y
sx – среднеквадратическое отклонение выборки x
sy – среднеквадратическое отклонение выборки y
nx – количество наблюдений в выборке x
ny – количество наблюдений в выборке y
(В числителе вычисляется разность двух средних значений; в знаменателе – стандартная ошибка для разности двух средних значений разных выборок.)
Нулевая гипотеза: средние значения этих двух выборок одинаковы. Приведенная выше формула вычисляет наблюдаемую разность средних значений относительно величины стандартной ошибки для разности средних значений. Как и прежде, мы предполагаем, что имеем дело с нормальным распределением. Если средние значения исходной совокупности действительно одинаковы, то можно ожидать, что разность средних значений двух выборок окажется меньше одной стандартной ошибки в 68 случаях из 100 и меньше двух стандартных ошибок в 95 случаях из 100 (и т. д.).
В приведенном примере с аутизмом разность средних значений двух выборок составляла 71,6 кубических сантиметра при стандартной ошибке 22,7. Отношение этой наблюдаемой разности равняется 3,15; это означает, что средние значения двух указанных выборок отстоят друг от друга более чем на три стандартные ошибки. Как уже отмечалось, вероятность получения выборок со столь различающимися средними значениями в случае, если средние значения исходных совокупностей одинаковы, чрезвычайно низкая. Точнее говоря, вероятность наблюдения разности средних значений, составляющей не менее 3,15 среднеквадратических ошибок, равняется 0,002.
Когда мы использовали пример со сравнением роста профессиональных баскетболистов с ростом мужского населения в целом, я сознательно упустил одну маленькую деталь. Наша нулевая гипотеза заключалась в том, что рост профессиональных баскетболистов такой же, как средний рост мужского населения в целом. Однако я не указал, что в действительности у нас есть две возможные альтернативные гипотезы.
Одна заключается в том, что средний рост профессиональных баскетболистов отличается от среднего роста мужского населения: они могут быть выше или ниже, чем другие мужчины в совокупности. Именно таким подходом вы воспользовались, когда проникли в автобус, угнанный террористами, и определили вес пассажиров, чтобы выяснить, являются ли они участниками исследования Americans’ Changing Lives. Вы могли отвергнуть нулевую гипотезу, что пассажиры угнанного автобуса являются участниками этого исследования, если бы их средний вес был значительно больше, чем средний вес участников исследования, или значительно меньше (как и оказалось на самом деле). Вторая альтернативная гипотеза заключается в том, что средний рост профессиональных баскетболистов превышает средний рост остального мужского населения. В этом случае нам пригодится обычный жизненный опыт, который подсказывает, что рост профессиональных баскетболистов не может быть меньше, чем средний рост остального мужского населения. Различие между этими двумя альтернативными гипотезами определяет, выполняем ли мы проверку гипотез с односторонним или двусторонним критерием.
В обоих случаях мы исходим из того, что будем выполнять проверку значимости на уровне 0,05. Мы отвергнем нулевую гипотезу, если будем наблюдать разницу в росте между указанными двумя выборками хотя бы в 5 случаях из 100, притом что рост в обеих выборках действительно одинаков. Пока все идет нормально!
Однако с этого момента появляются небольшие нюансы. Когда альтернативная гипотеза гласит, что средний рост профессиональных баскетболистов превышает средний рост остального мужского населения, мы будем выполнять проверку гипотез с односторонним критерием. Мы измерим разницу среднего роста между выборкой профессиональных баскетболистов и выборкой обычных лиц мужского пола. Мы знаем, что в случае, если наша нулевая гипотеза верна, мы будем наблюдать разницу не меньше 1,64 стандартной ошибки лишь в 5 случаях из 100. Мы отвергнем нулевую гипотезу, если полученный результат попадает в диапазон, указанный на приведенном ниже графике.
А теперь вернемся к другой альтернативной гипотезе, которая заключается в том, что средний рост профессиональных баскетболистов может быть больше или меньше среднего роста других мужчин в совокупности. Наш общий подход остается неизменным. Как и прежде, мы отвергнем нулевую гипотезу, гласящую, что рост профессиональных баскетболистов такой же, как средний рост мужского населения в целом, если получим результат, который будет наблюдаться не чаще чем в 5 случаях из 100, притом что действительно разницы в росте между этими двумя выборками никакой нет. Различие, однако, состоит в том, что на сей раз мы должны допустить и вероятность того, что рост профессиональных баскетболистов меньше среднего роста других мужчин в совокупности. Таким образом, мы отвергнем основную гипотезу, если средний рост выборки профессиональных баскетболистов окажется значительно больше или меньше среднего роста выборки «обычных» мужчин. Для этого нам понадобится выполнять проверку гипотез с двусторонним критерием. Граница, по достижении которой мы отклоняем нулевую гипотезу, будет другой, поскольку на сей раз мы должны учитывать вероятность большой разницы в средних значениях выборок в обоих направлениях: положительном и отрицательном. Точнее говоря, диапазон, в котором мы отвергнем нулевую гипотезу, разделится между двумя «хвостами». Мы по-прежнему отвергнем основную гипотезу, если получим исход, встречающийся не более чем в 5 % случаев, если рост профессиональных баскетболистов окажется таким же, как у других мужчин в совокупности; правда, на этот раз существуют два разных варианта, при которых мы можем отказаться от основной гипотезы.
Мы отклоним нулевую гипотезу, если средний рост выборки профессиональных баскетболистов окажется настолько больше среднего роста выборки «обычных» мужчин, что мы наблюдали бы такой исход лишь в 2,5 случаях из 100, если средний рост профессиональных баскетболистов действительно не отличается от среднего роста «обычных» мужчин.
Кроме того, мы отвергнем нулевую гипотезу, если средний рост выборки профессиональных баскетболистов окажется настолько меньше среднего роста «обычных» мужчин, что мы наблюдали бы такой исход лишь в 2,5 случаях из 100, если средний рост профессиональных баскетболистов действительно не отличается от среднего роста «обычных» мужчин.