Ложь, наглая ложь и статистика. Приемы, которые помогут видеть правду за цифрами
Шрифт:
Так что вот второй мой совет: попробуйте учитывать оба подхода, и взгляд птицы, и взгляд червячка. Часто они будут различаться, вплоть до того, что будет непонятно, как и то и другое может быть правдой. С этого и стоит начать расследование. Иногда статистика может вводить в заблуждение, иногда заблуждаться могут наши глаза, а иногда, как только мы поймем, что тут вообще происходит, противоречия как не бывало. Нередко для этого нужно задать себе ряд толковых вопросов – в том числе и тот, с которым мы познакомимся в следующей главе.
Правило третье
Не спешите с подсчетами
Когда поймете, что значит ваш вопрос, то и ответ поймете.
Это был вопрос жизни и смерти. Смертность новорожденных в Соединенном королевстве сильно отличалась от региона к региону. Может, врачи и медсестры могут как-то спасти этих детей? В больницы с низкой смертностью отправили медиков. Их задачей было узнать, какие методы достойны подражания, и подумать, есть ли смысл полностью изменить систему помощи матерям и детям у себя в больницах.
Но доктору Люси Смит из Лестерского университета упорно казалось, что здесь что-то не так1. Поэтому она детально изучила данные двух групп больниц: одной в центральных графствах Англии, а другой в Лондоне. Контингент этих больниц был более-менее одинаков, но в Лондоне новорожденные умирали значительно реже. Действительно ли в лондонских больницах, родильных палатах и отделениях реанимациях действуют иначе?
Доктор Смит выяснила, что нет. Разница в смертности объяснялась совсем иначе.
Когда беременность прерывается на двенадцатой или тринадцатой неделе, любой врач назовет это выкидышем. Если ребенок родится недоношенным на двадцать четвертой неделе или позже, это, в соответствии с законами Соединенного королевства, должно быть зарегистрировано как рождение. Но если беременность прерывается накануне этого срока, скажем, на двадцать второй или двадцать третьей неделе, не очень понятно, как описать эту ситуацию. Плод в этом возрасте крошечный, не больше взрослой ладони. Шансы, что он выживет, очень малы. Многие врачи называют такие трагические ситуации «поздним выкидышем» или «поздней гибелью плода», даже если у крошки какое-то время билось сердце или он успел сделать несколько вдохов. Доктор Смит рассказывает, что многие родители, прошедшие через это испытание, твердо убеждены, что слово «выкидыш» не соответствует ситуации. Возможно, именно с целью помочь таким родителям пережить горе врачи в центральных графствах стали называть это иначе: ребенок родился живым, но вскоре умер.
К счастью, беременности редко обрываются на 22 или 23 неделе. Но, произведя ряд нехитрых расчетов, Люси Смит обнаружила, что разница в том, как такие случаи описывались в статистических подсчетах, и являлась причиной разрыва смертности между двумя регионами. Значит, у новорожденного в Лондоне вовсе не было больше шансов выжить. Разница была не между событиями, а между тем, как эти события фиксировались.
Та же разница в терминологии влияет на сравнение статистики целых стран. В США невероятно высокая для такой обеспеченной страны смертность младенцев: в 2010 это была 6,1 смерть на тысячу живорождений. В то же время в Финляндии эта доля составляет всего лишь 2,3. Оказывается, что американские врачи, как и их коллеги в центральных графствах Англии, намного чаще регистрируют беременность, оборвавшуюся на 22 неделе, не как выкидыш, а как живое рождение, за которым последовала ранняя смерть. Причина может быть связана с культурой, законами или финансами. Это неважно: важно, что высокая смертность младенцев в США объясняется тем фактом, что рождения до 24 недели там регистрируют как рождение живого ребенка, а в других странах – как выкидыши (что не является, впрочем, единственной причиной различий в статистике). Если посмотреть на информацию о рожденных после 24 недели, то статистика по США падает с 6,1 до 4,2 смертей на 1000 живых рождений. В Финляндии же изменение незначительно: с 2,3 до 2,12.
Та же проблема возникает, если сравнивать данные по разным периодам в одной и той же стране. Когда в 2015 и 2016 году в Англии и Уэльсе выросла смертность младенцев, хотя до этого она стабильно снижалась, журналисты стали бить тревогу – что неудивительно.
Такая вероятность есть. Но группа врачей в письме «Британскому медицинскому журналу» отметила, что в официальной статистике также отмечается резкий рост живых рождений на 22 неделе беременности и даже раньше4. Похоже, что все больше врачей следовали примеру центральных графств и вместо «поздних выкидышей» регистрировали живое рождение, за которым последовала преждевременная смерть. И этого было достаточно, чтобы объяснить рост статистики младенческой смертности.
Из этого можно сделать важный вывод.
Зачастую в поисках объяснения на самом деле ищут виновных.
Если младенческая смертность растет, может, причина в том, что политики выделяют слишком мало средств на здравоохранение? А может, матери курят или набирают лишний вес? В Лондоне младенческая смертность ниже, чем в центральных графствах, – что же больницы центральных графств делают не так?
На самом деле виновных, может быть, и вовсе не было.
Пытаясь понять утверждение, завязанное на статистике, – неважно, какое именно, – начать следует с того, чтобы спросить себя, что же на самом деле это утверждение означает.
На первый взгляд измерение младенческой смертности – занятие печальное, но простое: подсчитать, сколько младенцев умерли. Но поразмыслите немного, и вы поймете, что понять, плод перед нами или младенец, вовсе не просто. Именно этот сложный этический вопрос является причиной одного из самых болезненных споров в политике США. Но статистика должна же где-то провести границу. Если мы хотим понять, что же происходит на самом деле, нужно понять, где именно находится эта граница.
Похожие вещи происходили и в пандемию. Сегодня, 9 апреля 2020 года, новостные источники сообщают, что за последние 24 часа на основной территории Великобритании от ковида умерли 887 человек – однако мне известно, что это число неверно. Согласно информации от Шейлы Бирд, шотландской специалистки по статистике и исследовательницы данных, в реальности это что-то около 1500 человек5. Откуда такая разница? Отчасти потому, что кто-то умер у себя дома, а статистика сообщает только о тех, кто умер в больницах. Но основная причина в том, что переполненные больницы публикуют данные с задержкой в несколько дней. Те смерти, о которых сообщили сегодня, в четверг, случились, скорее всего, в воскресенье или понедельник. А так как количество смертей растет по экспоненте, информация трехдневной давности не дает нам представления о том, что сейчас дела обстоят куда хуже.
Статистика как дисциплина основана на измерениях и подсчетах. Майкл Бластлэнд, один из создателей программы «Более-менее», говорит так: представьте себе двух овец в поле. Сколько в поле овец? Ясное дело, две. Только вот одна овца – не овца, а ягненок. А другая на позднем сроке беременности – точнее, у нее сейчас схватки, и она вот-вот родит. Сколько, значит, овец? Одна? Две? Две с половиной? Вот как, оказывается, сложно считать до трех. Говорим ли мы о том, сколько в больнице медсестер (как насчет тех, кто работает неполный день – их считать за одну или за двух?) или о богатстве сверхбогатых людей (считаем ли мы то, что они указали в налоговой декларации, или пытаемся прибавить к этому капитал, который они прячут?), важно понимать, что именно и как мы измеряем и считаем.
Удивительно, как редко это происходит. После многолетних попыток вывести людей из статистических лабиринтов я понял, что большинство проблем, с которыми я столкнулся, объяснялись тем, что люди с самого начала повернули не в ту сторону. Они углублялись в дебри статистической математики, спрашивая об ошибках выборки, пределе погрешности, спорили, растет ли число или падает, принимали на веру, сомневались, разбирали на части и анализировали – и ни на минуту не задавались самым очевидным вопросом: а что именно мы измеряем и подсчитываем? Какое определение для этого используем?