Голая статистика. Самая интересная книга о самой скучной науке
Шрифт:
В этом и состоит суть корреляции.
Приложение к главе 4
Чтобы вычислить коэффициент корреляции между двумя совокупностями чисел, вы должны выполнить перечисленные ниже действия, каждое из которых иллюстрируется путем использования данных о значениях роста и веса для 15 гипотетических учащихся в приведенной ниже таблице.
1. Преобразуйте рост каждого учащегося в стандартные единицы: (рост - среднее значение) / стандартное отклонение.
2. Преобразуйте вес каждого из учащихся в стандартные единицы: (вес - среднее значение) / стандартное отклонение.
3. Для каждого учащегося вычислите произведение (вес в стандартных единицах) x (рост в стандартных единицах). Вы должны увидеть, что это число будет самым большим по абсолютному значению, когда рост и вес ученика расположены относительно далеко от своих средних
4. Коэффициент корреляции представляет собой сумму произведений, вычисленных выше, деленную на количество наблюдений (в нашем случае – 15).
Корреляция между ростом и весом для этой группы учащихся – 0,83. Учитывая, что коэффициент корреляции может находиться в диапазоне от -1 до 1, это относительно высокая степень положительной корреляции, чего и следовало ожидать.
A – Учащийся; B – Рост; C – Вес; D – Рост в стандартных единицах; E – Вес в стандартных единицах; F – (Вес в стандартных единицах) x (Рост в стандартных единицах)
Формула для вычисления коэффициента корреляции требует небольшого отступления, которое понадобится для того, чтобы объяснить систему обозначений, используемую в данном случае. Символ часто применяется в статистике. Он обозначает суммирование величин, которые указаны после него. Если, например, имеется некая совокупность наблюдений x1, x2, x3 и x4, то запись (xi) говорит о том, что мы должны суммировать четыре наблюдения: x1 + x2 + x3 + x4. Таким образом, (xi) = x1 + x2 + x3 + x4. Наша формула для среднего значения совокупности из n наблюдений может быть представлена в следующем виде: среднее значение = (xi)/n.
Мы можем придать этой формуле еще более универсальный вид, записав ее как
С учетом этой универсальной системы обозначений формула вычисления коэффициента корреляции r для двух переменных x и y может выглядеть так:
где
n – количество наблюдений;
xx – среднее значение для переменной x;
yy – среднее значение для переменной y;
x – стандартное отклонение для переменной x;
y –
Любая статистическая компьютерная программа может с помощью статистических инструментов вычислить коэффициент корреляции между двумя переменными. Использование Microsoft Excel в примере с ростом и весом учащихся позволяет получить такую же корреляцию между ростом и весом пятнадцати учащихся, что и вычисление, выполненное нами вручную на основе приведенной выше таблицы: 0,83.
5. Основы теории вероятностей
Не покупайте расширенную гарантию для своего 99-долларового принтера
В 1981 году Joseph Schlitz Brewing Company потратила 1,7 миллиона долларов на необычайно смелую и рискованную маркетинговую кампанию для своего слабеющего бренда Schlitz. В перерыве матча за Суперкубок американского футбола Joseph Schlitz Brewing Company перед 100-миллионной зрительской аудиторией из разных стран мира провела в прямом эфире сравнительную дегустацию пива Schlitz Beer и его главного конкурента – пива Michelob {28} , причем участвовали в ней не случайные люди, а сотня любителей пива Michelob. Это стало кульминацией маркетинговой кампании, проходившей в ходе игр плей-офф NFL {29} . Всего транслировалось пять таких дегустаций; в каждой участвовало по 100 любителей конкурирующих сортов пива (Budweiser, Miller или Michelob), вслепую дегустировавших свой любимый сорт пива и Schlitz Beer. Каждый сеанс сопровождался рекламой, агрессивность которой не уступала агрессивности игр плей-офф (например, «Следите за сравнительной дегустацией Schlitz и Budweiser, проводимой во время игр плей-офф AFC»).
28
David A. Aaker, Managing Brand Equity: Capitalizing on the Value of a Brand Name (New York: Free Press, 1991).
29
Victor J. Tremblay and Carol Horton Tremblay, The U.S. Brewing Industry: Data and Economic Analysis (Cambridge: MIT Press, 2005).
Маркетинговый месседж был совершенно четким: даже те, кому кажется, что они любят другой сорт пива, во время слепой дегустации отдают предпочтение пиву Schlitz. Во время матча за Суперкубок компания даже воспользовалась услугами одного из бывших судей NFL, который выступал в роли наблюдателя за ходом дегустации. Учитывая рискованный характер трансляции подобного действа в прямом эфире, вы, должно быть, подумали, что Joseph Schlitz Brewing Company выпустила потрясающее пиво?
Необязательно. В этом случае компании, которая знает толк в статистике, было достаточно предложить потребителям вполне ординарное пиво. Руководство Joseph Schlitz Brewing Company понимало, что такая уловка – слово, которым я стараюсь не злоупотреблять, даже когда речь идет о рекламе пива, – почти наверняка сработает. Большинство сортов пива в категории Schlitz имеют примерно одинаковый вкус, и парадокс заключается в том, что Joseph Schlitz Brewing Company использовала в своей рекламной кампании именно это обстоятельство. Допустим, что рядовой любитель пива, так сказать «человек с улицы», неспособен отличить пиво Schlitz от Budweiser, Michelob или Miller. В таком случае сравнительная дегустация (выполняемая вслепую) любой пары сортов пива, по сути, равноценна подбрасыванию монеты. В среднем половина дегустаторов-любителей выберет Schlitz, а другая половина – пиво конкурента. Уже один этот факт, скорее всего, не позволил бы провести особо эффективную рекламную кампанию. («Вы не в состоянии уловить разницу, поэтому вполне могли бы пить Schlitz».) С другой стороны, Joseph Schlitz Brewing Company, безусловно, не хотелось бы проводить подобную акцию среди собственных лояльных клиентов, поскольку примерно половина из них предпочла бы какой-либо из конкурирующих сортов пива. А это очень плохо, когда приверженцы вашего бренда в ходе слепой дегустации выбирают какой-либо из сортов конкурентов, – но именно этот прием Joseph Schlitz Brewing Company пыталась против них применить.
Schlitz придумала умнейший ход. Гвоздем ее рекламной кампании стало проведение сравнительной дегустации среди любителей пива, отдающих предпочтение конкурирующим сортам этого напитка. Если слепая дегустация действительно равносильна подбрасыванию монеты, то примерно половина любителей Budweiser, Michelob или Miller обязательно выберет Schlitz. В результате Schlitz предстанет в более выгодном свете, чем конкуренты: половине любителей Budweiser понравилось пиво Schlitz!