Введение в логику и научный метод
Шрифт:
и будет равняться 105,7, что указывает на рост уровня прожиточного минимума. Определение весов в подобных случаях – крайне сложная задача; в их установление с неизбежностью включается случайный элемент. Относительная важность является несуммируемым свойством, и если нам удастся расставить предметы в порядке их относительной важности (что само по себе непросто), то приписывание числовых значений тем или иным пунктам осуществляется исключительно под влиянием конвенциональных и субъективных факторов. Однако при использовании различных систем придания весов среднее взвешенное все равно изменяется лишь незначительно, если, конечно, мы не имеем дела с какой-то необычной системой установления весов. Мода
Moda – это предмет группы,
Каковы отличительные преимущества моды? Как и все средние показатели, она представляет распределение свойств внутри группы. Однако она также может представлять природу группы даже лучше, чем среднее арифметическое, поскольку она указывает на самую большую подгруппу некоторой совокупности и, таким образом, указывает на то, какое свойство будет встречаться наиболее часто. Когда офицер, ответственный за снабжение полка, заказывает форму, он исходит из измерений, являющихся модой для роста и талии людей, которые будут эту форму носить. Значение моды не подвержено влиянию резких флуктуаций внутри группы и поэтому может служить справедливой основой для сравнения различных групп. Если природа совокупности определяется через верно сделанную выборку, то использование моды может быть более результативным, чем использование среднего арифметического, поскольку мода является более стабильным средним показателем.
Однако мода не выполняет большинства условий, сформулированных нами для средних показателей (см. с. 412–415). Во-первых, мода недвусмысленно определяется как наиболее часто присутствующий предмет, а положение наиболее частого присутствия может изменяться в зависимости от типа классификации предметов данной группы. Так, предположим, что при рассмотрении успеваемости 47 студентов оценки распределились следующим образом:
Мода находится между 60 и 80, т. е. является больше 60 и меньше или равной 80. Однако интервалы могли бы быть выбраны и иначе. Предположим, что классификация была следующей:
Теперь мода находится между 70 и 90, т. е. больше 70 и меньше или равна 90. Если бы порог удовлетворительной оценки был бы ниже, чем интервал моды, то большее число студентов не получило бы моду при втором методе, чем при первом.
Очень часто бывает так, что в группе нет какого-либо единственного хорошо определенного типа. Это может произойти либо потому, что частота, с которой присутствуют те или иные предметы, примерно одна и та же, либо потому, что в данной группе можно усмотреть несколько различных частотных тенденций. Например, если мы изучаем статистику зарплат, то мы можем отыскать два или более перечня ставок зарплаты, имеющих относительно высокую частоту. В подобных случаях мы не можем говорить о какой-либо единственной моде. Существование нескольких «тенденций» (peaks) в распределении зарплаты указывает на отсутствие однородности в исследуемой группе. Может случиться и так, что будут иметь место несколько различных видов оценки труда, для каждого из которых будет существовать своя мода; однако когда эти различные виды объединяются, то распределение зарплат проявит несколько тенденций.
Более того, мода может оказаться не типичной, даже если она, действительно, соответствует наиболее часто присутствующему предмету в группе. Так, допустим, что в некой общине доход ее членов существенно разнится. Может случиться так, что двенадцать человек получают $1500, тогда как зарплата всех остальных членов, исчисляемых несколькими сотнями, не совпадает ни для кого из них. Тогда зарплата в $1500 будет модой, но при этом вовсе не будет типичной.
Нам следует также отметить, что мода не является функцией всех членов группы, т. к. элиминация нескольких членов может никак не отразиться на моде. Несмотря на то что зачастую данное свойство является преимуществом, тем не менее случается и так, что требуется значение, которое будет зависеть от значений всех членов группы. Более того, не существует какого-либо простого арифметического процесса, описывающего вычисление моды, поэтому на практике детерминация моды зачастую оказывается сложной и неточной. Наконец, мода составной группы не может высчитываться на основании мод тех групп, которые составляют общую группу. Для теоретических исследований данное свойство представляет серьезный
Медиана – это средний термин в последовательности терминов, расставленных по мере их увеличения. Из сказанного следует, что нечетная совокупность предметов всегда будет обладать медианой. Медианой чисел 3, 4, 4, 5, 5, 5, 6 является число 5. Когда же число членов является четным, то медиана обычно определяется как среднее арифметическое двух средних терминов. Медианой группы 40, 50, 50, 60, 70, 90 является 55. Таким образом, медиана – это тот термин в некоторой последовательности терминов, упорядоченных по мере увеличения, которому предшествует столько же терминов, сколько и следует после.
В отличие от среднего арифметического, медиана не подвержена сильному влиянию значительных флуктуаций внутри группы. Поэтому она является относительно стабильным средним показателем и может использоваться для сравнения упорядоченных групп относительно положения их среднего термина. А, в отличие от моды, медиана может определяться с точностью и без труда. Однако медиана, в основном, используется в тех областях, где теоретические или систематические соображения обладают наименьшей значимостью. У нее нет алгебраических свойств, которые позволяли бы высчитывать медиану для некоторой группы на основании медиан составляющих ее подгрупп. Она получила популярность в измерениях в области социологии и психологии, поскольку в этих областях не всегда возможно осуществить фундаментальные измерения, но зато довольно часто можно установить порядок последовательности или шкалу свойств. Это объясняется тем, что медиана определяется по положению соответствующего термина в данной последовательности, а не в силу суммируемых свойств всех терминов. Таким образом, среднее арифметическое IQ некоторой группы детей ничего не говорит об этой группе и совершенно бесполезно для определения уровня интеллекта группы в целом. Однако медиана может использоваться в таких случаях в качестве основы для сравнения; возможность расположения детей по мере увеличения их способностей представляет достаточную значимость. Таким образом, если медианой IQ одного класса является число 95, а другого класса – 105, то при обычных условиях мы можем сказать, что во втором классе больше детей, способных соответствовать некоторому специальному стандарту, чем в первом.
Иногда считается, что числа, большие и меньшие, чем медиана, встречаются в группе с одинаковой частотой. Это не всегда так, особенно в тех случаях, где исследуемые свойства не представляют непрерывной последовательности. Таким образом, когда было рассмотрено 337 лютиков на предмет количества находящихся на них лепестков, было обнаружено, что 312 из них имеют 5 лепестков, 17—6 лепестков, 4–7, 2–8 и 2–9 лепестков. Медиана равнялась 5. Однако очевидно, что количество членов группы, содержащей по 5 лепестков, не равно количеству членов группы, содержащей большее количество лепестков.
§ 3. Виды измерения дисперсии
Мы видели, что группы могут отличаться друг от друга не только своими центральными тенденциями, но также и степенью разброса составляющих их значений.
Амплитуда вариации
Простой способ указать степень разброса значений в группе – это установить амплитуду вариации. Она представляет собой численную разность между максимальными и минимальными значениями признака в рассматриваемой группе. Если доходы в Соединенных Штатах варьируются от $500 до $10 ООО ООО, то амплитуда вариации будет равна $9 999 500. Однако этот метод не является удовлетворительным, поскольку, во-первых, крайние значения вариации могут быть неизвестны, а во-вторых, поскольку добавление или элиминация нескольких зарплат на краях совокупности могут существенно изменить амплитуду вариации. Более того, амплитуда вариации не говорит нам о том, как именно распределяются различные доходы внутри группы. Две группы чисел 1, 5, 5, 6, 6, 7, 7, 7, 10 и 1, 2, 2, 2, 2, 10 имеют одинаковую амплитуду вариации, хотя форма распределения в каждой из этих совокупностей является разной.
Можно найти и более точные методы для обозначения степени вариации. Предположим, рост мужчин в определенной группе, измеренный в дюймах, таков: 61, 63, 64, 65, 65, 66, 67, 68, 69, 72. Средний рост равен 66 дюймам. Теперь высчитаем отклонение каждого роста от среднего роста путем вычитания последнего из каждого отдельного роста. (Можно взять любой средний показатель в качестве основы для высчитывания отклонений. Мы же для простоты ограничимся средним арифметическим.) Отклонения таковы: -5, -3, -2, -1, -1, 0, 1,