Основы регрессионного моделирования для психологов
Шрифт:
Мы предлагаем три варианта решения данной задачи. Заметим, что в основе первых двух лежит один и тот же статистический механизм, который определяется отношением вариативности зависимой переменной, отраженной в дисперсии, обусловленной воздействием независимой переменной (фактора), к общей вариативности зависимой переменной, также отраженной в дисперсии. Третий метод, который предложен Чамберсом и который он назвал «метод корреспондирующей регрессии», также связан с оценкой дисперсии, но в отличие от двух первых еще предполагает и применение корреляции.
Первый вариант решения этой задачи, который мы представляем в данном пособии, осуществляется
5
Математическая статистика / В. М. Иванова [и др.]. 2-е изд., перераб. и доп. М.: Высшая школа, 1981.
И если переменные х и у неравноправны (одна больше влияет на другую), то это может быть основанием для того, чтобы одну из них рассматривать как объясняющую (независимую) переменную, а другую – как объясняемую (зависимую) переменную.
Решение вышеназванной задачи на статистическом уровне связано с так называемыми условными средними, образованными вариативностью одной переменной при воздействии другой переменной.
Условное среднее – среднее арифметическое нескольких наблюдаемых значений одной переменной при одном и том же значении другой переменной.
Заметим, что в психологии, если мы в эмпирических результатах не имеем условных средних в зависимой переменной, это является не следствием реального положения вещей, а следствием действия двух причин.
Причина первая связана с тем, что объем выборки слишком маленький, и для появления условных средних необходимо просто увеличить объем выборки.
Причина вторая связана с размерностью шкалы, которую мы использовали в измерении каких-либо психологических переменных (при замере переменных по интервальной шкале). Например, если переменная будет измерена по 5-балльной шкале, то вероятность появления условных средних будет значительно выше, чем в ситуации, когда переменная измерена по 30-балльной шкале.
Практическими примерами разной размерности могут служить две общеизвестные методики изучения личности – Кеттелла и MMPI.
Формула для расчета коэффициента детерминации (2):
где: SSобщая – сумма квадратов отклонений y от общего среднего по y (определяет общую вариативность признака под влиянием всей совокупности факторов, обусловливающих эту вариативность);
SSвнутри – сумма квадратов отклонений y от среднего для y по каждому значению признака x (определяет
Из формулы следует, что чем меньше влияние на дисперсию результативного признака неучтенных факторов, тем выше дисперсия, обусловленная действием самой независимой переменной и, соответственно, тем выше значение 2.
Покажем на примере решение этой задачи.
Пример 1.1. В студенческой группе было проведено исследование уровня агрессивности (тест-опросник Басса–Дарки) и уровня субъективного ощущения студентами своего одиночества (тест-опросник Д. Рассела, Л. Пепло, М. Фергюсона), в результате которого были получены данные, отраженные в табл. 1.1 (x – агрессивность, y – чувство одиночества).
Таблица 1.1
Данные исследования
Если немного поразмыслить по поводу ответа на вопрос, что же, (агрессивность или одиночество) больше влияет друг на друга, то логика может быть такова. Может ли агрессивность быть объяснением чувства одиночества? Пожалуй, да. Может ли чувство одиночества быть объяснением агрессивности? Пожалуй, тоже да.
Решим эту задачу на основе эмпирических результатов через расчет коэффициента детерминации (2).
Определим меру влияния агрессивности на чувство одиночества (
Когда составили таблицу, проведем расчеты
Вначале рассчитаем SSобщую:
Рассчитаем SSвнутри:
Подставим полученные значения в основную формулу:
Вывод: 71 % общей дисперсии чувства одиночества определяет агрессивность и 29 % – те факторы, о которых мы не знаем (случайные переменные).