Основы регрессионного моделирования для психологов
Шрифт:
Таким образом, выделим первый важный аспект регрессионного анализа: он не позволяет устанавливать связь каузальную, понимаемую как связь генетическая между явлениями и процессами. Например, установить факт того, что наличие состояния фрустрации всегда приведет к агрессии.
Тогда возникает вопрос: какую же связь позволяет находить регрессионный анализ?
В ответе на этот вопрос дадим характеристику той связи, с которой имеет дело психолог-исследователь после проведения эмпирического исследования, когда выполнены все требования к технологиям сбора эмпирических результатов и соблюдены требования к объему статистической
Если выполнены вышеназванные условия (соблюдены требования к технологиям сбора эмпирических результатов и к объему статистической выборки) и полученные эмпирические результаты нанесены на двумерный график, то мы столкнемся с тем, что всегда одним и тем же значениям одной переменной будут соответствовать разные значения другой переменной.
На рис. 1.1 представлены два возможных варианта графического представления такой ситуации.
Связь, которая представлена на рис. 1.1, называется вероятностной (стохастической).
Стохастическая связь – связь, при которой каждому значению одной переменной значение других переменных соответствует не однозначно, а с определенной долей вероятности.
Рис. 1.1. Варианты диаграмм совместного рассеивания точек (каждая точка – испытуемый) в двумерном исследовании
Количественным выражением такого вида связи является коэффициент корреляции.
При стохастической связи переменные как случайные величины заданы совместным распределением вероятностей величины.
Не вдаваясь в объяснение статистических технологий решения задачи о нахождении количественного выражения данного вида связи (коэффициента корреляции) 3 , охарактеризуем основной недостаток стохастической связи для объяснительного (научного) подхода в исследовательской деятельности.
Он заключается в том, что у нас нет никакой возможности даже с определенной долей вероятности спрогнозировать конкретную количественную выраженность одной переменной при условии, что вторая переменная будет также принимать конкретные количественные значения.
3
В прил. 1 представлена краткая схема расчетов и анализа коэффициента линейной корреляции Пирсона rxy.
Для того чтобы решить эту задачу, необходимо перейти к другому виду выражения этой связи – математическому, позволяющему отражать эту связь в виде определенной математической функции (функциональная связь).
Функциональная связь – связь, при которой каждому значению одной переменной соответствует одно и только одно значение другой переменной, и эта связь выражается какой-либо математической функцией.
Таким образом, выделим второй важный аспект регрессионного анализа: он позволяет устанавливать связь между переменными, выражаемую определенной математической функцией, что дает возможность спрогнозировать конкретную количественную выраженность одной переменной при условии, что вторая переменная
Мы обращаем внимание на тот факт, что когда разговор идет о функциональной связи, подразумевается, что она выражается определенной математической функцией. Различные виды математических функций, которые используют в регрессионном анализе, будут приведены ниже.
В таких рамках регрессионный анализ направлен на поиск ответов на два макровопроса.
Первый – определение возможного наличия связи между переменными, которую можно выразить математической функцией на базе вероятностной (стохастической) связи и которая всегда имеет место в психологии при достаточном объеме эмпирической выборки.
Второй: если эта связь существует, то какой вид математической функции ее отражает?
Поясним на примере. В психологии давно общепризнана закономерность, которая получила название закона Йеркса–Додсона и которая гласит: «По мере увеличения интенсивности мотивации качество деятельности изменяется по колоколообразной кривой: сначала повышается, затем, после перехода через точку наиболее высоких показателей успешности, постепенно снижается». Графически, в самом общем виде, это выглядит как перевернутая парабола (рис. 1.2).
Рис. 1.2. Кривая, отражающая закон Йеркса–Додсона
Как показывает опыт преподавания в вузе, подавляющее число студентов, когда видят эту кривую, не совсем понимают, что представлен вариант кривой, на которой отражена лишь усредненная тенденция изменения значений показателя качества деятельности (зависимая переменная) при изменении значений интенсивности мотивации (независимая переменная).
Можно предполагать, что когда реальные экспериментальные данные наносились на график, в котором по оси абсцисс откладывалось значение такого параметра, как уровень мотивации (в эксперименте – независимая переменная), а по оси ординат – значение такого параметра, как качество деятельности (в эксперименте – зависимая переменная), то график в действительности имел приблизительно следующий вид (на графике отражена тенденция – одному и тому же значению интенсивности мотивации соответствует несколько значений качества деятельности – это получается в силу того, что на один и тот же стимул разные испытуемые показывали разные результаты) (рис. 1.3).
Рис. 1.3. Модель варианта реальных экспериментальных данных в законе Йеркса–Додсона
В реальности связь между двумя переменными носила не функциональный характер, который отражен квадратичной функцией (параболой), а стохастический, выраженный графиком, по форме напоминающим параболу. И только в результате аппроксимации регрессией реальных данных была получена параболическая функциональная зависимость, показывающая, как изменяется в среднем (выделяем специально) качество деятельности (зависимая переменная) при изменении на одну единицу мотивации (независимой переменной).