Чтение онлайн

на главную - закладки

Жанры

Метод. Московский ежегодник трудов из обществоведческих дисциплин. Выпуск 4: Поверх методологических границ
Шрифт:

Таким образом, множественная регрессия может рассматриваться как удобный метод сравнительных политологических исследований, основанных на идее сравнения сравнимого. Естественно, массив данных в рамках регрессионного анализа также трактуется как выборка, а получаемые регрессионные коэффициенты считаются выборочными оценками, на основе которых необходимо осуществлять статистический вывод.

Однако не всегда интересующая исследователя зависимая переменная является непрерывной. Диапазон возможных значений многих показателей зачастую бывает ограничен. Например, некоторые экономические показатели неотрицательны, а на ряд вопросов в социологических анкетах предусмотрены лишь несколько вариантов ответа: «да» или «нет»; «согласен», «не знаю» или «не согласен».

В таких случях оценивание классической модели линейной регрессии некорректно и даже ошибочно. Задачу выявления связи между зависимой переменной, которая принимает

только два значения (1 – «успех» (в статистическом смысле), 0 – «неуспех»), и рядом предикторов решают модели бинарного выбора. В общем случае, когда есть несколько категорий «отклика», но их количество мало, используются модели множественного упорядоченного и неупорядоченного выбора.

Статистическая связь между предикторами и «откликом» выражается в виде вероятности того, что «отклик» примет некоторое значение при заданных величинах объясняющих переменных. С помощью этого класса моделей можно изучать характеристики, которые обусловливают то, какие покупки совершает индивид, какую учебную программу он выбирает, за кого он голосует, если ходит на выборы. Например, в исследовании Джеффри Мондака (Jeffery J. Mondak) анализировалась связь между политической грамотностью (правильными ответами на вопросы с политической тематикой) и рядом социально-демографических характеристик респондентов [Mondak, 2000]. На данных национальных избирательных опросов в США (National Election Studies) 1992 г. было показано, что при переходе в следующую образовательную категорию (всего их было задано шесть) вероятность быть политически грамотным растет при неизменных значениях прочих переменных.

Довольно часто исследователи нацелены на работу с более чем двумя показателями. Иногда, правда, количество показателей столь велико, что непосредственная работа со всем их множеством затруднительна. Возникает задача сжатия информации, снижения количества признаков (иными словами, снижения размерности признакового пространства).

Возможными вариантами решения этой задачи являются экспертное оценивание или конструирование интегральных индексов. Для характеристики той или иной синтетической категории используются зачастую экспертные оценки, способные обобщить существующие в этой связи знания и другие неизмеряемые естественным образом особенности. Вместе с тем существует позиция, что использование экспертных оценок снижает научную ценность и прогностическую силу проводимых исследований. Подобное заключение в некоторой мере оправдано, но в социальных науках практически невозможно обойтись без экспертного мнения, хотя подобные опросы очень сложны в подготовке и проведении, а также являются дорогостоящими [см. например: Ахременко, 2006, с. 206–207].

Столь же неоднозначны мнения по поводу индексов, обобщающих представление о возможных выражениях понятий и их свойств. Во многих случаях исследователи «проявляют определенную смелость, суммируя цифры, которые, как кажется, суммировать не имеет смысла» [Ахременко, 2006, с. 130]. Однако мы нуждаемся в индексах, поскольку зачастую нас интересует множество показателей, моделирующих тот или иной теоретический концепт или процесс.

К методам снижения размерности многомерного признакового пространства относятся компонентный анализ и факторный анализ. Оба подхода позволяют на выходе получить небольшое число обобщенных характеристик, довольно полно описывающих изменчивость одного или нескольких латентных (ненаблюдаемых) признаков, стоящих за исходными частными критериями. Ни метод главных компонент, ни факторный анализ не делят переменные на зависимые и объясняющие.

Метод главных компонент (МГК) был предложен К. Пирсоном в 1901 г. и сейчас активно применяется во множестве естественных и социальных наук. С его помощью можно сжать изображения и видео, отделить значимую информацию от «шума», описать бактериальные геномы, составить индексы состояния окружающей среды, инвестиционной привлекательности регионов или коррупции в странах мира.

В МГК на входе имеется исходный набор признаков x (1), x (2), .., x (p), измеренных в количественной шкале, который содержит в себе информацию, и этой информацией является дисперсия исходных показателей. МГК позволяет значительно уменьшить размерность исходного признакового пространства с минимальными потерями путем избавления от дублирующейся информации, содержащейся в сильно коррелированных признаках. Результатом является свертка имеющихся переменных в новые, некоррелированные между собой (ортогональные) «компоненты» y1, y2, .., yp,

первые несколько из которых объясняют большую долю общей дисперсии исходных признаков.

Полученная первая главная компонента y1 максимально объясняет дисперсию исходных признаков. Вторая главная компонента y2 объясняет максимально возможную долю оставшейся дисперсии и т.д. Доля дисперсии, которую объясняют последние компоненты, настолько мала, что от этих компонент можно отказаться без существенной потери информации. Количество компонент, которые будут извлечены по результатам МГК, зависит от исследователя и стоящей перед ним задачи. Существуют различные рекомендации относительно того, сколько главных компонент следует извлекать. Например, предлагается руководствоваться соображениями того, что извлеченные главные компоненты должны объяснять не менее 70–80% дисперсии исходных признаков [Analysis of multivariate social science data, 2008, р. 124]. Так или иначе важно, чтобы полученные компоненты могли быть содержательно интерпретированы. Интерпретация j компоненты осуществляется на основании того общего, что есть в частных критериях, объединенных в одну компоненту.

Многие категории политической науки являются сложными, многоаспектными, а возникающие при их формализации признаковые пространства – многомерными. Примерами таких признаков являются политические убеждения, государственная состоятельность [Стукал, Хавенсон, 2012], социально-экономический статус, уровень интеллекта и т.п., работа с ними требует обращения к методам измерения латентных переменных.

Методы измерения латентных переменных состоят в изучении взаимосвязей доступных для наблюдения показателей, отражающих некоторую латентную синтетическую категорию, и последующем моделировании ненаблюдаемых переменных. Допуская, что отдельные показатели могут характеризовать разные стороны ненаблюдаемого признака, мы принимаем тот факт, что их изменчивость во многом обусловлена изменчивостью латентного признака. Такая модель схожа с моделью регрессии и тоже содержит требования относительно распределения ошибок, но «отклик» в ней ненаблюдаем в принципе, поэтому о связи «предикторов» и «отклика» ничего нельзя утверждать однозначно.

Задача моделирования латентных переменных состоит в том, чтобы выяснить, можно ли наблюдаемую связь между несколькими переменными объяснить небольшим числом латентных признаков – факторов.

Самым первым и распространенным методом измерения латентных переменных является факторный анализ. Для его реализации требуется, чтобы и ненаблюдаемый «отклик», и наблюдаемые индикаторы были непрерывными величинами. Основным источником информации при этом является корреляционная матрица наблюдаемых переменных. Свои методы есть для категориальных признаков, а также для случаев признаков в разных шкалах [Стукал, Хавенсон, 2012, с. 244–246] (см. табл. 1).

Таблица 1

Классификация методов измерения латентных переменных

Источник: [Analysis of multivariate social science data, 2008, p. 177].

В факторном анализе выделяются два типа: разведывательный (exploratory) и подтверждающий (confirmatory). В первом типе не проводится проверка гипотез, он помогает проанализировать структуру связей в данных и сформулировать гипотезы, во втором типе, наоборот, проводится проверка гипотез о количестве факторов и нагрузках.

Метод главных компонент и факторный анализ часто дают близкие результаты и иногда МГК считают частью факторного анализа. Тем не менее это не так, хотя и появились они в одно время (факторный анализ был предложен Ч.Э. Спирменом в 1904 г. для изучения интеллекта). Во-первых, они различны потому, что метод главных компонент относится к описательным методам математической статистики, а факторный анализ является методом моделирования. Это значит, что для моделей факторного анализа релевантны понятия допущения о характере распределения переменных, оценивания, статистической значимости, качества модели и статистического вывода. Во-вторых, этапы проведения факторного анализа исходно формулируются так, чтобы сначала содержательно определить ненаблюдаемую категорию, интересующую исследователя, и уже потом подбирать измеримые показатели, характеризующие ее, тогда как для МГК набор исходных признаков предполагается заданным (стоит отметить, что на практике оба метода зачастую реализуются с нарушением такой последовательности) [Analysis of multivariate social science data, 2008, p. 177].

Популярные книги

Барон меняет правила

Ренгач Евгений
2. Закон сильного
Фантастика:
фэнтези
попаданцы
аниме
5.00
рейтинг книги
Барон меняет правила

Последняя Арена 9

Греков Сергей
9. Последняя Арена
Фантастика:
рпг
постапокалипсис
5.00
рейтинг книги
Последняя Арена 9

Инквизитор Тьмы

Шмаков Алексей Семенович
1. Инквизитор Тьмы
Фантастика:
попаданцы
альтернативная история
аниме
5.00
рейтинг книги
Инквизитор Тьмы

Дарующая счастье

Рем Терин
Любовные романы:
любовно-фантастические романы
6.96
рейтинг книги
Дарующая счастье

Барон Дубов

Карелин Сергей Витальевич
1. Его Дубейшество
Фантастика:
юмористическое фэнтези
аниме
сказочная фантастика
фэнтези
5.00
рейтинг книги
Барон Дубов

Бестужев. Служба Государевой Безопасности. Книга вторая

Измайлов Сергей
2. Граф Бестужев
Фантастика:
фэнтези
попаданцы
аниме
5.00
рейтинг книги
Бестужев. Служба Государевой Безопасности. Книга вторая

Последняя Арена 11

Греков Сергей
11. Последняя Арена
Фантастика:
фэнтези
боевая фантастика
рпг
5.00
рейтинг книги
Последняя Арена 11

Последний Паладин. Том 5

Саваровский Роман
5. Путь Паладина
Фантастика:
фэнтези
попаданцы
аниме
5.00
рейтинг книги
Последний Паладин. Том 5

Первый среди равных

Бор Жорж
1. Первый среди Равных
Фантастика:
попаданцы
аниме
фэнтези
5.00
рейтинг книги
Первый среди равных

Черный дембель. Часть 5

Федин Андрей Анатольевич
5. Черный дембель
Фантастика:
попаданцы
альтернативная история
5.00
рейтинг книги
Черный дембель. Часть 5

Кодекс Охотника. Книга XVI

Винокуров Юрий
16. Кодекс Охотника
Фантастика:
фэнтези
попаданцы
аниме
5.00
рейтинг книги
Кодекс Охотника. Книга XVI

Боги, пиво и дурак. Том 4

Горина Юлия Николаевна
4. Боги, пиво и дурак
Фантастика:
фэнтези
героическая фантастика
попаданцы
5.00
рейтинг книги
Боги, пиво и дурак. Том 4

Гридень 2. Поиск пути

Гуров Валерий Александрович
2. Гридень
Детективы:
исторические детективы
5.00
рейтинг книги
Гридень 2. Поиск пути

Сфирот

Прокофьев Роман Юрьевич
8. Стеллар
Фантастика:
боевая фантастика
рпг
6.92
рейтинг книги
Сфирот