Социально-психологические аспекты активности
Шрифт:
Для достижения спроектированной величины статистической ошибки ±3,5 % в селах и в городах величина как городской, так и сельской выборок была определена в размере 1000 человек каждая. Таким образом, совокупная выборка исследования составила 2000 человек. Статистическая ошибка на выборке в целом определялась при этом в размере ±2,6 %. Исследованием охватывалось только совершеннолетнее население.
С целью выявления более четких тенденций, характеризующих различия между городом и селом, из генеральной совокупности были элиминированы представители пгт и малых городов. Половина городской выборки была представлена жителями Вологды (общая численность – 293 853 человека, совершеннолетних жителей – 234 975 человек), а половина – жителями
В свою очередь, сельское население было также не полностью представлено в выборке. Из генеральной совокупности были исключены 6 районов к востоку от Тотьмы, имеющие плохую транспортную доступность. Кроме того, из выборки были исключены Вологодский и Череповецкий сельские районы. Это было обусловлено тем, что очень многие жители этих районов работают в Вологде и Череповце и в связи с этим не могут считаться типичными сельскими жителями. И наконец, из выборки были исключены все села с населением меньше 300 человек.
Указанную трансформацию генеральной совокупности необходимо учитывать при интерпретации данных, помня о том, что в дальнейшем под словами «городское население» подразумеваются жители крупных городов, а под словами «сельское население» – жители средних и крупных сел.
В основу расчета выборки легли данные Росстата за 2007 год.
Построение выборки в городах было достаточно простым. В случае невозможности получения полного списка всех членов генеральной совокупности (совершеннолетних жителей Вологды, Череповца и отобранных сельских районов) выборку предполагалось строить с опорой на избирательные участки. Для качественной репрезентации генеральной совокупности было решено взять третью часть городских избирательных участков. Соответственно, в выборку не включались участки, находящиеся на закрытых территориях воинских подразделений, в местах лишения свободы, больницах, санаториях, интернатах и монастырях.
Отбор домохозяйств проходил в два этапа. Искомые избирательные участки отбирались с помощью генератора случайных чисел. После этого на отобранных участках был совершен натурный обход, составлен список имеющихся на участке домовладений, и из упорядоченного списка домохозяйств по шагу были отобраны необходимые квартиры многоэтажных домов и дома частного сектора. Таким образом, в каждом из городов использовалась случайная двухступенчатая кластерная территориальная выборка домохозяйств.
Исходя из требования избиркома о приблизительно равном количестве избирателей на участке, в принципе соблюдавшемся в ходе нарезки участков, было решено на каждом избирательном участке брать одинаковое количество интервью. Отбор респондентов в домохозяйствах велся по ближайшему дню рождения. В соответствии с повышенными требованиями к репрезентативности выборки бесповторный запасной список был изначально минимизирован до 25 % от общей численности основного списка и предназначался исключительно для замены умерших, выехавших и находящихся на длительном лечении респондентов. Однако в дальнейшем в связи с высоким количеством категорических отказов запасной список был с сохранением принципа бесповторности увеличен до 50 % от величины основного.
Построение сельской выборки существенно отличалось от построения городской. В результате, сельская выборка тоже с высокой степенью вероятности может считаться случайной, однако достигалась эта случайность несколько иными способами. Здесь использовалась случайная многоступенчатая стратифицированная кластерная территориальная выборка.
Изначально из полного списка сел области, относительно которых имелось точное подтверждение Госкомстата, что составляющие список поселки являются сельскими населенными пунктами, были элиминированы малонаселенные села, села отдаленных районов, а также села Вологодского и Череповецкого районов. Поскольку муниципальные образования как ступень составления выборки были опущены, районы являлись, таким образом, первичной единицей отбора.
Оставшиеся районы были разбиты по численности населения на группы с шагом 5000 человек. В результате, три группы районов включали 2–3 района, и еще три группы – 5–6 районов. Для того чтобы каждый район имел равную вероятность попасть в выборку, из больших групп было решено отбирать по два района, из маленьких по одному. Количество отбираемых районов определилось как результат компромиссного совмещения двух противоположных тенденций: желания минимизировать временные и финансовые затраты и желания снизить величину дизайн-эффекта. Таким образом, из списка оставшихся районов, представлявших теперь в своих стратах более-менее однородные кластеры, с помощью жеребьевки было отобрано 9 сельских районов.
Список отобранных случайным образом районов представлен в Приложении 1.
При том, что общая величина сельской выборки была определена в размере 1000 человек, численность выборочной совокупности каждого района определялась его долей в генеральной совокупности.
Поскольку условная однородность отобранных сельских районов была дискретной, каждый кластер (район) следовало разделить внутри на страты. Исходя из того, что данное исследование было направлено на изучение тех аспектов психологии представителей больших групп населении, которые сензитивны к степени урбанизированности населенных пунктов, одним из важнейших критериев построения выборки стало число жителей населенного пункта. В этой связи параметры страт были определены следующим образом: страта с численностью населения – от 300 до 500 человек включительно, страта с численностью населения от 501 до 1000 человек включительно и страта с численностью населения свыше 1000 человек.
В результате, каждый район был разделен на три (в случае отсутствия крупных сел – на две) страты, дифференцированные по численности населения. Поскольку проводимое исследование не предполагало сравнения разных страт, было принято решение отказаться от принципа равной представленности страт и принять пропорциональное распределение, что позволяло при статистической обработке отказаться от перевзвешивания ответов, полученных в разных стратах. В результате, выборка внутри каждого района делилась пропорционально соотношению указанных 3 групп сел в данном районе. Следует при этом заметить, что если внутри отдельных районов страты количественно весьма заметно разнились между собой, то по области в целом численность сельского населения в разных стратах оказалась более-менее одинаковой: 36, 35 и 29 %.
На следующем этапе отбора число поселков, репрезентирующих страту, определялось в рамках общей численности респондентов в данной страте, исходя из стандартной средней величины задания одного интервьюера (25–35 интервью). Поселки, представленные в страте, могли расцениваться как достаточно однородные единицы отбора. Поэтому выбор поселков внутри выделенных страт производился с помощью генератора случайных чисел.
Список отобранных случайным образом сел представлен в Приложении 1.
Для обеспечения равной вероятности попадания в выборку каждого человека, проживающего в поселке, люди внутри села отбирались при движении по списку жителей, имеющемуся в сельской администрации, шагом от случайного числа. Перед началом работы из списка исключались несовершеннолетние граждане и лица, состоящие на учете в психиатрических и наркологических диспансерах.
Запасные списки и в этом случае изначально составляли 25 % от величины основных, однако, в отличие от городов, в связи с крайне низким числом отказов они оказались практически не востребованными.
5.2. Реализация выборки
Каждый, кто сталкивался с построением выборки в полевых населенческих опросах, знает, как трудно в реальности соблюдать требования, предъявляемые к выборкам классическими технологиями и международными стандартами [132; 133]. Особенно трудно это делать при выполнении любых оплачиваемых, а значит, связанных с жесткими сроками, коммерческих заказов. И еще труднее реализовывать построенные по строгим технологиям выборки в заказах политических, где счет идет буквально на дни, а то и на часы.