Методы случайной выборки

Как можно видеть по рис. 3, основное звено в логической цепи статистического вывода - это случайный выбор подмножества из элементов генеральной совокупности, т.е. извлечение случайной выборки. Существует много различных методов для получения случайных выборок, некоторые из которых слишком сложны. Рассмотрим отдельные из этих методов, наиболее часто применяющиеся в социологии. Каждый метод будет кратко описан и проиллюстрирован примерами.

Простой случайный отбор. Обычно, когда делается вывод о характеристике генеральной совокупности через соответствующие характеристики выборки, предполагается (явно или неявно), что эта выборка является случайной. Наиболее часто имеется в виду тип вероятностной выборки, называемой простой случайной выборкой. Эта выборка получается с помощью простого случайного отбора.

Вероятностная выборка получается, когда каждый элемент или член генеральной совокупности имеет ненулевую вероятность быть включенным в нее. Обратим внимание на тот факт, что в соответствии с определением вероятностной выборки все элементы генеральной совокупности имеют равную вероятность быть выбранными. Вероятность должна быть ненулевой, т. е. ни один элемент генеральной совокупности не должен быть лишен возможности попасть в выборку.

Для простой случайной выборки надо различать две возможные теоретические схемы ее получения - отбор с заменой (рефлексивный отбор, или повторная выборка) и отбор без замены (безвозвратный выбор, или бесповторная выборка). Отбор с заменой означает, что если один элемент генеральной совокупности будет извлечен, то он снова возвращается в генеральную совокупность после измерения необходимой характеристики и, следовательно, при любом из следующих шагов может попасть в выборку повторно. В социологии очень часто (если не всегда), используется отбор без замены. Бесповторная выборка - это такой подход, когда элемент, будучи извлеченным один раз из генеральной совокупности, не возвращается в нее обратно и поэтому он не может быть извлечен повторно. Простой случайный отбор может быть определен с использованием концепции вероятностной выборки следующим образом:

  • 1) все элементы, или члены, генеральной совокупности имеют равную ненулевую вероятность быть извлеченными;
  • 2) все элементы выборки извлекаются независимо друг от друга.

Эта схема действует исключительно для выборки с заменой,

т. е. для повторной выборки.

Для выборки без замены, т.е. бесповторной выборки: все элементы выборки с фиксированным объемом имеют равную ненулевую вероятность быть извлеченными.

Рассмотрим пример. Розыгрыш тиража ЛОТО-2 является иллюстрацией простого случайного отбора без возвращения. Цель в том, чтобы вытащить 6 шаров, т.е. чтобы получить выборку в количестве 6 элементов из генеральной совокупности, которая содержит в общей сложности 49 элементов. При простом случайном отборе с заменой необходимо обеспечить равную вероятность для каждой возможной выборки, состоящей из 6 элементов. Известно, что возможное количество выборок по 6 элементов из 49 будет равно 13 983 816. Таким образом, каждая такая выборка будет иметь вероятность быть извлеченной из генеральной совокупности Р = 1/13 983 816.

В практике существует несколько популярных процедур для получения простых случайных выборок (обоих видов). Предположим, что необходимо сделать 10%-ную выборку из генеральной совокупности, содержащей 500 элементов. Это означает, что должно быть извлечено 50 элементов. Простой случайный отбор предполагает, что все элементы пронумерованы последовательно (в данном случае от 1 до 500). Тогда для извлечения отдельных элементов можно использовать несколько методов: лотерейный, таблицы случайных чисел или генератор псевдослучайных чисел. При наличии современных баз данных использование компьютера для генерации (поиска) случайных чисел (номеров элементов) является более предпочтительным.

Систематический отбор является другой возможной процедурой для получения вероятностной выборки, которая часто используется в практике и научных исследованиях, когда полный список элементов генеральной совокупности может быть просто составлен. При систематическом отборе в выборку попадает каждый k-й элемент из генеральной совокупности по следующей схеме. Эта процедура требует в первую очередь определения объема выборки и размера для систематического отбора. Размер определяется, если разделить число элементов в генеральной совокупности на число элементов, которые должны быть извлечены. Например, пусть генеральная совокупность содержит 15 000 элементов, выборка - 300. Тогда шаг будет равен 15 000 / 300 = 50. Это означает, что в выборке окажется каждый 50-й элемент генеральной совокупности. Следующее действие - выбрать случайное стартовое число, расположенное между 1 и размером шага, в данном случае между 1 и 50. Допустим, что это число равно 23. Первый элемент выборки будет с номером 23. Номера других элементов выборки получаются, если добавим последовательно, начиная с номера 23-го, шаг, пока не получим все нужные нам номера. Следовательно, второй элемент, в нашем примере будет элемент с номером 73, третий - с номером 123 и т. д.

Систематический отбор является более удобным, чем простой случайный отбор, если имеется полный список генеральной совокупности. Проблема возникает, когда размер является дробным числом. Способ, по которому необходимо округлить это число, зависит от конкретного случая.

Существует одно явление, связанное с систематическим отбором, которое называется цикличностью. Это связано с тем, как упорядочена генеральная совокупность. Если элементы списка расположены совершенно случайно, то систематическая выборка эквивалентна простой случайной выборке. Но иногда элементы в списке могут быть упорядочены в соответствии с каким-то критерием. Тогда существует вероятность «зацикливания», т.е. размер получается таким образом, что в выборку попадут элементы, которые представляют не генеральную совокупность в целом, а только некоторую ее часть. Например, пусть объектом интереса являются семьи, состоящие из 2 родителей и 2 детей. Предположим, что список был составлен следующим образом: для каждой семьи сначала отец, затем мать и, наконец, дети, учтенные по возрасту. Предположим, что размах шага равен 12 и мы выбрали случайным образом 5-й номер для первого элемента выборки. Это отец. Следующим членом выборки является номер 17-й, который снова отец, и т. д. В выборку попадут только отцы из-за наличия цикличности.

Кластерный (гнездовой) отбор используется, когда структура генеральной совокупности не позволяет идти по пути простого случайного отбора. Примером является ситуация, когда отдельные группы элементов генеральной совокупности структурированы в большое количество кластеров (ячеек). В этом случае возможно случайным образом выбрать число кластеров. Затем обычно анализируются все элементы из выделенных кластеров. Например, необходимо исследовать учеников 10-го класса. Практически невозможно составить полный последовательный список или применить простой случайный или систематический отбор, поэтому приходится использовать кластерный отбор. Если у нас есть списки классов из всех школ, мы можем выбрать случайным образом нужное количество классов и обследовать всех учеников данных классов. При этом нет необходимости, чтобы в классах было равное количество учеников. Эта схема называется также одношаговым кластерным отбором, так как требуется только один шаг, чтобы добраться до источника необходимой нам информации. Предположим, что мы располагаем не списком классов, а только списком школ. Тогда необходимо применить двухшаговую процедуру: на первом шаге осуществляется случайный выбор соответствующих школ, а на втором - в каждой из выбранных школ, не менее случайно, определяется класс, который попадет в исследование. В зависимости от структуры генеральной совокупности можно использовать и многоступенчатый кластерный отбор.

Стратифицированный отбор. До этого момента предполагалось, что исследуемая генеральная совокупность является однородной по параметрам, которые нас интересуют. Это не всегда бывает так: генеральная совокупность может быть и гетерогенной (неоднородной). Когда исследователь осознаёт, что существует субгенеральная совокупность, он имеет все основания разбить генеральную совокупность на две или более субгенеральные совокупности, называемые стратами. Этот процесс именуется стратификацией. Затем применяются соответствующие процедуры для получения выборки из каждой страты в отдельности.

Одной из основных задач стратифицированного отбора является задача получения репрезентативной выборки. Очевидно, процедура обеспечивает попадание представителей каждой страты в конечную выборку. В процессе стратификации исследователь должен решить и проблему с количеством случаев, которые будут выбраны для каждой страты. Наиболее часто используется выбор с пропорциональной вероятностью. Это означает, что из каждой страты в выборку попадает такое количество случаев, которое пропорционально объему страты во всей генеральной совокупности. Пусть N - объём генеральной совокупности, Ns - объём страты, п - объём всей выборки, a ns - объём выборки для данной страты. Тогда выбор с пропорциональной вероятностью требует выполнения соотношения А7/ЛГ = n/ng. Например, пусть генеральная совокупность является стратифицированной по критерию местожительства опрошенных лиц, поскольку предполагается, что этот признак влияет на интересующее нас явление. Допустим, были выделены 4 страты, а именно: люди, живущие в Ростове, - 14 %, в районных центрах - 28 %, в малых городах - 25%, в сельской местности - 33%. Для общей выборки определен объём в 1000 человек. Тогда от каждой из перечисленных страт должно быть взято: из числа живущих в Ростове - 140, живущих в районных центрах - 280, живущих в малых городах - 250 и проживающих в сельской местности - 330 человек. После того как мы определили объём каждой подвыборки, отбор для каждой страты может быть выполнен по различным схемам, но так, чтобы не нарушить требование к выборке быть случайной. Наиболее часто используется вариант простого случайного или систематического отбора.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >