ОПРЕДЕЛЕНИЕ ОБЪЕМА ВЫБОРКИ. ОШИБКИ ВЫБОРОЧНОГО НАБЛЮДЕНИЯ. РАСПРОСТРАНЕНИЕ ВЫБОРОЧНЫХ ДАННЫХ НА ГЕНЕРАЛЬНУЮ СОВОКУПНОСТЬ

Выборка, или выборочная совокупность, — это множество случаев (испытуемых, объектов, событий, образцов), с помощью определенной процедуры выбранных из генеральной совокупности для участия в исследовании.

В процессе проведения выборочного наблюдения требуется решить целый ряд вопросов практического характера. Такими вопросами являются определение способа отбора, вычисление ошибок выборки и построение доверительных интервалов выборочных характеристик, а также расчет необходимого объема выборки.

Расчет ошибок выборки позволяет решить одну из главных проблем организации выборочного наблюдения — оценить репрезентативность (представительность) выборочной совокупности. Различают среднюю и предельную ошибки выборки. Эти два вида ошибок связаны следующим соотношением:

где А — предельная ошибка выборки; ц — средняя ошибка выборки;

t — коэффициент доверия, определяемый в зависимости от уровня вероятности.

Величина средней ошибки выборки, в свою очередь, рассчитывается дифференцированно в зависимости от способа отбора и от процедуры выборки (табл. 6.2).

Таблица 6

Формулы расчета средней ошибки выборки для собственно случайной и механической выборок

Метод

Повторный

Бесповторный

отбора

для средней

для доли

для средней

для доли

Формула

Используется несколько подходов к определению объема выборки. Первый из них называется произвольным подходом и основан он на применении «правила большого пальца». Например, бездоказательно принимается, что для получения точных результатов выборка должна составлять 5% от совокупности. Этот подход простой и доступный в исполнении, но не позволяет получать точные результаты. Его достоинством является относительная дешевизна.

В соответствии со вторым подходом объем выборки может быть установлен исходя из заранее оговоренных условий. Заказчик маркетингового исследования, например, знает, что при изучении общественного мнения выборка обычно составляет 1000-1200 человек, поэтому он рекомендует исследователю придерживаться данной величины.

Третий подход означает, что в некоторых случаях главным аргументом при определении объема выборки может быть стоимость проведения опроса. Хотя при этом ценность и достоверность получаемой информации не принимается в расчет.

В четвертом подходе объем выборки определяется на основе статистического анализа. Такой подход предполагает определение минимального объема выборки с учетом требований к надежности и достоверности получаемых результатов.

Так, в случае проведения случайной бесповторной выборки численность необходимой выборки определяется по формуле

где п — число единиц, которые следует отобрать для обследования;

t — коэффициент доверия (вычисляется по специальным таблицам в зависимости от вероятности, с которой можно гарантировать, что предельная ошибка не превысит ^-кратную среднюю ошибку (чаще всего опираются на вероятность 0,954, при которой t составляет 2));

а — выборочная дисперсия (определяют на основе эксперимента, пробного обследования или по аналогам);

А — предельная (задаваемая) ошибка выборки;

N— численность генеральной совокупности.

Пятый подход считается теоретически наиболее обоснованным и правильным в определении объема выборки. Он основан на расчете доверительного интервала.

Доверительный интервал — это диапазон, крайние точки которого характеризуют процент определенных ответов на некий вопрос. Это понятие тесно связано с понятием «среднее квадратичное отклонение получаемого признака в генеральной совокупности». Чем оно больше, тем шире должен быть доверительный интервал, чтобы включить в свой состав, например, 9,5% ответов.

Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе данных, полученных по выборке. При этом исходят из того, что все средние и относительные показатели, полученные по выборке, являются несмещенными и эффективными характеристиками генеральной совокупности.

Очевидно, что стоимость выборки сильно зависит от суммы, которую заказчик готов выделить, и мало зависит от исследователей. Хотя, если требуется увеличить точность вдвое, выборку придется увеличить не в 2 раза, а в 4.

Например, чтобы получить в 2 раза более точную оценку данных полученных опросом 300 чел., потребуется опросить не 600 чел., а 1200.

Основными методами распространения выборочного наблюдения на генеральную совокупность являются прямой пересчет и способ коэффициентов.

Прямой пересчет есть произведение среднего значения признака на объем генеральной совокупности. Однако большое число факторов не позволяет в полной мере использовать точечную оценку прямого пересчета при распространении результатов выборки на генеральную совокупность. На практике чаще пользуются интервальной оценкой, которая дает возможность учитывать размер предельной ошибки выборки, которая рассчитана для средней или для доли признака.

Способ коэффициентов используется в тех случаях, когда выборочное наблюдение проводится для проверки и уточнения данных сплошного наблюдения. Если нужно уточнить данные сплошного наблюдения при осуществлении контроля за выборочными исследованиями, необходимо определить поправку на недоучет. Метод расчета этой поправки широко применяется при исследовании небольших совокупностей, когда можно рассчитать коэффициент недоучета по каждой категории работников и, уточнив данные, распространить результаты на всю совокупность. При этом рекомендуется использовать формулу

где Y — численность совокупности с поправкой на недоучет;

Уо — численность совокупности без этой поправки;

_уо — численность совокупности в контрольных точках по первоначальным данным;

ух — численность совокупности в тех же точках по данным контрольных мероприятий.

Например, если выборочное наблюдение показало, что недоучет величины исследуемого явления составил 5%, то это значение распространяют на сплошное наблюдение, умножая его результат на поправочный коэффициент 1,05.

Покажем практическое применение рассмотренной методики на следующем примере.

Пример 1. В 100 туристических агентствах города предполагается провести обследование среднемесячного количества реализованных путевок методом механического отбора. Необходимо определить, какова должна быть численность выборки, чтобы с вероятностью 0,683 ошибка не превышала 3 путевок, если по данным пробного исследования дисперсия составляет 225.

Решение

Рассчитаем необходимый объем выборки по формуле

В целях ускорения процесса исследования и удешевления сбора материалов целесообразно использовать методы малой выборки. Малой выборкой считается отбор единиц численностью менее 20.

Средняя ошибка малой выборки определяется по формуле где б2мв— дисперсия в малой выборке.

В малой выборке значения коэффициента доверия t зависят не только от вероятности, но и от объема выборки (табл. 6.3).

Таблица 6.3

Значения коэффициента доверия при малой выборке

t

п

5

7

10

12

16

18

20

1,0

0,626

0,644

0,656

0,662

0,666

0,668

0,670

1,5

0,792

0,816

0,832

0,838

0,846

0,848

0,850

2,0

0,884

0,908

0,924

0,930

0,936

0,938

0,940

2,5

0,933

0,953

0,966

0,970

0,975

0,977

0,978

3,0

0,960

0,976

0,984

0,988

0,991

0,992

0,992

Предельная ошибка выборки определяется по формуле

где t — нормированное отклонение или коэффициент доверия.

 
Посмотреть оригинал