Меню
Главная
Авторизация/Регистрация
 
Главная arrow Статистика arrow Общая теория статистики

Нахождение ошибок и объема большой выборки

Одна из задач, которую позволяет решать выборочный метод, — нахождение ошибки выборки. В теории статистики определяют среднюю (стандартную), предельную и относительную ошибки выборочного наблюдения.

В теории вероятностей доказывается, что при случайном и механическом отборах средняя ошибка выборки для средней величины (W.) находится следующим образом:

- для повторного отбора

- для бесповторного отбора:

где Dx — дисперсия количественного признака генеральной совокупности;

к — численность выборки;

п — численность генеральной совокупности.

В реальности Dx, как правило,^неизвестна. Поэтому ее заменяют выборочной дисперсией DXg. При ^большой выборке Г)Хд * Dx, при малой — соотношение между DXg и Dx определяется формулой

Если мы рассматриваем качественный признак, то его дисперсия в генеральной совокупности определяется формулой (6.42). При нахождении средней ошибки качественного признака его дисперсия в генеральной совокупности, как правило, неизвестна и заменяется выборочной дисперсией (DX^ J.

Формулы для определения средней ошибки альтернативного (качественного) признака имеют вид:

- для повторного отбора

- для бесповторного отбора где

Se — доля единиц выборки, обладающая качественным признаком.

Величина всегда меньше единицы, следовательно,

сопоставление приведенных выше формул говорит о том, что применение формул бесповторного отбора обеспечивает меньшую ошибку.

Предельная ошибка выборки (А) есть t-кратная средняя ошибка, т. е.

где t — коэффициент доверия, который обычно берут равным 1,2,3.

Формула предельной ошибки вытекает из закона больших чисел. В частности, из теоремы Чебышева следует, что при достаточно большом объеме выборки и ограниченной дисперсии генеральной совокупности выборочные обобщающие показатели будут сколь угодно мало отличаться от соответствующих показателей генеральной совокупности.

Например, для среднего арифметического на основании формулы (2.46) получим

где — выборочное среднее арифметическое;

— генеральное среднее арифметическое;

Фо (1); Фо (2); Фо (3) — находятся по таблице приложения 5.

То есть при t = 1с вероятностью 0,6826 можно утверждать, что разность между выборочными и генеральными параметрами не превзойдет одной средней ошибки выборки W.. При t = 2 с вероятностью 0,9544 она не превзойдет двукратной средней ошибки выборки 2W.. При t = 3 с вероятностью 0,9973 она не превзойдет трехкратной средней ошибки выборки 3 W..

Вероятность появления ошибки, равной или большей 3W, очень мала и равна 0,0027. Такие события можно считать практически невозможными, а, следовательно, величину Д/ = t • W{ можно принять за предел возможной ошибки выборки.

Зная предельную ошибку выборки можно определить предельные значения характеристик генеральной совокупности и их доверительные интервалы.

Например, для средней арифметической имеем:

а для доли единиц выборки, обладающих каким-либо качественным признаком, получим:

При проектировании выборочного наблюдения, как правило, задается допустимая ошибка выборки, а это дает возможность, найти объем выборки, которая с определенной вероятностью обеспечит заданную точность наблюдения.

Необходимый объем выборки получают из формул (7.1), (7.2), (7.4), (7.5).

Из формулы (7.1), имея в виду (7.7), получаем Аналогично из формулы (7.2), с учетом (7.7), имеем Из выражения (7.4), учитывая (7.7), находим:

Из формулы (7.5), с учетом выражения (7.7), определяем: Пример 7.1

Предположим, что в некотором городе N зарегистрировано 20000 безработных. Для нахождения средней продолжительности безработицы организуется выборочное наблюдение. По данным прошлых лет известно, что доля безработных составляет 10%. Какое число безработных надо охватить выборочным наблюдением, чтобы с вероятностью 0,9544 можно было утверждать, что полученная предельная ошибка выборки не превышает 7% средней продолжительности безработицы?

Доверительной вероятности 0,9544 соответствует коэффициент доверия t = 2.

Найдем численность выборки по формуле (7.13) для бес- повторного отбора

Заметим, что объем выборки округляют только в большую сторону.

Следовательно, чтобы с вероятностью 0,9544 утверждать, что полученная ошибка выборки не превзойдет 7% средней продолжительности безработицы надо охватить выборочным наблюдением 74 безработных.

Заметим, что при решении задач нахождения объема выборки величина допустимой предельной ошибки и уровень вероятности, который гарантирует точность оценок будущей выборки, задаются самим исследователем. Объем генеральной совокупности, как правило, неизвестен. Для ее оценки можно использовать:

1) выборочную дисперсию по данным обследований, которые проводились ранее;

2) дисперсию, найденную из соотношения для среднего квадратического отклонения:

3) дисперсию, полученную из формулы для асимметричного распределения:

4) дисперсию, вычисленную на основании соотношения для нормального распределения:

где хар — среднее арифметическое значение признака в генеральной совокупности;

х ; х . — соответственно максимальное и минимальное

max* шт

значения признака в генеральной совокупности.

Пример 7.2

Найдем численности выборки по следующим данным. Для нахождения средней цены птицы в магазинах города N надо провести выборочную регистрацию цен. Известно, что цены на птицу колеблются от 100 до 180 руб. за 1 кг. Сколько магазинов необходимо обследовать, чтобы с вероятностью 0,9973 ошибка выборки при определении средней цены не превысила 8 руб. за 1 кг? Известно также, что распределение цен подчинено нормальному закону. Вероятности 0,9973 соответствует значение коэффициента доверия t = 3.

В соответствие с формулой (7.16) имеем:

Для определения объема выборки применим формулу для повторного отбора (7.10). Значения, полученные по этой формуле, всегда будут больше, чем по формуле для бесповторного отбора:

Следовательно, с вероятностью 0,9973 можно гарантировать, что ошибки нахождения средней цены 1 птицы не превысят 8 руб. за 1 кг., если обследовать 25 магазинов города N.

 
Посмотреть оригинал
Если Вы заметили ошибку в тексте выделите слово и нажмите Shift + Enter
 
Популярные страницы