ЗАМЕЧАНИЕ О “ТРЕБУЕМЫХ” ОБЪЁМАХ ВЫБОРОК

Со стороны практиков, применяющих критерии проверки статистических гипотез, очень часто можно услышать вопрос о том, а какого объёма выборок оказывается достаточно?

Самый простой ответ на такой неконкретный вопрос: чем больше, тем лучше. Почему?

Вообще говоря, истинный закон распределения вероятностей, который соответствует анализируемой выборке, неизвестен и останется неизвестным. Практика интересует возможность использования для описания этого неизвестного закона, например, равномерного распределения и собственная уверенность в том, что модель равномерного закона F0(x), соответствующего проверяемой гипотезе Я0, является более предпочтительной чем некоторая другая модель (другой закон, в определённой степени отличающийся от равномерного).

С ростом объёмов выборок п при заданной вероятности а ошибки 1 - го рода растёт мощность критериев 1-J3 относительно конкурирующей гипотезы Я,: Fx(x) Ф F0(x) и, следовательно, уменьшается вероятность Р ошибки 2-го рода. Конкурирующий закон Fx(x) может быть как угодно близок к F0(x), поэтому понятно почему требуются большие объёмы выборок.

Но извлечение больших объёмов выборок, как правило, связано с конкретными затратами. А при меньших объёмах выборок с заданными а и Р можно отличать от F0(x) лишь достаточно далёкие /^(jc) . Если конкретизировать вид , то на основании оценок мощности критериев

равномерности относительно конкурирующей гипотезы Я,: F(x) = Fx (х) можно указать объёмы выборок, для которых при проверке гипотезы Я0 по соответствующим критериям будет обеспечена заданная вероятность ошибок а и Р 1-го и 2-го рода соответственно.

Например, для того чтобы при заданной вероятности ошибки 1-го рода а = 0.1 обеспечить вероятность ошибки 2-го рода /? < 0.1 относительно закона, соответствующего рассматриваемой в руководстве гипотезы Я, (см. раздел 1.3) при использовании критерия Андерсона-Дарлинга необходим объём выборок п > 200 (см. таблицу 3.18), при использовании критерия Крамера-Мизеса-Смирнова - п >280 (см. таблицу 3.10), для критерия N2 Неймана-Бартона - п >120 (см. таблицу 2.49), для критерия Дудевича-ван дер Мюлена - п > 150 (см. таблицу 2.60). Но для болыиинства критериев, чтобы обеспечить заданные а и /3, понадобятся объёмы выборок существенно больше.

Аналогично, наиболее мощным относительно гипотезы Н2 критериям для того, чтобы с вероятностями ошибок а = 0.1 и /? < 0.1 различать Н0 и Н2, потребуются объёмы выборок п > 220250, а большинству - много больше.

А для того, чтобы с вероятностями ошибок а = 0.1 и /3< 0.1 различать Н0 и Нъ, лучшим представителям критериев равномерности потребуются п > 300.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >