Распределение выборочного среднего х

Распределение выборочного среднего переменной х может быть определено путем расчета всех возможных выборочных средних Хр х2,..., хк для всех возможных выборок объемом п, которые могут быть извлечены из генеральной совокупности, имеющей значения для X: Х1, Х2, ..., XN. В частности, вернемся к примеру успешности студентов при выполнении теста по статистике. Предположим, что среднее значение, вычисленное по выборке с объемом 169 респондентов, имеет значение х=67,3. По-видимому, это среднее значение является результатом вариации случайной величины х (это следует из рассуждений, проведенных выше). Первая задача, которая возникает: нужно определить модель поведения этой случайной величины, т. е. вероятностное распределение. Так как шкала, по которой измеряется х, является метрической, то подход, используемый при подбрасывании двух игральных костей, не приведет к желаемому результату. С другой стороны, в силу большой трудоемкости вряд ли кто-то будет извлекать все возможные выборки объемом 169 и определять точное значение среднего. Следовательно, определение вероятностного распределения среднего должно быть выполнено на основе математической теории, которая опирается на выборку как исходное основание. Таким теоретическим основанием является центральная предельная теорема. Утверждения, которые доказываются этой фундаментальной теоремой, могут быть изложены так.

С увеличением объема выборки п выборочное распределение среднего простой случайной выборки с фиксированным объемом п, извлеченной из произвольной генеральной совокупности со средним jn и ограниченной дисперсией о2, проявляет следующие свойства:

  • 1. Распределение выборочного среднего стремится к нормальному распределению.
  • 2. Среднее распределения выборочных средних равно и.
  • 3. Дисперсия распределения выборочного среднего равна а2/н, а стандартное отклонение выборочного среднего, соответственно, равно

Последнее определено тем, что дисперсия среднего арифметического п одинаково распределенных взаимно независимых случай- 2

ных величин ах, очевидно, в п раз меньше дисперсии каждой из

о о

величин, т.е. =о / п.

Отметим, что использование теоремы не предполагает бесконечной или нормально распределенной генеральной совокупности, а также не требует, чтобы было извлечено определенное число выборок для оценки среднего и дисперсии. Единственное ограничение, налагаемое на генеральную совокупность, - это конечность дисперсии. На практике для подавляющего большинства ситуаций это ограничение выполняется, и, следовательно, теорема легко применима.

Центральная предельная теорема дает информацию о форме, расположении и рассеивании выборочного распределения. Проблемы с применением центральной предельной теоремы возникают, когда распределение генеральной совокупности сильно отличается от нормального или когда выборка относительно небольшая. Если распределение генеральной совокупности приблизительно нормально, то теорема справедлива даже для выборок, размер которых очень маленький. Если отличие распределения генеральной совокупности от нормального является существенным, то необходимо, чтобы выборка содержала относительно большое количество элементов, чтобы использовать результаты теоремы. На практике выборки с объемом более 30 элементов рассматриваются как подходящие даже для сильно «ненормального» распределения. Другими словами, когда исходная генеральная совокупность не является нормально распределенной, выборочное распределение среднего будет примерно нормальным при п > 30.

Вернемся к рассматриваемому выше примеру. Очевидно, у нас взята только одна выборка из 169 элементов среди всех возможных выборок с этим объемом. Центральная предельная теорема дает нам возможность оценить близость полученного по выборке среднего к истинному, но неизвестному среднему генеральной совокупности. Эта оценка основана на так называемой стандартной ошибке среднего Стандартная ошибка среднего получается на основании формулы (21).

Очевидно, чем больше выборка, тем меньше будет выборочная ошибка. Далее мы рассмотрим чрезвычайно важный для практики случай, когда дисперсия генеральной совокупности неизвестна.

Обобщим сказанное. Если распределение X в генеральной совокупности имеет среднее ц и дисперсию а2, то распределение выборочного среднего с параметрами |ix и о| обладает следующими свойствами:

  • 1. Среднее рх = р, т.е. X - несмещенная оценка для р (статистика называется несмещенной оценкой параметра генеральной совокупности, если среднее выборочного распределения равно этому параметру, т. е. ?(рх) = р).
  • 2. Дисперсия о| =ст / п.
  • 3. Стандартная ошибка среднего, часто обозначаемая как SEM или SE(x), определяется как ох =c/Vn, иначе говоря, среднее генеральной совокупности, или истинное среднее значение с заданным уровнем доверия будет лежать в интервале x-ta / [n < р < х + to / yfn (где t - аргумент, определяемый по таблице функции Лапласа).
  • 4. Выборочное распределение х является приблизительно нормальным, если распределение в генеральной совокупности, из которой извлечена выборка:
    • а) нормальное (или выборочное распределение фактически является нормальным);
    • б) произвольной формы (не обязательно нормальное), при этом объём выборки п велик (например, п > 30).
 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >