Распределение Пирсона х2 (хи квадрат)

Пусть имеется п независимых случайных величин, имеющих нормальное распределение, причем, как в случае Z-стандар- тизации, их дисперсия равна единице, а среднее - нулю. Тогда сумма квадратов этих случайных величин будет распределена по закону х2 (хи квадрат) с количеством степеней свободы равным количеству этих случайных величин (к = п):

Число степеней свободы может быть также равным k = п - 1, в случае когда = пХ. Плотность данного распределения выражается формулой

СО

где Г(х) = tyx~le fdt - гамма-функция; в частности, Г(п + 1) = п!. о

Степени свободы - термин достаточно широко распространенный и используемый в статистическом анализе для характеристики количества свободно варьирующих элементов совокупности. В отношении статистических процедур в социологии это чаще всего величина зависимая от числа элементов п в выборке. Конкретно степени свободы можно определить как количество элементов в выборке минус число ограничений, налагаемых на них. Например, пусть известно, что сумма двух чисел равна 100, т. е. a + Ъ = 100. Для выборки из двух чисел ясно, что если мы знаем первое число, то знаем и второе, и это будет зависеть от лимита (суммы). Скажем, если первое число равно 40, то второе будет 100 - 40 = 60. Следовательно, в этой ситуации есть одно ограничение, и число степеней свободы будет 2 — 1 = 1. Если у нас есть три числа, сумма которых составляет 100, т. е. a + b + с = 100, то в выборке из трех чисел достаточно знать только первые два числа, потому что с = 100 — a — b. Здесь число степеней свободы 3 -1 = 2. В этих примерах лимит - это сумма чисел, равная 100, а степени свободы будут равны числу свободных выборов, которые мы можем сделать.

Рассмотрим еще один пример определения степеней свободы. Предположим, что среднее генеральной совокупности оценивается по выборке объемом п = 5. Допустим, имеется пять измерений: 11, 13, 14, 17, 20. Ограничением в данном случае является то, что сумма отклонений отдельных измерений от среднего равна нулю, т.е. - х) = 0.

Так как у нас есть 5 наблюдений, то будет 5 отклонений. Из этих 5 отклонений только 4 могут варьировать свободно. Другими словами, после того как среднее определено (в данном случае х = 15), пятое значение не может меняться произвольно, потому что последнее отклонение должно быть таким, чтобы сумма всех отклонений была равна нулю. Понятно, что в этом случае число степеней свободы 5 - 1 = 4.

Очевидно, что распределение хи квадрат определяется единственным параметром - числом степеней свободы, при увеличении которого (т.е. с увеличением объема выборки) данное распределение стремится к нормальному.

Распределение хи квадрат является непрерывным и обладает следующими свойствами:

  • - оно всегда неотрицательно;
  • - оно зависит от числа степеней свободы;
  • - математическое ожидание равно количеству переменных, а стандартное отклонение равно 2п;

- с увеличением числа степеней свободы распределение хи квадрат медленно приближается к нормальному.

о

Плотность функции имеет вид, показанный на рис. 5 (где Хо - константа, зависящая от и), при этом функция положительно асимметрична (вытянута направо) и с ростом п распределение стремится к симметричному.

Плотностная функция, критические значения и табулированные процентные значения (заштрихованная область) для распределения %с 8 степенями свободы

Рис. 5. Плотностная функция, критические значения и табулированные процентные значения (заштрихованная область) для распределения %2 с 8 степенями свободы

Если х - нормально распределенная случайная величина с дисперсией о2 и исправленной выборочной дисперсией S2 = ^-4/{n-i)

на данной выборке объемом п, то статистика (n -1)2 / а2 имеет распределение хи квадрат си-1 степенями свободы у2п_1. Выборочное о2

распределение S2 =-у_ ,, если х нормально распределено.

п-1

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >