Определение закона распределения случайной величины
Обычно закон распределения случайной величины неизвестен и имеется ограниченное число наблюдений (выборка). При его определении задаются некоторым известным законом распределения, а затем проверяют эту гипотезу на значимость.
Простейшим методом проверки гипотезы о законе распределения является визуальный. Он заключается в построении гистограммы по выборке и анализе ее внешнего вида. Метод неточен. Наиболее полная и точная проверка соответствия выбранного распределения реальному производится с помощью критерия Карла Пирсона.
Статистика Карла Пирсона имеет вид

где п — количество полученных в результате наблюдения значений случайной величины X (объем выборки);
к — число интервалов;
Pj — теоретическая вероятность попадания случайной величины в у-й интервал;
nPj — ожидаемое (теоретическое) количество попаданий случайной величины в у- й интервал;
nij — количество попаданий случайной величины в у'-й интервал в результате опыта.
Теоретическая вероятность попадания случайной величины в j-й интервал Axj для исследуемой плотности распределения /(х) рассчитывается по формуле

Разделив числитель и знаменатель статистики Карла Пирсона
(17.34) на п и учитывая соотношение (17.1), получим

л
Рассчитать значение Храсч можно как по формуле (17.34), так и по формуле (17.35).
'У
Выборочное распределение Храсч является (приблизительно) Х2-распределением с числом степеней свободы
где к — число интервалов;
Ь — число параметров вероятностной модели, которые должны быть оценены по тем же данным.
Отклонения от проверяемой модели всегда будет приводить к увеличению значения Храсч •
Значимость выбранного закона распределения определяется сравнением рассчитанного и табличного (теоретического) значений Xv с v степенями свободы. Уровень значимости а показывает вероятность того, что теоретическое значение Xv превысит расчетное значение Храсч • В виде формулы это можно записать следующим образом:
Геометрический смысл теоретического значения Xv поясняется на рис. 17.12.

Рис. 17.12. Плотность ^-распределения с v степенями свободы
По оси абсцисс отложены значения Xv • Индекс v означает, что на рисунке приведен график плотности распределения для функции с v степенями свободы. Отмеченная на этой оси точка Xv (a) 03" начает, что площадь под кривой плотности распределения на интервале ^Xviy)’00) равна уровню значимости а.
Таким образом, если Храсч -Xv(a) ПРИ том же числе степеней свободы и заданном уровне значимости a, то вероятность соответствия закона распределения исследуемой случайной величины выбранному закону распределения будет больше или равно а .
Если ожидаемые частоты слишком малы для использования Х2-распределения, то их надо объединить в один более крупный интервал. Значений частот не должно быть меньше 5—10. При объединении необходимо учитывать, что число интервалов не должно быть слишком малым.
> Пример 17.10. Для условий примеров 17.1 и 17.4 определить значимость соответствия закона распределения исследуемой случайной величины нормальному.
Решение. Используя результаты решения примера 17.4, запишем функцию плотности распределения исследуемой случайной величины в виде
Результаты обработки выборки табл. 17.2 (пример 17.1) представлены в строках 1—3 табл. 17.6. Здесь же представлены результаты остальных расчетов.
Таблица 17.6
1 |
Jj |
-4-=- -3 |
-3 ч- ч- -2 |
—2 ч- ч--1 |
-1*0 |
0ч- 1 |
1 ч- 2 |
2 ч- 3 |
3 ч-4 |
2 |
т} |
6 |
25 |
72 |
133 |
120 |
88 |
46 |
10 |
3 |
фГ^-°-1681 ( 1,448 J |
0,01426 |
0,0668 |
0,209 |
0,4522 |
0,7157 |
0,897 |
0,9748 |
0,996 |
4 |
фЬ-°’1681 ( 1,448 ) |
0,00199 |
0,0143 |
0,0668 |
0,209 |
0,209 |
0,7157 |
0,897 |
0,996 |
5 |
Pj |
0,01227 |
0,053 |
0,1422 |
0,2433 |
0,2634 |
0,1813 |
0,0778 |
0,021 |
6 |
nPj |
6,135 |
26,275 |
71,08 |
121,64 |
131,71 |
90,67 |
38,9 |
10,55 |
7 |
(npJ~mjf "Pj |
0,003 |
0,062 |
0,012 |
1,062 |
1,041 |
0,079 |
1,296 |
0,029 |
Теоретические значения вероятности попадания случайной величины в j-й интервал для плотности распределения (17.38) рассчитываются по формуле

Интеграл вероятности

находим по таблицам. Его значения записаны в третьей и четвертой строках табл. 17.6. Теоретические значения вероятности попадания случайной величины в у-й интервал представлены в пятой строке.
Расчет статистики Карла Пирсона проведем по формуле (17.34), слагаемые которой представлены в седьмой строке

Уровень значимости определяется по формуле а = р(х1 ^Храсч) при количестве степеней свободы v = Ar—1 = 8—2 —1=5 . Уровни значимости в зависимости от заданного значения находим по таблицам (см., например, [6, с. 74]). Имеем
Принимаем зависимость Xs от а на интервале 0,5 до 0,7 линейной (рис. 17.13).

Рис. 17.13. Определение уровня значимости
Из подобия прямоугольных треугольников находим
Отсюда определяем уровень значимости:
Таким образом, гипотеза о том, что случайная величина распределена по нормальному закону, с вероятностью 0,61 принимается.?