Теоретические кривые распределения

Анализ вариационных рядов предполагает выявление закономерностей распределения, определение и построение (получение) некой теоретической (вероятностной) формы распределения. Характер распределения лучше всего проявляется при большом числе наблюдений и малых интервалах. В этом случае графическое изображение эмпирического вариационного ряда принимает вид плавной кривой, именуемой кривой распределения. Кривая распределения может рассматриваться как некая теоретическая (вероятностная) форма распределения, свойственная определенной совокупности в конкретных условиях.

Таким образом, анализируя частоты в эмпирическом распределении, можно описать его с помощью математической модели — закона распределения, установить по исходным данным параметры теоретической кривой и проверить правильность выдвинутой гипотезы о типе распределения данного ряда.

При исследовании закономерностей распределения очень важно выдвинуть верную гипотезу о типе кривой распределения, так как, если кривая описана математически (с помощью уравнения) верно, она более точно отражает закономерности данного распределения и может быть использована в различных практических расчетах и прогнозах. Кроме того, в этом случае можно сформулировать рекомендации для принятия практических решений.

Что понимается под теоретическим распределением? Это гипотетическое распределение вероятностей, которое предполагается для наблюдаемых частот вариационного ряда.

В практике статистического исследования встречаются различные распределения: нормальное, логарифмически нормальное, биномиальное, Пуассона, Шарлье и др. Каждое распределение имеет свою специфику и область применения. Далее будут рассмотрены только нормальное распределение и распределение Пуассона.

Нормальное распределение

При построении статистических моделей весьма широко применяется нормальное распределение.

В 1727 г. английский математик Абрахам де Муавр (1667—1754) открыл закон распределения вероятностей, названный законом нормального распределения. Позднее, в начале XIX в., разработкой вопросов, относящихся к данному закону, занимались Пьер Лаплас (1749-1827) и Карл Гаусс (1777—1855). Общие условия возникновения закона нормального распределения установил А.М. Ляпунов (1857-1918).

Распределение непрерывной случайной величины х называют нормальным N(x, о), если соответствующая ей плотность распределения выражается формулой

где х — значение изучаемого признака; х — средняя арифметическая ряда; а2 — дисперсия значений изучаемого признака; о — среднее квадратическое отклонение изучаемого признака; к = 3,1415 — постоянное число (отношение длины окружности к ее диамет-

х_х

ру);е = 2,7182 — основание натурального логарифма; t=--

нормированное отклонение. °

При графическом изображении плотности распределения /(х) получим колоколообразную кривую нормального распределения, симметричную относительно вертикальной прямой х = х (рис. 5.8), поэтому величину х называют центром распределения.

Кривые нормального распределения

Рис. 5.8. Кривые нормального распределения

Случайные величины, распределенные по нормальному закону, различаются значениями параметров х и а, поэтому очень важно выяснить, как эти параметры влияют на вид нормальной кривой.

Если х не меняется, а изменяется только о, то:

  • 1) чем меньше а, тем более вытянута вверх кривая (см. рис. 5.8, а), а так как площадь, ограниченная осью х и данной кривой, равна единице, то вытягивание вверх компенсируется сжатием около центра распределения х;
  • 2) чем больше о, тем более плоской и растянутой вдоль оси абсцисс становится кривая.

Если о остается неизменной, а х изменяется, то кривые нормального распределения имеют одинаковую форму, но отличаются друг от друга положением максимальной ординаты (см. рис. 5.8, б).

Итак, выделим особенности кривой нормального распределения.

1. Кривая симметрична и имеет максимум в точке, соответствующей значению х = Mo = Me.

  • 2. Кривая асимптотически приближается к оси абсцисс. Чем больше отдельные значения х отклоняются от х, тем реже они встречаются.
  • 3. Кривая имеет две точки перегиба: на расстоянии ±а от х.
  • 4. Площадь между ординатами, проведенными на расстоянии х ± о (заштрихованная область на рис. 5.8, б), составляет 0,683. Это означает, что 68,3% всех исследуемых единиц (частот) отклоняется от средней арифметической не более чем на о, т.е. находится в пределах х + а. В промежутке х ± 2о находится 95,4%, а в промежутке х ± За, соответственно, 99,7% всех единиц исследуемой совокупности.
  • 5. Коэффициенты асимметрии и эксцесса равны нулю.

Порядок расчета теоретических частот кривой нормального распределения таков:

  • • по эмпирическим данным рассчитывают среднюю арифметическую ряда х и среднее квадратическое отклонение а;
  • • находят нормированное отклонение каждого варианта от средней арифметической:

  • • по таблице распределения функции ф(/) (см. Приложение 1) определяют значения /;
  • • вычисляют теоретические частоты т' по формуле

где N — объем совокупности; hk — длина интервала.

В случае если вариационный ряд имеет равные интервалы,

Пример. Рассчитать теоретические частоты ряда распределения на основе данных, представленных в табл. 5.17.

Выдвинув гипотезу о нормальном распределении, определим по эмпирическим данным параметры этой кривой.

Сначала рассчитаем средний уровень ряда:

Таблица 5.17

Распределение призывников района по росту (данные условные)

Рост

призывников, см

хк-Гхк

Количество

человек

mi

А

1

2

3

4

5

6

7

156—160

8

157,5

1260,0

2918,48

-2,34

0,0258

5

161—165

17

162,5

2762,5

3379,77

-1,73

0,0893

16

166—170

42

167,5

7035,0

3478,02

-1,11

0,2155

40

171—175

54

172,5

9315,0

907,74

-0,50

0,3521

65

176—180

73

177,5

12 957,5

59,13

0,11

0,3965

73

181—185

57

182,5

10 402,5

1984,17

0,72

0,3079

57

186—190

38

187,5

7125,0

4514,78

1,33

0,1647

30

191—195

11

192,5

2117,5

2780,91

1,95

0,0596

11

I

300

52 975,0

20 023,00

297

Затем определим еще один параметр — среднее квадратическое отклонение о, для чего предварительно вычислим дисперсию (см. графу 4 табл. 5.17):

Далее определим нормированное отклонение t для каждого варианта (см. графу 5 табл. 5.17) с точностью до сотых, после чего по таблице распределения функции ф(/) (см. Приложение 1) найдем значения функции при значениях аргумента, полученных в графе 5. При этом необходимо учитывать, что функция ср(0 четная, т.е. ср(—0 = ф(0.

Анализируемый вариационный ряд имеет равные интервалы, следовательно, можно определить

Последовательно умножив const на величину ф(0 для каждого варианта, получим теоретические частоты т' (см. графу 7 табл. 5.17).

Иногда за счет округлений при расчетах может быть нарушено равенство сумм эмпирических и теоретических частот, что и произошло в данном случае (Хт, = 300, = 297).

J /

Распределение 300 призывников по росту

Рис. 5.9. Распределение 300 призывников по росту

Сравним на графике эмпирические т и теоретические т' частоты, полученные на основе данных табл. 5.17 (рис. 5.9). Близость частот тит' очевидна, но объективная оценка их соответствия может быть получена только с помощью критериев согласия (см. параграф 5.8).

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >