Оценивание законов распределения случайных величин

Как было отмечено в п. 5.1, одной из задач статистической обработки результатов испытаний является установление вида закона распределения случайной величины. На первом этапе решения этой задачи по результатам произведенных испытаний строят статистические функцию и плотность распределения. Анализ полученных графиков и природы исследуемой случайной величины обычно позволяет выдвинуть гипотезу о виде закона ее распределения. Затем по результатам испытаний проверяют справедливость выдвинутой гипотезы.

В данном пункте рассмотрим только первый этап решения указанной задачи.

Результаты наблюдений значений, принятых случайной величиной X, удобно представить в виде табл. 5.1, называемой простой статистической совокупностью.

Таблица 5.1

Номер испытания

1

2

i

п

Результат

*1

*2

xi

хп

Если результаты наблюдений упорядочить в порядке возрастания, то получаемая при этом таблица называется вариационным рядом (табл. 5.2). Элементы вариационного ряда называются порядковыми (ранговыми) статистиками. Номер элемента вариационного ряда называется рангом.

Таблица 5.2

Ранг элемента

1

2

г

п

Элемент ряда

х[

х'2

Х'г

В случае, когда исследуемая случайная величина дискретного типа или результаты измерений округляются, результаты нескольких наблюдений могут совпадать. Из этого следует, что различные результаты наблюдений могут появляться в выборке с различной частотой, определяемой по формуле

где пк — число появлений в выборке результата хк.

Вариационный ряд, представленный в форме табл. 5.3, принято называть статистическим рядом.

Таблица 5.3

хк

*1

х"2

хк

x"N

nk

п1

П2

пк

UN

к

Pi

Pi

Pi

Pn

По известному статистическому ряду строят статистическую (выборочную) функцию распределения F*(x) (рис. 5.2).

Ординаты функции Fx) обычно определяют в точках, отвечающих полученным значениям результатов измерений х?, по формуле

в которой суммирование распространяется на значения х?, меньшие х.

Рис. 5.2

Статистическая функция распределения является кусочно-непрерывной. Точками разрыва функции являются полученные значения х., а величина разрыва в каждой точке численно равна частоте соответствующего результата в выборке. Если каждое из значений х. в выборке получено 1 раз, то величина разрыва в каждой точке одинакова и равна 1/п.

Основанием применимости статистической функции распределения F*(x) для оценивания истинной функции распределения F(x) служит закон больших чисел, в частности предельная теорема В. И. Гливенко. В соответствии с этой теоремой можно утверждать, что при увеличении объема выборки Fx) сходится по вероятности к F(x), т. е.

Таким образом, статистическая функция распределения F*(x) является состоятельной оценкой функции распределения F(x). Кроме того, она является несмещенной асимптотически эффективной оценкой [8]. Поэтому при достаточно большом п функцию распределения случайной величины можно приближенно заменять ее выборочной функцией распределения.

Однако при большом объеме выборки построение статистической функции распределения путем определения ее значений для каждого из полученных результатов х? является трудоемким (статистический ряд становится громоздким). В этом случае результаты наблюдений подвергают предварительной обработке, суть которой заключается в следующем. Весь диапазон полученных результатов от дст.п до хтах разбивают на т интервалов. Затем определяют частоту попадания результатов измерений в каждый интервал по формуле

где п. -— число результатов измерений, попадающих в j-й интервал, включая его левую границу.

Число интервалов не должно быть слишком большим (в этом случае частоты подвергаются незакономерным колебаниям и статистический ряд становится невыразительным) или слишком малым (при этом описание случайной величины статистическим рядом становится грубым). Обычно выбирают 10—20 интервалов. Для ориентировочного определения числа интервалов можно пользоваться соотношениями т ~ 51п(п) или т ~ уп. При этом желательно, чтобы выполнялось условие п. > 5.

Длины интервалов можно брать как одинаковыми, так и различными. Если имеет место значительная неравномерность распределения случайной величины, длины интервалов целесообразно брать различными.

В областях наибольшей изменчивости распределения интервалы должны быть более короткими. В случае, когда интервалы различные, обработка экспериментальных данных несколько усложняется.

Итогом предварительной обработки результатов наблюдений является статистический ряд распределения случайной величины (табл. 5.4).

Таблица 5.4

Интервалы

Xmin — Х < Xi

Хх ^ X < Х2

X , ^ X < X )-1 J

Хт- — Х< Хтах

ni

П1

ni

Пт

р;

Pi'

р2*

р;

К

Статистическую функцию распределения строят в виде ломаной линии с вершинами в граничных точках выбранных интервалов (см. рис. 5.2). Ординаты функции Fx) в этих точках равны накопленным частотам:

Знание статистического ряда позволяет построить статистическую плотность распределения / *(х), график которой принято называть гистограммой. Гистограмму строят следующим образом. На каждом из выбранных интервалов как на основании строят прямоугольники, площадь которых равна частоте попадания полученных результатов наблюдений на данный интервал. Высоты прямоугольников определяют из соотношения

и откладывают их по оси ординат.

Из изложенного принципа построения гистограммы следует, что ее площадь всегда равна единице.

Таким образом, статистическая плотность распределения представляет собой функцию, ординаты которой в пределах интервалов разбиения результатов наблюдений постоянны. С увеличением объема выборки и, следовательно, числа интервалов, гистограмма все более приближается к плотности распределения случайной величины и может использоваться для приближенного ее описания.

Построение статистической функции распределения и гистограммы рассмотрим на примере.

Пример 5.1. Для оценки точности показаний датчиков давления были произведены испытания 60 датчиков. При испытаниях каждым датчиком измерялось некоторое номинальное давление и определялась ошибка измерения 5р как разность между показанием датчика и номиналом, выраженная в процентах номинала. В протокол испытаний записывались числа датчиков, ошибки измерений которыми оказались в пределах интервалов, равных 0,5%. Минимальное значение ошибки измерения оказалось равно -2,5%, а максимальное +3,0%. Результаты проведенных испытаний сведены в табл. 5.5.

Таблица 5.5

№ интервала

1

2

3

4

5

6

7

8

9

10

11

Число

датчиков

1

3

5

9

11

9

8

6

4

3

1

Частоты

1

3

5

9

11

9

8

6

4

3

1

в интервалах

60

60

60

60

60

60

60

60

60

60

60

Рис. 5.3

Рис. 5.4

Требуется построить статистические функцию и плотность распределения F*(8p) и / *(8р) ошибки измерения давления датчиками этого типа.

Решение.

  • 1. Представляем результаты измерений в виде статистического ряда.
  • 2. Рассчитываем по формулам (5.4) значения статистической функции распределения в точках, отвечающих границам выбранных интервалов.
  • 3. Определяем высоты прямоугольников гистограммы (ординаты функции / *(8р)) для каждого интервала разбиения полученных результатов измерений, используя для этого формулу (5.5).

Результаты расчетов по пунктам 1, 2, 3 представлены в табл. 5.6. [1]

Таблица 5.6

Правая

граница

интервала

-2,5

-2,0

-1,5

-1,0

-0,5

0,0

0,5

1,0

1,5

2,0

2,5

3,0

Л6Р)

0

  • 2
  • 60
  • 6
  • 60
  • 10
  • 60
  • 18
  • 60
  • 22
  • 60
  • 18
  • 60
  • 16
  • 60
  • 12
  • 60
  • 8
  • 60
  • 6
  • 60
  • 2
  • 60

П§р)

0

  • 1
  • 60
  • 4
  • 60
  • 9
  • 60
  • 18
  • 60
  • 29
  • 60
  • 38
  • 60
  • 46
  • 60
  • 52
  • 60
  • 56
  • 60
  • 59
  • 60

1

  • [1] Строим графики статистических функций распределения (рис. 5.3) и плотности распределения (рис. 5.4). Следует отметить, что неудачное разбиение на интервалы результатов измерений при составлении статистическогоряда проявляется при построении гистограммы: она либо имеет “провалы”, либо оказывается невыразительной. Полученные статистические функцию и плотность распределения аппроксимируют подобранным теоретическимзаконом. Затем проверяют гипотезу о согласованности теоретического и статистического законов распределения. Методыпроверки гипотез о законах распределения изложены ниже,в п. 6.
 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >