Некоторые положения математической статистики, используемые в аналитической химии

Как уже отмечалось выше, погрешность измерения является случайной величиной.

Случайной величиной называется измеряемая по ходу опыта численная характеристика, принимающая одно и только одно возможное и неизвестное заранее значение вследствие воздействия различных факторов, которые не могут быть заранее учтены.

Случайные величины бывают дискретными и непрерывными. Дискретной называют случайную величину, множество возможных значений которой конечно либо счетно (т.е. может быть пронумеровано натуральными числами). Непрерывной называют случайную величину, которая может принимать все значения из некоторого конечного или бесконечного интервала. Большинство случайных величин, с которыми химик-аналитик сталкивается на практике, являются непрерывными.

Для того чтобы математически описать случайную величину, необходимо указать множество ее значений и соответствующее случайной величине распределение вероятностей для этого множества (таблично, аналитически или графически).

Функцией распределения случайной величины называется функция, описываемая следующим уравнением:

где Р(Х < х) — вероятность того, что случайная величина X примет любое значение, которое меньше или равно х.

Функция f(x) называется плотностью вероятности непрерывной случайной величины, если для любых чисел а и b (Ь > а) выполняется равенство (2.11):

Плотность вероятности и функция распределения связаны между собой уравнениями

Явления, носящие случайный характер, так же, как и закономерные явления, подчиняются определенным законам. Эти законы, в отличие от обычных математических зависимостей, носят вероятностный характер. С их помощью можно определить вероятность того, что случайная величина примет интересующее нас значение. Распределения вероятностей случайных величин могут быть как дискретными, так и непрерывными. Наиболее важным непрерывным распределением вероятностей, используемым в аналитической химии, является нормальное распределение. В большинстве случаев результаты анализа (если это, конечно, не подсчет каких-то дискретных единиц) подчиняются именно этому типу распределения. Классическими примерами одномерного нормального распределения[1] могут служить идеальный хроматографический пик или полоса поглощения в электронном спектре.

Плотность вероятности нормально распределенной случайной величины описывается формулой (2.14):

Графики плотности вероятности нормального распределения и функции нормального распределения показаны на рис. 2.6.

Графики функции (а) и плотности вероятности (б) стандартного нормального распределения

Рис. 2.6. Графики функции (а) и плотности вероятности (б) стандартного нормального распределения

Любое нормальное распределение описывается двумя параметрами: параметр а по смыслу является математическим ожиданием случайной величины; параметр о, будучи возведенным в квадрат, равен дисперсии случайной величины:

Параметр а характеризует положение графика функции F(x) относительно числовой оси. При увеличении а график смещается вправо, при уменьшении — влево. Параметр а (а > 0) характеризует растяжение (сжатие) графика. Нормальное распределение са=0иа=1 называется стандартным нормальным распределением.

На рис. 2.7 показана вероятность попадания значений нормально распределенной случайной величины в интервал «математическое ожидание ± разное число величины о».

Вероятность попадания значений нормально распределенной случайной величины в интервал а ± За составляет 99,73 %, т.е. практически все значения нормально распределенной случайной величины находятся в этом интервале. Это свойство нормального распределения называется «правилом За».

Вероятность попадания значений нормально распределенной случайной величины в интервалы «а ± различное число а» (а = 0, о = 1)

Рис. 2.7. Вероятность попадания значений нормально распределенной случайной величины в интервалы «а ± различное число а» (а = 0, о = 1)

Для характеристики случайной величины на практике пользуются выборкой. Выборкой называют последовательность независимых одинаково распределенных случайных величин. Обозначим результат анализа как случайную величину X. Проведем в неизменных условиях некоторое количество параллельных анализов одного и того же объекта. У нас получится ряд независимых одинаково распределенных случайных величин хъ х2 ... хп, например, значений аналитического сигнала. Данный ряд будет представлять собой выборку, при помощи которой можно будет оценить функцию распределения и другие характеристики случайной величины X. Выборка, пронумерованная в порядке возрастания, т.е. хъ х2 ... хп, носит название вариационного ряда. Притом сами значения х называют вариантами, а побъемом выборки. В табл. 2.1 приведены основные характеристики, используемые для описания выборки.

Таблица 2.1

Основные характеристики, используемые для описания выборки

Характеристика

Определение понятия

Расчетная

формула

Выборочное

среднее

Сумма всех значений серии наблюдений, деленная на число наблюдений

Выборочная

дисперсия

(исправленная)

Сумма квадратов отклонений, деленная на число степеней свободы ( f = п - 1), т.е. число переменных, которые могут быть использованы произвольно при характеристике данной выборки

Выборочное

стандартное

отклонение

Положительный квадратный корень из значения выборочной дисперсии

Стандартное

отклонение

выборочного

среднего

Отношение выборочного стандартного отклонения к положительному квадратному корню из числа наблюдений

Относительное

стандартное

отклонение

Отношение выборочного стандартного отклонения к выборочному среднему

Для характеристики выборок малых объемов, взятых из нормально распределенных генеральных совокупностей, используют распределение Стъюдента (f-распределение)[2].

Пусть некоторая случайная величина имеет нормальное распределение вероятностей. Для оценки этой случайной величины воспользуемся выборкой объемом п. Чем меньше число степеней свободы (п - 1), тем в большей степени выборочные характеристики будут отличаться от характеристик случайной величины. Введем новую случайную величину (2.17):

Распределение этой случайной величины называется распределением Стьюдента (рис. 2.8). Распределением Стьюдента пользуются для характеристики нормально распределенных выборок малых объемов (п < 30). Такое распределение зависит только от объема выборки: на него не влияют неизвестные параметры а и о. При п —> °о распределение Стьюдента превращается в стандартное нормальное распределение.

Функция плотности вероятности распределения Стьюдента с различным числом степеней свободы (f = п - 1)

Рис. 2.8. Функция плотности вероятности распределения Стьюдента с различным числом степеней свободы (f = п - 1)

Распределение Стьюдента можно использовать для расчета доверительного интервала выборочного среднего (в том случае, если выборка имеет нормальное распределение). Доверительным называется интервал, вероятность попадания значений случайной величины в который равна принятой доверительной вероятности 1 - а, где а — уровень значимости (в аналитической практике чаще всего а = 0,05):

Следовательно, неизвестное математическое ожидание с вероятностью 1- а попадет в такой интервал:

Значения t для различных /иа приведены в табл. 2.2. Например, если а = 0,05 и f = 5, то доверительный интервал для выборочного среднего равен ±2,575*.

Коэффициенты t распределения Стьюдента

Таблица 2.2

Число степеней свободы /

Уровень значимости а

0,10

0,05

0,02

0,01

1

6,31

12,71

31,82

63,66

2

2,92

4,30

6,97

9,93

3

2,35

3,18

4,54

5,84

4

2,13

2,78

3,75

4,60

5

2,02

2,57

3,37

4,03

6

1,94

2,45

3,14

3,71

7

1,90

2,37

3,00

3,50

8

1,86

2,31

2,90

3,36

9

1,83

2,26

2,82

3,25

10

1,81

2,23

2,76

3,17

11

1,80

2,20

2,72

3,11

12

1,78

2,18

2,68

3,06

13

1,77

2,16

2,65

3,01

14

1,76

2,15

2,62

2,98

15

1,75

2,13

2,60

2,95

20

1,73

2,09

2,53

2,85

30

1,70

2,04

2,46

2,75

60

1,67

2,00

2,39

2,66

оо

1,66

1,96

2,33

2,58

  • [1] Нормальное распределение называют распределением Гаусса в честьвеликого немецкого математика К.Ф. Гаусса (Gauss) (1777- 1855). Он является также автором метода наименьших квадратов.
  • [2] Данное распределение было предложено в 1908 г. английским химиком У. Госсетом (Gosset) (1876-1937), работавшим в пивоваренной промышленности: он публиковал свои работы под псевдонимом Student(Студент).
 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >