Коэффициенты взаимной сопряженности К. Пирсона и коэффициент взаимной сопряженности А. А. Чупрова

Коэффициенты взаимной сопряженности Пирсона и Чупрова используются в том случае, если по каждому из взаимосвязанных признаков выделяется число групп более двух. Факт наличия связи устанавливается с помощью критерия х2-

где х... — фактическая (эмпирическая) клеточная частота, т. е. число единиц с г-м значением признака х и j-м значением признака у;

— теоретическая клеточная частота, которая отвечает предположению о независимости признаков х и у, т. е. отсутствию связи.

Теоретическую клеточную частоту находят по формуле

т. е. итог по строке надо умножить на итог по столбцу и разделить на общее число данных.

Сумма теоретических частот всех клеток таблицы равна общему числу наблюдений п. Сумма теоретических частот по строкам и столбцам соответственно равна ц. и х.. Поэтому, теоретические частоты — это перераспределение исходных данных в том предположении, что связь между изучаемыми признаками х и у отсутствует. Значение х2 показывает, насколько велико расхождение реальных частот с теми, которые были бы в том случае, если изучаемые признаки х и у не зависели бы друг от друга. Данное расхождение будет всегда, поэтому есть таблица критических значений критерия х2 (мы ей уже пользовались, когда проверяли гипотезу о нормальном распределении и значимость коэффициента конкордации). Распределение X2 зависит от уровня значимости б, которое назначается исследователем и от числа степеней свободы

где кг — число категорий признака х (число строк таблицы);

к2 — число категорий признака у (число столбцов таблицы).

Найденное по формуле (10.51) значение %2 сравнивается с табличным при принятом уровне значимости и данном числе степеней свободы. Если х2 > Хт> т0 делается вывод о наличии связи между признаками хиу.В том случае, если х2 ^ Хт> гип0_ теза о независимости х и у не отклоняется, т. е. наличие связи между признаками х и у не может считаться доказанным.

Используем данные примера 10.3 и сделаем вывод о наличии или отсутствии зависимости успеваемости студентов-ве- черников от соответствия профиля работы.

Для этого используем критерий х2- Сначала найдем теоретические клеточные частоты:

Теперь по формуле (10.51) находим:

Количество степеней свободы в данном случае будет равно:

Принимаем 5%-ный уровень значимости (а = 0,05) и по таблице критерия х2 (приложение 6) находим: %т = 3,84. Так как , то делаем вывод, что распределение неслучайно и

скорее всего связанно с зависимостью между признаками, которые положены в основу группировки. Следовательно, можно говорить о зависимости между характером работы студентов вечерников и результатами сдачи ими экзаменов по специальным предметам.

Для измерения тесноты имеющейся связи между изучаемыми признаками используют коэффициенты взаимной сопряженности Пирсона и Чупрова. Коэффициент взаимной сопряженности К. Пирсона находится по формуле

где'

Данный коэффициент не принимает во внимание число категорий для изучаемых признаков хну.

Более совершенным и точным является коэффициент взаимной сопряженности А. А. Чупрова, который вычисляется по следующей формуле:

Оба приведенных нами коэффициента взаимной сопряженности основаны на нормировании х2; погашении зависимости от числа наблюдений и размерности таблицы. Данные коэффициенты принимают все свои значения на отрезке [0, 1], причем КЧвз, если таблица не квадратная, никогда не достигает единицы.

Приведем конкретный пример вычисления коэффициентов взаимной сопряженности Пирсона и Чупрова.

Пример 10.4

Пусть известно распределение 500 участков, засеянных сахарной свеклой, по двум признакам: степени полива (х) и уровню урожайности (у) (табл. 10.11).

Необходимо определить, случайно ли данное распределение (см. табл. 10.11) и существует ли зависимость между хну.

Таблица 10.11

Полив(X)

Урожайность (у)

высокая

средняя

низкая

сумма

Обильный

Ни = 80

Д, 1 = 59,45

р12 = 25 Д12 = 30,45

гЧ

О Lf3 1Л

II II id

145

Средний

*, = 85 Д21 = 71,75

р22 = зо Д22 = 36,75

^23 = 60

Дм =66,5

175

Слабый

^ = 40

Дз1

^32 = 50

ДЯ2= 37,8

II II

05 (О СО О rfb-

180

Сумма

205

105

190

500

Кроме этого, определить степень тесноты зависимости между интенсивностью полива и уровнем урожайности. Для установления наличия связи между признакам х и у используется критерий х2- Для этого сначала по формуле (10.52) найдем теоретические клеточные частоты и поместим их в табл. 10.11, например:

Затем по формуле (10.51) определим расчетное значение критерия х2:

Число степеней свободы в нашем примере равно:

Принимаем 5%-ный уровень значимости, т. е. а = 0,05.

Далее по таблице значений критерия х2 (приложение 6) определяем Хт = 9,49.

Так как , то делаем вывод о том, что

распределение, помещенное в табл. 10.11, неслучайно. Поэтому можно говорить о наличии связи между признаками х и у.

Для определения тесноты связи определим коэффициенты взаимной сопряженности Пирсона и Чупрова. Сначала по формуле (10.53) находим коэффициент взаимной сопряженности Пирсона:

Затем по формуле (10.54) определяем коэффициенты взаимной сопряженности Чупрова:

Полученные значения коэффициентов КПвз и КЧвз говорят о том, что зависимость уровня урожайности от степени полива ниже средней. Заметим, что исходные данные примера 10.11 условные.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >