Точечно-бисериальный коэффициент грЬ

Точечно-бисериалъный корреляционный коэффициент представляет собой частный случай коэффициента Пирсона и используется, когда одна из переменных измеряется в интервальной шкале или в шкале отношений, а другая переменная - в дискретной дихотомической шкале. Например, предположим, что мы хотим получить корреляцию ответа на один выделенный вопрос данного теста (дихотомическая шкала: ответ может быть или верным, или неверным) с общим результатом теста. Полученный коэффициент будет показателем сопряженности между исполнением одной отдельной части теста и теста в целом.

Рассмотрим данные, приведенные в табл. 3. Пусть х - результат ответа на интересующий нас вопрос, закодированный как «1» при правильном ответе и как «О», если ответ неправильный. Пусть у обозначает результат всего теста, содержавшего 20 вопросов, на которые отвечали 10 студентов. В таблице также приведены значения квадратов каждого измерения и смешанные произведения двух переменных для каждого студента. Эти результаты будут использованы в вычислениях.

Таблица 3

Примерные данные для вычисления точечно-бисериального коэффициента

Результат

X2

У2

ху

Вопрос(я)

тест (у)

1

1

10

1

100

10

2

1

12

1

144

12

3

1

16

1

256

16

4

1

10

1

100

10

5

1

11

1

121

11

6

0

7

0

49

0

7

0

6

0

36

0

8

0

11

0

121

0

9

0

8

0

64

0

10

0

5

0

25

0

Сумма

5

96

5

1016

59

Будем использовать формулу (1), чтобы вычислить корреляции между ответами на один вопрос и на весь тест:

Так как х является дихотомической переменной, принимающей только значения 1 или 0, то формула (2) может быть упрощена до формулы для точечно-бисериальной корреляции.

Для генеральной совокупности эта формула имеет следующий вид:

где рх - среднее у для тех случаев, когда для х = 1;

р2 - среднее у для тех случаев, когда для х = 0;

- стандартное отклонение для всех измерений,

т.е. y/Xitt-y)2 /N;

р - относительная доля ответов, где х = 1, или, иначе, вероятность того, что будет выбран ответ «1» из двух вариантов - «1» и «0»;

(1 - р) - относительная доля ответов, где х = 0, иначе говоря - вероятность того, что будет выбран неверный ответ из возможных двух вариантов.

Если мы используем данные из табл. 3, для вычислений по формуле (4)получаем

Отсюда, после замены соответствующих значений в формуле (4), будем иметь

Мы получили такое же значение, как при использовании классической формулы для вычисления коэффициента корреляции Пирсона.

Формула точечно-бисериального коэффициента для выборки имеет вид

1.2. Коэффициенты связи при различных комбинациях шкал 19

где ух - среднее у для тех случаев, когда х=1;

у0 - среднее у для тех случаев, когда х = 0;

sy - исправленное среднее квадратическое отклонение

для всех значений, равное /Х0*-yf р - относительная доля ответов х = 1 в выборке, или,

иначе, вероятность выбора правильного ответа, кодированного как «1»;

(g= 1 -р) - относительная доля ответов х = 0 в выборке, или, иначе, вероятность выбора неверного ответа, кодированного как «0».

Формула (4) для вычисления точечно-бисериального коэффициента удобнее общей формулы для вычисления коэффициента Пирсона г, но может быть использована, только если одна из переменных является дискретно дихотомической, а другая измеряется в интервальной или более мощной шкале. Из формулы видно, что если jii1 = jn0, то г ь = 0. В нашем примере это будет означать, что средние значения общего результата в группе тех, кто дал правильный ответ на интересующий нас вопрос, и в группе тех, кто дал неверный ответ, равны. Для данного стандартного отклонения абсолютное значение грЬ растет с ростом разности между средними значениями для групп, определенных дихотомической переменной. Если разность iu1 - ц2 отрицательна, то и г ь будет принимать отрицательное значение. Это означает, что существует тенденция: те, кто показал высокий результат в общем тесте, отвечают чаще неправильно на вопрос х. В этом случае знак корреляционного коэффициента имеет очевидный смысл и интерпретируем.

Существуют дихотомические дискретные переменные (например, пол), для которых кодирование - условность, и знак перед точечно- бисериальным коэффициентом грЬ будет зависеть от способа кодирования. Предположим, что мы обозначили женщин как «1» и мужчин как «0». Если точечно-бисериальный коэффициент rph положительное число, то интерпретация этой ситуации будет такова: есть тенденция, по которой представительницы прекрасного пола показывают более высокий результат в данном тесте, чем индивиды мужского пола.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >