Нормальная кривая в качестве базового распределения

Нормальная кривая (или, что то же самое, нормальное распределение) наиболее часто используется в качестве вероятностной модели, которая облегчает расчет вероятности возникновения интересующего нас события.

Для дальнейшей иллюстрации концепции вероятности и в связи с вероятностным распределением рассмотрим распределение результатов теста по статистике для 5000 студентов, обучающихся в ростовских университетах. Тест содержит 100 вопросов. Каждый правильный ответ оценивается 1 баллом, а каждый неверный приносит 0. Таким образом, каждый студент может получить от 0 до 100 баллов. Известно, что распределение этих результатов является нормальным и имеет среднее равное 60 и стандартное отклонение равное 10. Кривая нормального распределения с этими параметрами показана на рис. 4.

Нормальное распределение 5000 оценок по статистике ср=60иа = 10

Рис. 4. Нормальное распределение 5000 оценок по статистике ср=60иа = 10

Предположим, что все 5000 результатов были записаны на отдельных листах бумаги и помещены в урну. Так как результаты нормально распределены, мы можем использовать нормальную кривую для вычисления вероятностей, связанных с определенными результатами. Например, можем определить вероятность того, что вытащенный из урны листок будет с результатом, который лежит между 50 и 60. Как отмечалось в учебнике А. В. Дятлова и П.Н. Лукичева «Методы математической статистики в социальных науках (описательная статистика)», 34,13% всех результатов лежат в пределах 50-60 пунктов (что соответствует интервалу (-1; 0) для стандартного нормального распределения) и, следовательно, вероятность того, что результат попадет в этот интервал, равна 0,3413. По таблице для нормального распределения (см. прил. 2) мы можем ее определить следующим образом:

1. Находим стандартизированное значение, которое соответствует заданному интервалу (см. учебник А. В. Дятлова и П.Н.Луки- чева «Методы математической статистики в социальных науках (описательная статистика)»). В данном случае

  • 2. По таблице (см. прил. 2) определяем площадь поверхности под кривой (на самом деле определяем вероятности p^z^Zy} и /)(г<22), интересующая нас вероятность - это просто разница между первым и вторым значениями, если предположим, что z2 <2^), что соответствует данному аргументу: для z1 это 0,5000, а для z2 0,1587.
  • 3. Разница 0,5000 - 0,1587 = 0,3413 дает нам искомую вероятность.

Какова вероятность получить результат, который больше 80

или меньше чем 40? Эта вероятность получится как сумма вероятностей для двух отдельных событий:

1. Находим стандартизированные значения

  • 2. Определяем из таблицы соответствующие площади поверхности под кривой: 0,9772 и 0,0228. Последнее число выражает вероятность получения результата меньшего, чем 80 пунктов. Следовательно, вероятность результата большего, чем 80, будет равна 1,0 - 0,9772 = 0,0228. Видно, что обе полученные вероятности равны, что и следовало ожидать при симметричном нормальном распределении.
  • 3. Искомая вероятность будет 0,0228 + 0,0228 = 0,0456. Другими словами, маловероятно, что результат будет больше 80 или меньше чем 40 пунктов. С другой стороны, вполне вероятно, т.е. существует большая вероятность того, что результат будет лежать в диапазоне 50-70. Как легко можно увидеть, эта вероятность равна 0,6826. Снова отметим, что сумма всех вероятностей - это площадь поверхности, ограниченная кривой плотности распределения и осью абсцисс, и равна она единице.

Несмотря на то что приведенный выше пример был искусственно сконструирован, использование нормального распределения для определения вероятности возникновения того или иного события является важным моментом социологического исследования. В этом смысле нормальная кривая служит в качестве базового вероятностного распределения. На самом деле нормальное распределение является одной из наиболее часто используемых моделей для описания поведения случайных переменных.

Статистические выводы опираются на формальное проектирование (индуцирование) выборки из генеральной совокупности. Это проектирование основывается на предположении, что выборка представительна (репрезентативна) для генеральной совокупности, из которой была извлечена, по отношению к переменной, которая представляет интерес для исследования. Представительность (репрезентативность) обеспечивается таким проектированием выборки, что каждый элемент генеральной совокупности может быть отобран случайно, а любая комбинация элементов (выборка) имеет равную с другими, соответствующей размерности, комбинациями элементов вероятность быть отобранной из генеральной совокупности.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >