ИЗУЧЕНИЕ ФОРМЫ РАСПРЕДЕЛЕНИЯ ПРИЗНАКА

Форма распределения признака в вариационных рядах распределения отражает закономерность изменения частот с ростом значений варьируемого признака.

Обобщающие характеристики формы распределения получают, используя кривые распределения — эмпирические и теоретические.

Эмпирическая кривая распределения — это фактическая кривая распределения, построенная по данным наблюдения, которая отражает как общие, так и случайные условия, определяющие распределение признака.

Теоретическая кривая распределения — это кривая распределения, выражающая функциональную связь между варьирующим признаком и частотами.

Анализировать эмпирическую кривую, на изменение которой повлияли в том числе и случайные условия, довольно трудно. Поэтому исследователи переходят к теоретической кривой распределения, по характеру распределения наиболее приближенной к первой. Теоретическая кривая призвана отражать основную закономерность распределения признака при полном погашении случайных причин.

При выравнивании (аппроксимации) эмпирических вариационных рядов перед исследователем стоят три задачи:

  • 1. Выяснение общего характера распределения.
  • 2. Непосредственное выравнивание эмпирического распределения — замена эмпирической кривой на теоретическую.
  • 3. Проверка соответствия найденного теоретического распределения эмпирическому.

При анализе вариационных рядов распределения социально- экономических явлений было замечено, что характер изменения частот при изменении варьирующего признака в вариационных рядах распределения обычно обладает определенной особенностью: при росте варьирующего признака в вариационных рядах частоты сначала растут, а затем, достигнув максимального значения, начинают снижаться. Такое распределение характерно для нормального. Поэтому в качестве идеального распределения наиболее часто используют нормальное распределение. Таким образом, кривая нормального распределения является наиболее распространенной формой распределения и рассматривается в качестве теоретической кривой, по которой выравнивают эмпирическую кривую. (Известны еще, например, распределение Пуассона и, соответственно, кривая Пуассона.)

Непрерывная случайная величина (х) подчиняется нормальному закону распределения, если ее функция плотности вероятности имеет вид

где п и е — математические константы (л = 3,14; е = 2,718).

Таким образом, для построения кривой нормального распределения надо знать два параметра: х и о.

Для удобства расчета переходят от случайных величин к нормируемым (стандартизированным), когда средняя равна нулю, а дисперсия и среднеквадратическое отклонения равны единице.

Обозначим: /

Тогда выражение (5.32) может быть записано следующим образом:

Уравнение (5.34) называется стандартным уравнением нормальной кривой. Нормируемая функция табулирована для различных значений t.

Особенности кривой нормального распределения (рис. 5.1):

  • 1. Кривая имеет форму колокола.
  • 2. Так как функция нормального распределения — четная, т.е./(-/) =/(0, то кривая нормального распределения симметрична

относительно максимальной ординаты, равной

Абсцисса этой точки является центром распределения: х = Мо = = Me.

  • 3. Ветви кривой, приближаясь к оси абсцисс, уходят в ±°о, так как функция нормального распределения принимает бесконечно малые значения при t = ±°°.
  • 4. Кривая имеет две точки перегиба при t = ±1, находящиеся на расстоянии ±о от х.
  • 5. При х = const с увеличением о кривая становится более пологой.

При а = const с изменением х кривая не меняет свою форму, а лишь сдвигается вправо или влево по оси абсцисс.

6. В промежутке х ± а находится 68,3% всех значений признака; в промежутке х ±2 о находится 95,4% всех значений признака; в промежутке х ± За находится 99,7% всех значений признака (правило трех о).

Кривая нормального распределения

Рис. 5.1. Кривая нормального распределения

При сопоставлении эмпирической кривой с кривой нормального распределения необходимо проверить эмпирическую кривую:

  • • на симметричность;
  • • наличие одной нормальной вершины (не острой и не плоской).

Эмпирические кривые распределения бывают симметричные и асимметричные.

Для симметричных распределений частоты двух вариантов, равностоящих в обе стороны от центра, равны между собой. Рассчитанные для симметричных рядов характеристики:

Если вышепредставленные характеристики нарушены, то это свидетельствует о наличии асимметрии распределения.

Асимметричные кривые имеют правостороннюю (рис. 5.2, а) или левостороннюю (рис. 5.2, б) асимметрию — в зависимости от того, какая ветвь кривой вытянута: в первом случае — правая, во втором — левая.

Правосторонняя (я) и левосторонняя (б) асимметрия распределения

Рис. 5.2. Правосторонняя (я) и левосторонняя (б) асимметрия распределения

Для того чтобы измерить асимметрию, рассчитывают показатели асимметрии.

Наиболее известный среди них — структурный коэффициент асимметрии Пирсона:

Если ДуМо > 0, то асимметрия правосторонняя. В этом случае Mo < Me < х. Если AsMo < 0, то асимметрия левосторонняя. В этом случае Mo > Me > х.

В симметричных рядах Д$Мо = 0.

Наиболее точный коэффициент асимметрии — коэффициент, рассчитанный с использованием центрального момента распределения третьего порядка:

Для симметричного распределения As = 0.

После оценки симметричности ряда распределения переходят к оценке эксцесса.

Эксцесс (в переводе с англ. — излишество) — несовпадение вершины эмпирического распределения с вершиной кривой нормального распределения, когда она находится выше или ниже первой.

Следует помнить, что симметричные ряды могут иметь не одну вершину, а, например, три или пять, но такое распределение не будет однородным и его нельзя считать нормальным.

Показатели эксцесса рассчитывают только для симметричных распределений, имеющих одну вершину.

Наиболее точный показатель эксцесса — коэффициент, рассчитанный с использованием центрального момента четвертого порядка:

Если Ех = 0 — это нормальное распределение (при нормальном

распределении — = 3); Ех > 0 — распределение островершинное; о4

Ех < 0 — распределение плосковершинное (рис. 5.3).

Для проверки, насколько фактическое распределение признака соответствует нормальному, нужно частоты фактического распределения сравнить с теоретическими частотами, которые характерны

Эксцесс распределения

Рис. 5.3. Эксцесс распределения

для нормального распределения. Для этого по фактическим данным нужно вычислить теоретические частоты, которые характерны для нормального распределения.

Математическая статистика предлагает несколько показателей, называемых критериями согласия, по которым можно судить, насколько фактическое распределение согласуется с нормальным. Например, критерий Колмогорова:

где D — максимальная разность (по модулю) между кумулятивными фактическими и теоретическими частотами.

Рассчитав X, определяют по его значению в специальной таблице соответствующее ему значение вероятности, с которой можно утверждать, что отклонения фактических частот от теоретических являются случайными.

При нормальном распределении средние показатели наиболее точно отражают характер изучаемого явления. Чем ближе фактическое распределение к нормальному, тем его средние характеристики становятся достовернее.

Сквозная задача Задание 5.5

Для интервального ряда распределения фирм по численности менеджеров (табл. 4.2), используя уже имеющиеся расчетные данные (см. решения заданий 4.2, 4.3 и 5.1), требуется:

  • 1. Сравнить значения средней арифметической взвешенной, моды и медианы.
  • 2. Рассчитать структурный коэффициент асимметрии Пирсона.
  • 3. Сделать вывод.

Решение:

Используем уже найденные значения:

  • • средней численности менеджеров фирмы: х = 28,83 чел. (см. решение задания 5.1);
  • • среднего квадратического отклонения: а = 6,57 чел. (см. решение задания 5.1);
  • • моды: Мо = 28,33 чел. (см. решение задания 4.2);
  • • медианы: Me = 28,75 чел. (см. решение задания 4.3).

В распределении численности менеджеров фирм наблюдается правосторонняя асимметрия, так как х > Me > Мо, т.е. 28,83 > 28,75 > 28,33.

В соответствии с формулой (5.35)

Вывод. AsMo > 0, т.е. асимметрия правосторонняя, незначительная (близка к нулю).

КОНТРОЛЬНЫЕ ВОПРОСЫ

  • 1. Чем объясняется необходимость изучения вариации признака?
  • 2. Как рассчитываются основные показатели вариации?
  • 3. Назовите виды дисперсий и укажите способы их расчета.
  • 4. Какова суть правила сложения дисперсий?
  • 5. Как определяется дисперсия признака, обладающего альтернативной изменчивостью?
  • 6. В чем суть выравнивания вариационных рядов по кривой нормального распределения?
 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >