ПРИМЕНЕНИЕ СРЕДНИХ ВЕЛИЧИН В СТАТИСТИЧЕСКОМ АНАЛИЗЕ

Рассмотрим три ситуации, связанные с применением различных видов средних величин.

Ситуация № 1 — несгруппированные (индивидуальные) данные.

Задача 4.1. Данные о возрасте работников отдела (лет):

34 30 22 48 22

Рассчитать средний возраст, моду, медиану.

Решение 34 + 30 + 22 + 48 + 22 ...

Средний возраст: X = —— =-= 31,2 лет

п 5

(п — число слагаемых, т.е. единиц совокупности).

Формула расчета носит название «средняя арифметическая простая».

Модальный возраст Мо = 22 года, так как это значение встречается чаще всего.

Вывод: наиболее часто встречаются сотрудники отдела в возрасте 22 года.

Для расчета медианы нужно ранжировать исходный ряд (например, по возрастанию):

22 22 30 34 48

Медианный возраст Me = 30 лет, так как это значение находится в середине, являясь третьим по ранжиру из пяти.

Вывод: половина лиц — моложе 30 лет, а другая половина — старше 30.

В следующей задаче немного изменим условие — совокупность будет состоять из четного числа единиц, что повлияет на вычисление медианы.

Задача 4.2. Данные о возрасте работников отдела (лет):

34 30 22 48 22 48

Рассчитать средний возраст, моду, медиану.

Решение

Средний возраст:

Модальный возраст Мо = 22 и 48 лет, так как эти значения встречаются чаще всего.

Вывод: наиболее часто встречаются сотрудники отдела в возрасте 22 и 48 лет.

Для расчета медианы нужно ранжировать исходный ряд (например, по возрастанию):

22 22 30 34 48 48

Медианный возраст Me = 32 года, так как это значение находится в середине, являясь третьим по ранжиру из пяти.

Вывод: половина лиц — моложе 32 лет, а другая половина — старше 32.

Общее правило для определения медианы, поскольку носителем медианного значения является та единица, которая находится в середине, то для ее определения нужно объем ряда (число изучаемых единиц) поделить на два.

Ситуация № 2сгруппированные данные (дискретный ряд рас пределения)

Задача 4.3. Данные о сумме начисленных штрафов за административные правонарушения в районе:

Штраф, руб. (А)

100

200

500

750

1000

Итого

Число правонарушителей, чел. (т)1

5

15

11

2

2

35

Накопленные частоты (5)

5

20

31

33

35

Расчет S

5

5+15

20+11

31 + 2

33 + 2

Рассчитать средний размер штрафа, моду, медиану. Решение

Средний размер штрафа:

Эта формула — средняя арифметическая взвешенная. Расчет по средней арифметической простой формуле дает искаженный ре-

- У.Х 100 + 200 + 500 + 750 + 1000 Г1АА ^ зультат: Ха = ^— =-= 510,0 руб., так как

Zjn 5

учитывает не каждый частный случай, а только варианты значений. Модальный штраф Мо = 200 руб.

Вывод: наиболее часто правонарушители штрафовались на сумму 200 руб. (больше всего — 15 раз).

Медианой будет штраф 18-го (35 / 2 = 17,5) правонарушителя по ранжиру (в нашей задаче ряд ранжирован). Для четкого определения медианного значения нужно дополнить данные рядом накопленных (кумулятивных) частот (-5). Для этого к каждой предыдущей частоте т добавляется последующая.

В первой группе правонарушителей (100 руб.) всего 5 чел., а в следующей (200) их 15, т.е. вместе уже 20 чел. Следовательно, искомый нарушитель оказался в числе этих 15 чел., т.е. его штраф также 200 руб., Me = 200 руб.

Вывод: у половины правонарушителей штраф 200 руб. и менее, а у другой половины — 200 и более.

Ситуация № 3 — сгруппированные данные (интервальный ряд распределения)

Задача 4.4. Данные по региону об уровне потребления мяса в отчетном году:

п/п

Уровень потребления, кг/чел/год (х)

Число районов (т)

Центры (середины) интервалов

1

Менее 40

2

30

2

40-60

5

50

3

60-80

4

70

4

80-100

7

90

5

100-120

1

110

6

Свыше 120

6

130

Итого

25

При расчете среднего значения возникает проблема: что использовать в качестве вариантов значений признака X? Существует правило, согласно которому таковыми считаются центры (середины) интервалов, которые рассчитываются как полусумма их границ. Однако в ряду имеются первый и последний интервалы с одной границей. В этом случае вводится условие, что величина таких открытых интервалов равна величине соседнего. Величина интервала — разница между его границами.

Решение

Проведем предварительные расчеты.

Первый интервал считаем равным второму, соседнему, имеющему величину 20 (60-40). Значит, первый интервал обретает вторую границу, и получаем следующие значения: 20—40. Центр будет равен (20 + 40) /2 = 30.

Второй интервал: (40 + 60) / 2 = 50.

Третий интервал: (60 + 80) / 2 = 70.

Четвертый интервал: (80 + 100) / 2 = 90.

Пятый интервал: (100 + 120) / 2 = 110.

Шестой интервал приравниваем по величине к пятому, т.е. соседнему (величина 20 = 120 - 100) и имеем 120-140, отсюда центр: (120+ 140)/2= 130.

Средний уровень потребления мяса по области:

п/п

Уровень потребления, кг/ чел (А)

Число районов(т)

Накопленные частоты (5)

1

Менее 40

2

2

2

40-60

5

7

3

60-80

4

11

4

80-100

7

18

5

100-120

1

19

6

Свыше 120

6

25

Итого

25

Расчет моды и медианы в интервальном ряду распределения имеет особенности, связанные с применением специальных формул. Эти формулы справедливы для рядов с равными интервалами:

где Х0 нижняя граница модального интервала; h — величина модального интервала; тх, т2, щ— частоты (соответственно) предмо- дального, модального и потсмодального интервалов.

Модальный интервал — это интервал с наибольшей частотой. В данном случае это будет интервал 80—100 с частотой т = 7:

Вывод: наиболее часто встречаются районы с уровнем потребления мяса 86,7 кг/чел.:

* где Х0 нижняя граница медианного интервала; h — величина медианного интервала; S' — накопленная частота предмедианного интервала; тш частота медианного интервала.

Медианный интервал — это интервал, в котором находится середина ранжированного ряда (в данной задаче ряд ранжирован). В данном случае это будет 13-й район (25 / 2 = 12,5) по ранжиру. По ряду накопленных частот S найдем интервал, в котором накопленная частота впервые превышает число 13. Это интервал № 4, т.е. 80-100:

Вывод: в половине районов уровень потребления мяса менее 84,3 кг/чел., в другой половине — более 84,3.

 
Посмотреть оригинал