Меню
Главная
Авторизация/Регистрация
 
Главная arrow Статистика arrow Общая теория статистики

Изучение основной тенденции развития в рядах динамики и прогнозирование

Одной из основных задач, которая возникает при анализе динамических рядов, является определение общей тенденции изменения уровней изучаемого явления во времени (тренда). В некоторых случаях общая тенденция развития хорошо просматривается по исходному динамическому ряду. Но чаще всего встречаются с такими случаями, где она сразу не видна.

На развитие изучаемого явления во времени оказывает влияние ряд факторов. Эти факторы различны по своему характеру и силе воздействия. Те из факторов, которые действуют постоянно, оказывают на изучаемое явление определяющее влияние и формируют основную тенденцию развития в динамическом ряду. Влияние других факторов происходит периодически (оно может зависеть от времени года). Происходят также случайные (кратковременные) воздействия на уровни ряда.

Трендом (основной тенденцией развития) называется плавное и устойчивое изменение уровней изучаемого явления во времени, которое свободно от случайных колебаний. Для определения тренда в статистике используют методы выравнивания динамического ряда.

К методам выравнивания относятся: способ укрупнения интервалов, скользящей средней, аналитическое выравнивание. Укрупнение интервалов — один из самых простых способов определения тренда. Он основан на укрупнении периодов времени, к которым относятся уровни изучаемого динамического ряда. Например, ряд, содержащий данные о месячном выпуске продукции, можно заменить рядом квартального выпуска продукции. При суммировании уровней или при нахождении средних по укрупненным интервалам отклонения в уровнях, которые обусловлены случайными причинами, взаимопогашаются, сглаживаются и более четко проступает основная тенденция ряда динамики. Недостатком данного ряда является то, что укрупненный ряд будет короче исходного, а это означает потерю информации.

Рассмотрим конкретный пример применения метода укрупнения интервалов.

Пример 8.3

Имеется динамический ряд преступности в РФ за 25 лет. Выравняем этот ряд методом укрупнения интервалов. Укрупним интервалы, найдя ряд преступлений за пятилетки, и вычислим средние значения (табл. 8.5).

В выравненном ряду основная тенденция (тренд) роста зарегистрированных преступлений явно просматривается.

Таблица 8.5

Динамика преступности в РФ

Год

Зарегистрировано преступлений у.

Укрупненные данные по пятилеткам

Средние данные по пятилеткам

1976

834998

1977

824243

1978

889599

4547638

909528

1979

970514

1980

1028284

1981

1087908

1982

1128558

1983

1398239

6436334

1287267

1984

1402694

1958

1418935

1986

1338424

1987

1185914

1988

1220361

7203331

1440666

1989

1619181

1990

1839451

1991

2167964

1992

2760652

1993

2799614

13116607

2623321

1994

2632708

1995

2755669

1996

2625081

1997

2397311

1998

2581940

13558447

2711689

1999

3001748

2000

2952367

Еще одним методом выравнивания динамических рядов является способ скользящей (подвижной) средней. Его суть состоит в том, что вычисляется средний уровень из определенного числа, обычно нечетного (3, 5, 7 и т. д.), первых по счету уровней, затем находится среднее из того же числа уровней, но начиная со второго по счету, затем — начиная с третьего и т. д. Поэтому средняя “скользит” по динамическому ряду, сдвигаясь на один уровень.

Недостатком данного способа, как и метода укрупнения интервалов, является то, что выравненный ряд будет короче исходного, поэтому часть информации теряется.

Рассмотрим конкретный пример применения метода скользящей средней.

Пример 8.4

Выровняем динамический ряд преступности в РФ с 1991 по 2000 г. с помощью метода скользящей средней (усреднять будем по трем и пяти годам). Исходный ряд динамики и выравненные ряды приведены в табл. 8.6.

Таблица 8.6

Динамика преступности в РФ

Год

Зарегистрировано преступлений у.

Скользящая средняя

трехлетняя

пятилетняя

1991

2167964

1992

2760652

2575987

1993

2799614

2730991

2623321

1994

2632708

2729330

2704745

1995

2755669

2671153

2642077

1996

2625081

2592687

2598542

1997

2397311

2534777

2672350

1998

2581940

2660333

2711689

1999

3001748

2845352

2000

2952367

Из таблицы видно, что выравненный по методу скользящей средней ряд получился более сглаженным. Причем чем больше уровней усреднять, тем более сглаженным получается ряд, но он будет и короче. Сглаженный ряд зарегистрированных преступлений по трехлетиям получается на два уровня короче исходного ряда, а сглаженный по пятилетиям — на четыре уровня.

Рассмотренные нами выше методы выравнивания рядов динамики дают возможность найти лишь общую тенденцию развития изучаемого явления, которая более или менее освобождена от случайных колебаний. Но получить обобщенную

статистическую модель тренда с помощью этих методов невозможно. Для того чтобы получить количественную модель, выражающую общую тенденцию изменения уровней ряда динамики во времени, применяют аналитический способ выравнивания. В этом случае реальные (исходные) уровни ряда заменяются теоретическими уровнями. Теоретические уровни рассчитываются как функции времени:

где yt — теоретические уровни динамического ряда, найденные по уравнению (8.23) на соответствующие моменты времени.

Модель (8.23) должна наилучшим образом аппроксимировать основную тенденцию (тренд) изучаемого ряда динамики. Подбор такой адекватной модели и есть главная задача аналитического метода, все остальное это дело техники.

Выбор вида модели во многом определяет результаты прогнозирования (экстраполяции) тренда. Основанием для выбора модели может быть содержательный анализ существа развития изучаемого явления. Можно использовать результаты предыдущих исследований в данной области.

Приведем некоторые виды моделей, часто применяемые для аналитического выравнивания:

1) линейная yt = аt + b;

2) квадратичная парабола yt=a1-t2 +a2-t + b‘,

3) кубическая парабола yt=a1-t3 +a2-t2 + a3-t + b;

4) показательная yt = bа

5) экспоненциальная yt = b • ea;

6) логарифмическая парабола yt = b ? a[a2;

7) гиперболическая yt=—+b",

8) кривая Гомперца yt = b ? a“2 и др.

При наличии периодических колебаний в динамическом ряду для его выравнивания и прогнозирования используют ряд Фурье. Оценка параметров выбранной модели, как правило, осуществляется по методу наименьших квадратов (МНК). Скажем несколько слов о МНК. В 1806 г. французский математик

Лежандр предложил метод решения неопределенных систем линейных уравнений, неизвестными в которых были поправки в результаты наблюдений, получивший название МНК. В этом методе уравнения подчиняются дополнительному условию: сумма квадратов поправок (v.), которые вводятся в равноточные наблюдения, должна быть минимальной, меньше суммы квадратов любой другой системы поправок, которая удовлетворяет данным уравнениям, т. е.

Условие (8.24) и есть математическое выражение принципа наименьших квадратов. Поэтому из всех возможных решений системы уравнений выбирается то, которое удовлетворяет условию (8.24).

В нашем случае условие метода наименьших квадратов имеет вид:

где yt — выравненные теоретические уровни динамического ряда;

у. — фактические уровни динамического ряда.

Рассмотрим выравнивание ряда динамики по линейной функции (в качестве модели берем уравнение прямой). Оно применяется, как правило, тогда, когда абсолютные приросты практически постоянны.

Итак, линейная модель имеет вид:

где аи5 пока неизвестные нам параметры.

Подставляем (8.26) в условие МНК (8.25) и получаем

Итак, задача состоит в определении минимума функции двух аргументов F(a, Ъ). Из курса математического анализа известно, что необходимое условие экстремума (в данном случае минимума) функции двух аргументов имеет вид:

Дифференцируем последовательно функцию (8.27) по аргументам а и Ъ и получаем:

После преобразования системы (8.28) получаем так называемую систему нормальных уравнений:

где у. — фактические уровни ряда;

? — время (порядковый номер периода или момента времени);

к — количество уровней ряда динамики.

Решая систему нормальных уравнений, можно найти параметры а и Ъ. Но их расчет можно значительно упростить, если за начало отсчета времени (? = 0) взять центральный интервал (момент). При четном числе уровней (например, 6), значения ? — условного обозначения времени будут следующими:

Год

2000

2001

2002

2003

2004

2005

?

-5

-3

-1

+ 1

+3

+5

При нечетном количестве уровней (например, 7) значения ? будут таковы:

Год

2000

2001

2002

2003

2004

2005

2006

?

-5

-3

-1

0

+ 1

+3

+5

В обоих случаях получаем:

Поэтому с учетом (8.30) система нормальных уравнений (8.29) принимает следующий вид:

Из второго уравнения системы (8.31) находим:

После этого из первого уравнения системы (8.31) получаем:

Формулы (8.32) и (8.33) и есть искомые выражения для определения нужных нам величин.

Теперь рассмотрим конкретный пример аналитического выравнивания динамического ряда.

Пример 8.5

Выравняем по прямой динамический ряд преступности в СССР. Исходный ряд динамики и необходимые расчеты приведены в табл. 8.7. Исходный ряд динамики предварительно изобразим графически в виде линейной диаграммы (рис. 8.2). Заметим, что несмотря на то, что исходные данные — реально зарегистрированные данные, задача является учебной, так как рассматриваемый нами ряд динамики слишком короткий, чтобы можно было делать какие-то серьезные выводы, например

проводить экстраполяцию за пределы исходного динамического ряда. Линейная диаграмма, в частности, показывает, далеко ли отклоняются исходные данные от уравнения прямой, принятой нами за модель тренда.

Из рис. 8.2 видно, что данные за 1987, 1988, 1990 гг. достаточно сильно отклоняются от прямой линии, мысленно проведенной на рисунке. Повторим еще раз, что для адекватного выбора модели тренда нужно больше данных.

Рис. 8.2

Таблица 8.7

Год

Исходные уровни ряда динамики у.

Выравненные уровни ряда динамики yt

?

?2

1981

1609470

1628677

-9

81

1982

1655932

1717768

-7

49

1983

2016514

1806859

-5

25

1984

2029144

1895950

-3

9

1985

2083501

1985041

-1

1

1986

1987239

2074132

+ 1

1

1987

1798549

2163224

+3

9

1988

1867223

2252315

+5

25

1989

2461692

2341406

+7

49

1990

2786605

2430497

+9

81

По данным табл. 8.7 находим:

По формулам (8.32) и (8.33) получаем:

Таким образом, модель тренда в соответствии с формулой (8.26) в нашем случае имеет вид:

Используя (8.34) находим выравненные значения уровней исходного ряда динамики. Например, для 1981 года имеем:

и т. д. Полученные результаты заносим в графу 3 табл. 8.7. Проведем арифметический контроль. Должно выполниться

равенство По данным табл. 8.7 (графа 3) определяем Видно, что арифметический контроль соблюдается. Это говорит о том, что при нахождении параметров а и Ъ не было допущено ошибок в вычислениях. Нанесем выравненные значения динамического ряда на рис. 8.2. Это можно делать по двум точкам, так как выравненные значения ряда лежат на прямой. Из рис. 8.2 видно, что наблюдается существенное отклонение от прямой в периоды 1987 и 1988, 1990 гг.

Кратко рассмотрим вопрос об экстраполяции в рядах динамики и прогнозировании. Экстраполяция — это определение уровней за пределами изучаемого ряда динамики, т. е. продолжение в будущее той тенденции, которая наблюдалась в прошлом. Поэтому модель тренда позволяет сделать прогноз о том, как будет вести себя изучаемое явление в будущем. Но так как основная тенденция может и измениться по независящим от нас причинам, результаты, полученные путем экстраполяции изучаемого ряда, надо считать вероятностными (приближенными).

Зная модель тренда и считая, что она сохраняется и за пределами изучаемого ряда, можно получить прогноз, подставляя в уравнение тренда значения времени t, лежащие за приделами изучаемого ряда.

Например, используя полученную нами в примере 8.5 модель тренда (8.34), определим ожидаемую преступность в СССР в 1991 году, подставив t = 11 в формулу (8.34). Получаем:

т. е. мы нашли так называемую то чечную (дискретную) оценку.

Реально результат экстраполяции прогнозируемых процессов получают интервальными оценками.

Для нахождения границ интервала применяют формулу

где ta — коэффициент доверия по распределению Стьюдента; — остаточное среднее квадратичное отклонение;

"t

т — число параметров адекватной модели тренда, для уравнения прямой т = 2.

Вероятностные границы интервала прогнозируемого явления имеют вид

По данным примера 8.5 найдем границы доверительного интервала количества зарегистрированных преступлений в СССР на 1991 год. В нашем примере к = 10, т = 2, поэтому число степеней свободы (к - т) = 8. Заметим, что число степеней свободы — это число элементов статистической совокупности, вариация которых не ограничена. Выбираем уровень значимости (ошибку первого рода) а = 0,05. По таблице t-критерия Стьюдента (приложение 10) находим t = 2,306. Используя данные табл. 8.7, вычисляем

Далее по формуле (8.37), используя полученную точечную оценку ytn, получаем:

Поэтому с вероятностью 0,95 можно говорить о том, что зарегистрированная преступность в СССР будет лежать в пределах, указанных неравенством (8.38), если конечно модель тренда (8.34) сохранится.

Экстраполяцию надо рассматривать в качестве предварительного этапа в разработке прогноза. Для его составления надо привлекать информацию, которой нет в изучаемом ряду динамики.

Если говорить о нашем примере, то в 1991 г. Советский Союз распался, а мы, имея данные нашего ряда динамики, учесть это не могли.

Скажем несколько слов о методах выявления тренда в рядах динамики. Его можно выявить, например, методом проверки разности средних уровней. Для этого изучаемый ряд динамики разбивают на две примерно равные группы и для каждой из них находят среднее арифметическое и дисперсию. Затем проверяют гипотезу о равенстве дисперсий по критерию Фишера.

Рассмотрим более подробно другой метод обнаружения тренда в ряду динамики, который называется критерий на дрейф Нойманна [22]. При его использовании в качестве ноль- гипотезы (Но) проверяют, зависимы ли последовательные уровни ряда динамики друг от друга, т. е. существует ли дрейф во времени. Для этой цели находят величину:

Найденное по (8.39) значение D сравнивают с величиной Dma6ji, которое берут из табл. 8.8 критических значений критерия Нойманна. Гипотеза Но отклоняется, если D лежит ниже табличного значения для заданного уровня значимости а. Отклонения гипотезы Но подтверждает наличие тренда в исследуемом ряду динамики.

Если количество уровней в ряду динамики не менее десяти и не более 30 (10 < Тс < 30), то вместо табл. 8.8 можно использовать приближенную формулу:

Таблица 8.8

к

а = 0,05

а = 0,01

4

0,78

0,59

5

0,82

0,42

6

0,89

0,36

8

0,98

0,40

10

1,06

0,48

12

1,13

0,56

14

1,18

0,62

16

1,23

0,68

18

1,27

0,74

20

1,30

0,79

25

1,37

0,88

30

1,41

0,96

35

1,49

1,08

Применим критерий Нойманна к ряду динамики, рассмотренному нами в примере 8.5. Определяем среднее арифметическое у = 2029586,9.

Для нахождения дисперсии применим формулу

так как число уровней нашего ряда 10 и приведенная нами формула используется для нахождения несмещенной оценки:

По формуле (8.39) получаем

Задаем уровень значимости а = 0,05 и по табл. 8.8 находим Dma6A = 1,06. Так как количество уровней рассматриваемого нами ряда динамики равно 10, то для определения -Отабл можно использовать формулу (8.40). Применив ее получим D , = 1,08. Так как вычисленное значение D лежит ниже таб- личного значения, то гипотеза Но отклоняется, а это говорит о наличии тренда в рассматриваемом ряду динамики. Повторим еще раз, что приведенный нами пример носит учебный характер, количество уровней рассмотренного нами ряда мало, поэтому полученный нами результат мог получиться случайно.

 
Посмотреть оригинал
Если Вы заметили ошибку в тексте выделите слово и нажмите Shift + Enter
 
Популярные страницы