Основные понятия и последовательность выполнения корреляционно-регрессионного анализа

Уровень результативных показателей складывается, как правило, под влиянием взаимодействия и взаимопереплетения многих факторов. Некоторые из них являются случайными. Их влияние на результативный показатель как бы затушевывает его причинно-следственные связи с другими факторами.

Перед экономистом, выполняющим анализ, ставится задача выделить из общей массы случайностей закономерные связи между изучаемыми явлениями. Для ее решения используются приемы корреляционного и регрессионного анализа, позволяющие определить тесноту связи между результативными и факторными показателями, построить экономико-математическую модель их взаимосвязи. В процессе построения и использования корреляционных моделей можно выделить следующие этапы.

Первый этап. Анализируемое явление тщательно изучается. Подбираются один или несколько результативных показателей, характеризующих явление в целом. Выясняется и логически обосновывается круг важнейших факторов, определяющих уровни выбранных показателей. Выдвигается гипотеза о наличии существенной зависимости уровней результативных показателей от выбранных факторов.

Второй этап. Собирается исходная информация — данные об уровнях факторных и результативных показателей, получаемые на основании многократных наблюдений.

Третий этап. Собранная информация подвергается исследованию. Проверяется гипотеза о наличии существенной зависимости результативных показателей от выбранных факторов путем оценки тесноты связи между ними. Строится математическая модель изучаемого явления. Проверяется ее соответствие (адекватность) реальному явлению.

Четвертый этап. На базе построенной модели выполняется анализ или прогнозирование изменений исследуемого явления.

Наиболее ответственным является первый этап. Характер работ, выполняемых на этом этапе, в значительной мере зависит от цели исследования и области применения его результатов. В экономическом анализе чаще всего целью исследования с применением математических методов является выделение наиболее существенных причин-факторов, вызывающих изменение анализируемого показателя и построение близкой к действительности модели их взаимосвязи.

Моделирование изучаемого явления начинается с выбора показателя — функции у. Для этого может быть использован показатель, применяемый в практике для характеристики данного явления. Однако могут иметь место случаи, когда изучение таких показателей выявляет их несоответствие моделируемому явлению. Тогда возникает необходимость конструировать новый показатель или устранить недостатки ранее действующего.

Далее выбранный показатель у представляется как функция от одной или нескольких переменных х;-:

При этом в качестве аргументов х,, х2, ..., х,- необходимо выбрать факторы, оказывающие решающее влияние на показатель-функцию. Отбор факторов на данном этапе осуществляется экспертным порядком, т.е. исследователь, опираясь на свой опыт и знание моделируемого явления, выбирает факторы, предположительно оказывающие (по мнению исследователя) существенное влияние на показатель-функцию. При отборе факторов следует иметь в виду, что между факторами, включаемыми в модель, а также между результативным показателем и факторами не должно быть функциональной (детерминированной) связи.

На данном этапе круг отобранных факторов может быть весьма широк. В последующем, при проверке гипотезы о существовании связи между отбираемыми факторами и результативным показателем, часть факторов будет отброшена, если данная гипотеза не подтвердилась. Кроме того, если между факторами обнаружена тесная связь и, следовательно, эти факторы отражают воздействие на результативный показатель одной и той же причины, то целесообразно отобрать один из этих факторов для включения в модель, отбросив остальные. Нежелательно включать в модель большое количество факторов, так как это может привести к значительному ухудшению характеристик построенной модели.

Второй этап исследования — сбор исходной информации — является наиболее трудоемким. Здесь решается вопрос о выборе объектов, на базе которых нужно выполнять исследование. Такими объектами могут быть организации, цехи, бригады, технологические операции и т.п. В большинстве случаев решение этого вопроса предопределяется областью применения будущей модели. Так, если модель исследуемого экономического явления намечено использовать при планировании, прогнозировании, нормировании или анализе работы одной организации (или ее подразделения), то и строить эту модель целесообразно на базе информации исследуемой организации (ее подразделения). Модель, построенная при обработке исходных данных нескольких организаций, может применяться для изучения закономерностей, свойственных всем обследуемым объектам.

Важно определить периоды времени, за которые выбирается информация, например, несколько месяцев, кварталов или лет. Поскольку на величине показателей, характеризующих любое производство, сказывается влияние технического прогресса, не рекомендуется включать в обследование организации, значительно отличающиеся по своему техническому оснащению или по другим параметрам, имеющим важное значение при моделировании исследуемого явления. Это позволит обеспечить однородность исходных данных. Не рекомендуется по той же причине выбирать информацию по одной организации за период более трех лет. Количество организаций и периодов (или моментов времени) определяют число наблюдений, принимаемых во внимание при построении модели. Считается, что выводы, сделанные на основе данной модели, будут достаточно надежными, если при ее построении число наблюдений в десять и более раз превышало число факторов, включаемых в модель.

Собранные исходные данные должны быть тщательно проверены с точки зрения их полноты и однородности. Нужно проследить, чтобы по каждому наблюдению имелись сведения о результативном и факторных показателях, выраженные в соответствующих единицах измерения. Резко выделяющиеся наблюдения подлежат исключению из рассматриваемой совокупности. Кроме того, нужно обеспечить сопоставимость одноименных показателей, взятых по различным организациям и за разные периоды времени.

Третий этап исследования — построение модели явления — начинается с рассмотрения количественных оценок парных связей между результативным и факторными показателями. Для проверки гипотезы о наличии зависимости между двумя показателями х и у может быть построено корреляционное поле. С этой целью на оси абсцисс отмечаем ряд значений х{; х2; х3... переменной х; стро-

Корреляционные поля, используемые для характеристики взаимосвязи переменных х и у

Рис. 4.2. Корреляционные поля, используемые для характеристики взаимосвязи переменных х и у

им ординаты у{; у2; у у.., представляющие значения другой переменной у и получаем ряд точек:

Характер расположения этих точек на плоскости позволяет судить о форме и о тесноте парной корреляционной связи. Например, на рис. 4.2, а, б показаны корреляционные поля, характеризующие высокую тесноту связи между переменными х и у, а форма корреляционного поля на рис. 4.2, в—д указывает на отсутствие связи между двумя переменными.

Форма корреляционного поля дает только общее представление о тесноте связи между переменными. Количественно ее измерить можно исчислив (в примере — по данным табл. 4.3) коэффициент корреляции

где п — число наблюдений переменных х и у.

Расчет по этой формуле выполняется в случае линейной зависимости между показателями у их. Величина коэффициента корреляции может изменяться в интервале от —1 до +1. Знак «+» или «—» указывает на наличие прямой или обратной связи между коррелируемыми признаками. Если коэффициент корреляции по абсолютной величине равен 1, то между х и у существует функциональная связь. При гух < 0,25 связь между х и у считается очень слабой; при = 0,25—0,44 — слабой, при = 0,45—0,64 — умерен- ной, при гух = 0,65—0,80 — сильной, при гух = 0,81—0,90 — весьма сильной; при гух = 0,91 — 1,00 — очень сильной.

Высокая корреляция между х и у подтверждает гипотезу о наличии взаимосвязи этих переменных. Причинный характер исследуемой зависимости должен быть обоснован теоретически при отборе факторов.

Полученный коэффициент корреляции глп. необходимо проверить

Ул

на значимость. При проверке выдвигается гипотеза о том, что истинИсходные данные и расчеты по оценке связи показателей х и у

Номер

наблюдения

Величина

показателей

Расчеты, выполняемые при оценке коэффициентов корреляции г и определении

параметров функции у = а + Ьх

1

480

40

19 200

230 400

1600

36,20

3,80

14,42

-2,20

4,84

2

510

35

17 850

260 100

1225

38,02

-3,02

9,12

-7,20

51,84

3

530

41

21 730

280 900

1681

39,23

1,77

3,13

-1,20

1,44

4

540

38

20 520

291 600

1444

39,84

-1,84

3,38

-4,20

17,64

5

570

39

22 230

324 900

1521

41,65

-2,65

7,05

-3,20

10,24

6

590

42

24 780

348 100

1764

42,87

-0,87

0,75

-0,20

0,04

7

620

46

28 520

384 400

2116

44,68

1,32

1,73

3,80

14,44

8

640

46

29 440

409 600

2116

45,90

0,10

0,01

3,80

14,44

9

650

47

30 550

422 500

2209

46,50

0,50

0,25

4,80

23,04

10

660

48

31 680

435 600

2304

47,11

0,89

0,80

5,80

33,64

Сумма

5790

422

246 500

3 388 100

17 980

40,63

171,60

Средняя

величина

579

42,2

Примечание. (?х)2 = 33 524100; (^>)2 = 178084.

ный коэффициент корреляции г . с вероятностью Р = -р значимо не отличается от исчисленного коэффициента корреляции (здесь р — уровень значимости, заданный исследователем, — вероятность того, что указанная гипотеза не подтверждается. В экономических исследованиях уровень значимости берется 0,05 или 0,01).

Для проверки правильности выдвинутой гипотезы определяется расчетное значение критерия /-Стьюдента:

где аг — среднеквадратическая ошибка парного коэффициента корреляции г , исчисляемая по формуле

Расчетное значение критерия t сравнивается с его табличным значением t(, найденным при заданном уровне значимости Р и при числе степеней свободы v — п — 2. Если t > t(, то истинное значение коэффициента г х значимо не отличается от исчисленного гху. Имея значение среднеквадратической ошибки коэффициента корреляции, можно определить его гарантийный минимум:

Результаты оценки тесноты связи между рассматриваемыми показателями используют для отбора факторов, подлежащих включению в разрабатываемую модель их взаимосвязи. При этом отбрасываются факторы, связь которых с результативным показателем оценена как слабая. Если между двумя факторами обнаружена сильная, весьма сильная или очень сильная связь, то один из них также отбрасывается. Это объясняется тем, что оба фактора отражают влияние на результативный показатель одних и тех же причин и для учета их влияния в модель достаточно включить один из факторов. Особое внимание при построении многофакторных моделей нужно обратить на соблюдение требования отсутствия в модели функционально связанных факторов.

Форма корреляционного поля позволяет установить характер линии регрессии, т.е. линии, в среднем отражающей закономерность изменения переменной у при изменении переменной х. В экономических исследованиях при характеристике взаимосвязи двух переменных часто используют следующие функции: прямая линия

о bi

у = а + Ьхх парабола у = а + Ьхх + Ь2хг; гипербола у = я+—; степенная у = ахь. Здесь а, b]9 Ь2 — постоянные коэффициенты.

Определяя класс функции, исследователь должен исходить не только из графического изображения взаимосвязи х и у, но и принимать во внимание возможность теоретического обоснования формы связи при изучении сущности исследуемого явления.

Выбрав функцию, с помощью которой будет описываться взаимосвязь переменных х и у, приступают к нахождению значений постоянных коэффициентов уравнения регрессии. Обычно для этой цели используется способ наименьших квадратов. Задача формулируется так: требуется найти такие значения постоянных коэффициентов, при которых сумма квадратов отклонений теоретических значений ординат у от эмпирических у будет минимальной, т.е.

Если теоретическая линия регрессии выражается уравнением прямой линии у = а + Ьх, то требование наименьших отклонений теоретических значений ординат от эмпирических будет обеспечено при нахождении параметров а и b путем решений следующей системы уравнений:

Отсюда

Тогда у = 7,113 + 0,0606х.

Расчеты коэффициентов корреляции и параметров линии регрессии выполняются на компьютере по специально разработанным программам.

Параметр b в уравнении регрессии называется коэффициентом регрессии. Он выражает среднее изменение переменной у при увеличении переменной х на единицу. Очевидна возможность его использовании для целей анализа и прогнозирования. Численное значение коэффициента регрессии зависит от принятых единиц измерения переменных х и у.

Помимо коэффициента регрессии b для характеристики зависимости между х и у может быть исчислен коэффициент эластичности Э, показывающий, на сколько процентов в среднем изменится переменная у, если переменная х изменится на один процент:

где хну— средние арифметические значения переменных х и у.

После того как найдены параметры уравнения регрессии, необходимо проверить его значимость. Считается, что парное уравнение регрессии значимо, если значим парный коэффициент корреляции.

Если связь между коррелируемыми признаками нелинейная, то для оценки тесноты связи исчисляется корреляционное отношение ]ух:

Этот показатель имеет тот же смысл, что и коэффициент корреляции. Проверка его значимости может быть осуществлена с помощью критерия /-Стьюдента.

Результаты исследования парных связей между переменными используются главным образом в процессе предварительного изучения и отбора факторов, определяющих уровень результативного показателя. Рассмотрение парных зависимостей позволяет выявить основные контуры существенных связей между результативным и факторными показателями. Характеристика совместного влияния всех отобранных факторов может быть дана при построении многофакторной корреляционной модели изучаемого явления. В экономических исследованиях наибольшее распространение получили линейные и степенные многофакторные модели:

Здесь к — число факторов, включаемых в модель.

Широкое распространение этих функций в моделировании экономических явлений объясняется главным образом простотой экономической интерпретации значений коэффициентов регрессии

*1> Ь2> *3.....V

В линейной модели коэффициенты регрессии b показывают, на какую величину изменится уровень результативного показателя у при изменении фактора х;- на единицу и при условии, что остальные факторы, включенные в модель, остаются фиксированными на среднем уровне. В степенной модели коэффициенты регрессии b показывают, на сколько процентов изменится уровень результативного показателя у при изменении каждого фактора на один процент и при постоянстве остальных факторов. Параметры уравнения множественной регрессии могут быть определены способом наименьших квадратов.

Они также проверяются на значимость. При обнаружении незначимых коэффициентов регрессии соответствующие факторы исключаются из модели, после чего расчеты повторяются уже без исключенного фактора. Если проверка покажет значимость всех коэффициентов регрессии, то построение модели считается законченным. Для характеристики построенной модели исчисляется корреляционное отношение и проверяется его значимость.

Полученная модель обязательно должна проверяться с точки зрения ее соответствия теоретическим представлениям о характере взаимосвязи результативного и факторных показателей. Проверенная модель может быть использована в анализе хозяйственной деятельности для приближенной оценки влияния на результативный показатель отдельных факторов.

При использовании корреляционных моделей результативного показателя для целей анализа или планирования-прогнозирования (четвертый этап исследования) нужно иметь в виду, что:

  • — в модели отражаются условия формирования величины результативного показателя, сложившиеся за обследуемый период (т.е. за период по данным которого строилась модель). Например, известно, что характер зависимости расходов от объемов выполняемых работ существенно различается при росте или спаде объемов производства. Поэтому экономическую модель, построенную в условиях падения объемов производства, нецелесообразно использовать для прогнозирования изменений расходов в условиях роста производства;
  • — модель можно использовать при изучении только той совокупности объектов, по данным которых она была построена. Так, если зависимость расходов от объемов производства исследовалась по совокупности однотипных организаций, то построенную модель правомерно применять для изучения изменений расходов в целом данной совокупности, а не отдельных субъектов, ее образующих.
 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >