Линеаризация регрессионных моделей

Линеаризация большинства количественных моделей (регрессионных в том числе) чаще всего основана на том, что любая гладкая функция спрямляема в малой окрестности каждой внутренней точки своей области определения. Поэтому есть основания думать, что при «очень малых» изменениях рассматриваемых параметров многие зависимости можно считать линейными.

Разумеется, это не дает оснований распространять линейные зависимости на «глобальные» промежутки. Чем больше расширяется интервал, на котором проводится наблюдение (чем менее он похож на «малую окрестность»), тем хуже объясняющая способность соответствующей линейной модели, т. е. тем меньше ее коэффициент детерминации.

В некоторых случаях линеаризация моделей бывает необходима исследователям для того, чтобы они сами оказались в состоянии решить стоящую перед ними задачу. Хотя, справедливости ради, скажем, что такие случаи сейчас все более редки: современная наука, в том числе и экономическая, научилась обращаться с весьма нелинейными зависимостями и изобрела адекватные методы их анализа и оценки.

Любая факторная регрессионная модель может быть линеаризована, если применить предельный анализ, т. е. от зависимости между накапливаемыми величинами перейти к исследованию зависимости между их приращениями. В частности, можно не заботиться о виде производственной функции, если рассматривать ее в приращениях: в таком виде любая модель становится линейной, и причина этого факта заключается в инвариантности формы первого дифференциала [14, 16].

Пусть функция Y = f(x,, хп) зависит от п не зависящих друг от друга переменных. В таком случае полный дифференциал этой функции представляет собой линейную комбинацию приращений переменных (факторов), от которых она зависит:

Принимая теперь dY в качестве объясняемой величины, a dx,, dxn — в качестве объясняющих переменных, получаем стандартную логику линейной факторной модели, в которой, имея динамические ряды переменных dY. dx,, .... dxn, при помощи

д/ . .

регрессионных методов можно определить веса -, 1=1, ..., п.

ЭХ;

характеризующие различную степень зависимости объясняемой (результирующей) функции от каждой из объясняющих переменных. Если соответствующий вес при i-й объясняющей переменной достаточно велик по модулю, можно считать, что результирующая величина Y сильно зависит от данной переменной х,, если мал — то слабо зависит.

Проведенное рассуждение показывает общую логику факторных моделей и позволяет объяснить, почему именно линейные факторные модели столь любимы и столь широко распространены.

Для того чтобы описанная линейная модель реально работала, необходимо соблюдение двух условий.

  • 1. Нужно убедиться в том, что функция Y не зависит от других переменных, помимо х,,..., хп. При этом нужно понимать, что любое факторное уравнение такого рода есть результат абстрагирования, отвлечения от действия каких-то факторов, так что почти наверняка существуют еще какие-то влияющие на результат переменные, не вошедшие в модель. Совоку пное влияние этих неучтенных факторов акку мулируется в случайной компоненте, и в этом заключается одна из причин того, почему имеет смысл заниматься исследованием так называемых остатков. На сегодняшний день в рамках эконометрического анализа разработаны весьма тонкие инструменты, позволяющие оценить поведение случайной компоненты и на основании проведенного анализа утверждать наличие или отсутствие закономерности в поведении этой компоненты.
  • 2. Нужно гарантировать, что эти п переменных действительно не зависят друг от друга. При этом линейная независимость проверяется отсутствием мультиколлинеарности всей совокупности регрессоров. Взаимной зависимости факторов можно избежать, применяя так называемый метод главных компонент, когда вместо исходных признаков используются взаимно ортогональные латентные факторы. Если же вошедшие в модель переменные оказались взаимно зависимыми, то полный дифференциал функции Y будет иметь существенно более сложный вид, отличный от вида (2.1), поскольку производные х( по х( не будут равняться нулю.

Современная эконометрика формально справляется с решением обеих этих проблем. Коэффициент детерминации рассматриваемой модели показывает, на сколько процентов динамика объясняющих переменных в совокупности позволяет объяснить изменение результирующей функции. При помощи коэффициентов парной линейной корреляции между динамическими рядами переменных сЦ устанавливается линейная независимость этих переменных друг от друга.

Заметим, что представления о независимости объясняющих переменных, основанные на линейной корреляции их динамических рядов, весьма поверхностны: низкие коэффициенты линейной корреляции не могут служить надежными гарантами независимости переменных; они лишь позволяют утверждать, что связь между ними (если она существует) непохожа на линейную зависимость (для исследования нелинейных зависимостей используют корреляционное отношение).

В качестве примера рассмотрим фазовую плоскость (а, Ь), на которой крестиками нанесены одновременно принимаемые значения этих двух гипотетических переменных по результатам наблюдений (рис. 2.4). Коэффициент линейной корреляции между а и Ь. разумеется, будет весьма невысок: однако едва ли найдется статистик, который стал бы утверждать, что эти параметры независимы.

Даже знак коэффициента корреляции в данном примере будет

определяться случайными обстоятельствами: если наблюдаемые значения пар (а, Ь) случайным образом группируются преимущественно в зонах 1 и 3 на рис. 2.5, статистика будет утверждать, что корреляция между ними положительна, если в зонах 2 и 4 — то отрицательна. Между гем, этот факт ничего не говорит о реальном характере взаимной зависимости переменных а и Ь.

Гипотетические данные наблюдении

Рис. 2.4. Гипотетические данные наблюдении: значения пар (а. Ь).

Кластеризация значений пар (а, Ь) из рисунка 2.4

Рис. 2.5. Кластеризация значений пар (а, Ь) из рисунка 2.4.

Приведенные соображения позволяют утверждать, что линейные факторные модели имеют весьма ограниченную пригодность. Они действительно полезны (и в ряде случаев незаменимы) при анализе локальных связей и зависимостей. Но в глобальном измерении линейных процессов не бывает. Рано или поздно насту пает насыщение, возникают пределы развития, приближение к которым дает замедляющийся, нелинейный эффект. В глобальном масштабе все процессы в природе и в обществе нелинейны, поэтому если вы вдруг обнаружили линейную зависимость — ищите, чего вы не поняли в этом процессе.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >