Принципы построения регрессионных моделей в макроэкономике

Общая методология: значимость моделей, причинность, тренды

Когда вы поднимаетесь по лестнице, вы можете поставить ногу на ступеньку двадцатью пятью разными способами — в зависимости от крутизны ступенек, от их ширины, от того, скользкая ли поверхность, а может быть, они прогнили и проваливаются при ходьбе, или скрипят, или имеют разную ширину слева и справа, если это винтовая лестница. Некоторые из этих двадцати пяти способов надежны и безопасны, другие заставят вас удерживать равновесие, совершая балансирующие движения, результат которых далеко не очевиден. А некоторые способы встать на ступеньку заведомо приведут к падению при следующем шаге. И только от вас зависит, какой из этих способов вы выберете.

Точно так же обстоит дело и с макроэкономическими моделями. Для каждого вопроса, который может быть задан, существует много десятков моделей, способных ответить на него с разной степенью точности, надежности и обоснованности. Вопрос заключается в том, каковы цели, с которыми вы прибегаете к моделированию макропараметров. В зависимости от целей и от обстоятельств, характеризующих динамику' макросистем, исследователь должен выбрать модель, которая максимально точно, полно и адекватно ответит на поставленный им вопрос.

Мы предпочитаем моделировать и прогнозировать параметры экономической динамики при помощи эконометрических (главным образом, регрессионных) моделей, позволяющих определить, с какой точностью получен тот или иной результат, а в случае необходимости включать или исключать объясняющие переменные до тех пор. пока не получится приемлемая с точки зрения адекватности модель.

Этих возможностей не предоставляют, например, псевдобалан- совые модели, авторы которых порой категорично утверждают их незаменимость для целей макроанализа и прогнозирования. Некоторая ирония заключается в том, что сторонники псевдобалансовых моделей часто убеждены в правоте предоставляемых ими выводов и в то же время начисто лишены аппарата, который был бы способен ее подтвердить.

Межотраслевые балансы предполагают решение N уравнений с N неизвестными. Найденная при этом равновесная точка имеет краткосрочный смысл и не позволяет делать какие бы то ни было выводы долгосрочного характера. При изменении хотя бы одного коэффициента во всей матрице вектор-столбец решений полностью изменяется, причем в рамках балансовой методологии нет возможности проверить, с какой именно точностью получен данный результат.

Любая равновесная модель действует так, как если бы на свете не было погрешностей измерения и вычисления, т. е. как если бы все цифры, встречающиеся в расчетах, были абсолютно точны.

Этот недостаток успешно преодолевают эконометрические модели. Здесь на N неизвестных мы (как правило) имеем минимум '/^(N2 - N) уравнений, и вместе с наилучшей аппроксимацией мы получаем приблизительный (стохастический) ответ на вопрос о том, с какой точностью найдена эта аппроксимация, что, разумеется, намного более ценно.

Мы никогда не пользуемся для получения информации о текущем времени часами, которые стоят, и охотно пользуемся часами, спешащими ровно на три минуты, несмотря на то, что стоящие часы дважды в сутки показывают точное время, а спешащие — никогда. Тем не менее, зная точность, с которой получен результат, мы в случае необходимости вводим нужную поправку и ориентируем свои действия по данным, полученным с известной нам точностью. Совершенно по той же причине эконометрические модели дают результат, намного более пригодный к дальнейшему употреблению.

Попутно эконометрические характеристики модели позволяют удостовериться в том, что построенная модель адекватна и значима, и дают возможность хотя бы приблизительно оценить вклад каждого из рассматриваемых факторов модели в итоговый результат — вариацию объясняемой переменной.

При этом на основе зависимостей, найденных по данным прошлых периодов, мы можем с известной точностью спрогнозировать, как изменятся найденные зависимости в будущем. В некоторых случаях эконометрические модели способны дать впечатляющие долгосрочные прогнозы и позволяют отслеживать «поворотные» точки,

в которых коренным образом изменяется динамика изучаемой системы. Псевдобалансовые модели на это в принципе не способны, все имеющиеся зависимости они рассматривают в некотором смысле как аналоги предшествующих.

Заметим, что эконометрика представляет собой универсальный аппарат, позволяющий осуществлять интеллектуальный анализ данных. Собственно к экономике логика действия данного аппарата не имеет никакого отношения, с таким же успехом он применим к анализу данных в любой другой сфере — медицине, геологии, филологии и т. д. Название «эконометрика» закрепилось за этим аппаратом в силу того факта, что он первоначально возник как ответ на потребности экономической науки и впервые применялся именно в ней. Однако к сути тех методов, которыми пользуется эконометрика, это никак не относится.

Многочисленные нарекания в адрес эконометрических (в частности, регрессионных) методов раздаются главным образом от людей, которые неверно трактуют получаемые с помощью этих методов результаты.

Например, представим себе ситуацию, когда объясняемая переменная Y выражается линейной регрессионной моделью через ряд объясняющих ее динамику регрессоров: Y = f(x|5 х^ х3) с коэффициентом детерминации R-' = 90%. Затем удается построить другое уравнение, выражающее линейную связь между той же величиной Y и набором совершенно других объясняющих параметров: Y = = g(x4, х5, х6), причем коэффициент детерминации снова оказался равен 90%. Может ли такое быть? Конечно, может. А может ли при этом оказаться так, что наборы переменных (хг х2, х,) и (х4. xs, х6) не мультиколлинеарны друг с другом, т. е. переменные, входящие в эти наборы, по отношению друг к другу линейно независимы? Увы. и такое может быть.

Объявлять на этом основании эконометрик)' лженаукой нет разумных оснований. Необходимо лишь понять, что объясняющий параметр, который в одной модели оказался значим для объяснения вариации динамического ряда, в другой модели (в компании других регрессоров) при объяснении вариации того же ряда может быть незначим. Поэтому, между прочим, не следует торопиться объявлять, что объясняемая переменная «не зависит» от параметров, которые пришлось исключить из регрессионной модели. Если при построеним какой-либо модели лучше обойтись без них, это не значит, что объясняемая переменная вовсе не имеет отношения к этим параметрам: возможно, в другом наборе объясняющих переменных они оказались бы значимыми.

Работая с регрессионными моделями, не следует также упускать из виду разницу между объясняемыми и объясняющими переменными. Здесь есть серьезное отличие от обычной алгебры, в которой можно любую переменную выразить через другие, и эта операция во многих случаях обратима (например, если уравнение линейно). Для эконометрического анализа модель X = f(Y. Z) — это совсем не то же самое, что модель Y = g(X, Z), С точки зрения эконометрики это две абсолютно разные модели (даже если эти модели линейны), они будут иметь разные эконометрические характеристики.

Это же замечание касается любых преобразований модели, даже если они формально обратимы: преобразованная модель — это другая модель, у нее другие эконометрические показатели. Например, модель Y = х,х, — это не то же самое, что модель InY = Inx, + lnxr Причина этого заключается в том, что у этих моделей аддитивные остатки имеют разный «физический» (или экономический) смысл и потому ведут себя по-разному.

Отдельная группа проблем касается распространенной ошибки толкования результатов эконометрического анализа, связанной с тем. что выявленная при помощи регрессионных моделей связь объявляется зависимостью, т. е. предпринимаются попытки приписать выявленной связи некий причинный смысл.

В связи с этим следует напомнить, что регрессионные модели лишь обнаруживают связь между переменными, но не объясняют эту связь, тем более — не указывают на ее направленность (что от чего на самом деле зависит), и уж подавно нс выявляют причинного смысла этой связи.

Причинные связи в экономике (как и в любой науке) раскрывает только теория, никакие количественные модели по своей природе не способны этого сделать.

Этот факт не раз обсуждался экономистами, которые настаивали на необходимости исследовать причинные связи в экономике, несмотря на растущую популярность функциональных количественных методов, применение которых не всегда должным образом обосновано.

В частности, Нобелевский лауреат Морис Аллэ много раз высказывал скептическое отношение к моделям такого рода, а злоупотребление ими в обстоятельствах, не вызывающих к ним серьезного доверия, называй «дикой эконометрикой» [1]. Он, как известно, всегда являлся сторонником параметрических моделей, в которых характер взаимосвязи между рассматриваемыми переменными выявляется заранее на основе анализа их фактически наблюдаемых значений.

Специалисты в области эконометрики не оспаривают тезис о необходимости развивать теорию и о ее незаменимой роли в экономических исследованиях. Однако многие из них полагают, что нет причин ожидать, будто модели, построенные на основе причинно- следственные связей, будут порождать более качественные прогнозы, чем модели временных рядов, исследуемые без какого-либо содержательного обоснования [25].

Заметим, что порой утверждения о причинном характере выявленных при помощи регрессионного анализа зависимостей «вползают» в рассуждения экономистов-математиков с черного хода. В качестве типичного примера такого рода приведем следующий ход рассуждений. Некий экономист при помощи регрессионного анализа строит линейную зависимость величины конечного потребления макросистемы от объема располагаемого дохода. На основе эконометрических характеристик модели, свидетельствующих о ее адекватности и значимости, делается следующий вывод: «Наши расчеты подтверждают вывод о том, что величина потребления является линейной функцией располагаемого дохода» [3, с. 16].

На самом деле проведенные автором расчеты не подтверждают вывод о линейном характере построенной функции, а исходят из предположения о том. что эта функция линейна. Нормальный ход рассуждений должен был бы выглядеть так. Предположим, что функция связи между объемом конечного потребления и уровнем располагаемого дохода является линейной. В таком случае параметры этой функции таковы (они определяются регрессионной моделью). При этом эконометрические характеристики показывают, что модель адекватна и значима, следовательно, линейная связь между объясняемой переменной и объясняющим ее регрессором существует. Однако это не мешает построить на основе тех же самых наблюдений другую, нелинейную модель, которая связывала бы эти две переменные, была бы адекватной и значимой и при этом имела бы более высокую объясняющую способность (коэффициент детерминации) и меньшие P-значения для коэффициентов регрессии (т. е. более высокий уровень доверия к каждому из них).

В связи с этим следует напомнить, что прикладная программа, мри помощи которой исследователь проводит регрессионный анализ, способна лишь вычислить тем или иным способом оптимальные с определенной точки зрения (например, с точки зрения критерия наименьших квадратов) параметры тренда. Однако вид этого тренда задается экзогенно, его должен угадать сам исследователь, и во многих случаях фактические наблюдения дают довольно значительный простор для произвола, если фантазия исследователя не предполагает ограничений со стороны теории, способной подсказать вид этой связи.

В некоторых других случаях, наоборот, простор для произвола отсутствует, модели, использующие очевидные, часто встречающиеся тренды, оказываются незначимыми, и единственный способ понять. как же связана объясняемая переменная с каким-либо из своих регрессоров, заключается в том, чтобы нанести точки на график и медитировать на полученное изображение, пытаясь угадать, какого вида функция могла бы связать эти два динамических ряда.

Вопрос о выборе подходящего тренда — это отдельная серьезная проблема. Но при всем разнообразии возможных путей ее решения здесь уместно применение неких эвристических соображений.

Например, логистическая кривая (рис. 2.1) описывает кумулятивные процессы с насыщением, т. е. такие, когда скорость роста объясняемой переменной прямо пропорциональна уже имеющемуся объему этой величины и в то же время пропорциональна расстоянию этой величины до своего верхнего предела, которого она превзойти не может.

Логистическая кривая

Рис. 2.1. Логистическая кривая

Рис. 2.1 показывает, что логистическая кривая разбивается на три хорошо отделяемых друг от друга этапа: латентное развитие (1), быстрый взлет (2) и затухание (3).

Логистическая кривая описывает общую динамику сложных систем: вначале происходит медленное накопление количественных изменений, затем следует скачок и система обретает новое качество, а затем в недрах этого нового качества начинают созревать количественные предпосылки следующего качественного сдвига. Таким образом, логистическую кривую можно считать наиболее общей количественной моделью взаимного перехода количественных и качественных изменений.

Хорошим примером такого перехода можно считать процесс развития технологии пли технологического сдвига. Напомним, что каждый технологический уклад, как и любой отдельный технологический процесс, развиваясь по закону логистической кривой, проходит в своей динамике три основные фазы. Вначале значительные усилия лишь очень слабо продвигают результат, достигаемый в требуемом направлении. Это фаза латентного развития, когда новая технология развивается в недрах других технологических процессов. Затем, по мере накопления критической массы развития, следует технологический рывок, когда ощутимый результат достигается без больших усилий. Это период расцвета, бума в развитии новой технологии. Впоследствии, по мере приближения к технологическому пределу, затраты (как в натуральном, так и в стоимостном выражении) значительно возрастают в пропорции к достигаемому эффекту. Это третья, последняя фаза, характеризующая старение и отмирание данной технологии.

В более сложных случаях, когда возникает потребность отследить дальнейший ход событий в рамках уже нового обретенного системой качества, применяются более сложные обобщенные логистические кривые (рис. 2.2). Они представляют собой склейку различных «единичных» логистических кривых, подобных той, что представлена на рис. 2.1.

Обобщенная логистическая кривая

Рис. 2.2. Обобщенная логистическая кривая

Кривая рисунка 2.2 характеризует, например, процесс адаптации сотрудника к новому месту работы или к выполнению новых служебных обязанностей. Существуют несколько ступеней адаптации работника к организационной структуре и к организационной культуре фирмы, в составе которой он функционирует. Полезность работника для фирмы в единицу времени утах есть функция от продолжительности t его пребывания в составе данной фирмы, и график этой функции схематично представлен на рисунке 2.2 [24].

Указанный процесс адаптации можно представить как процесс обучения сотрудника институциональным нормам (как формальным, так и неформальным), существующим в данной фирме. Адаптация сотрудника происходит скачкообразно, по мере освоения им соответствующих процедур, рутин, шаблонов поведения. Через некоторое время работник достигает максимально возможной в данных условиях эффективности производства, а после этого происходит дальнейшая, более тонкая, адаптация, позволяющая сотруднику проявлять оппорту нистическое поведение по отношению к фирме, в которой он работает (например, экономить силы, если он получает вознаграждение не за реально выполненную работу, а за красиво составленный отчет о ее выполнении). Наличие нисходящего участка кривой адаптации, тем не менее, не означает, что находящегося на ней работника пора заменять другим: полезность других, «неадаптированных» сотрудников с точки зрения фирмы почти всегда оказывается меньше, чем полезность замененного работника.

Наличие убывающего участка «кривой адаптации» у (t) иногда является следствием снижения функциональных способностей работника в силу причин, связанных с его трудоспособностью, состоянием здоровья и т. д.

Кривая рисунка 2.2 является стандартной кривой адаптации, описывающей множество различных процессов. В частности, этой закономерностью можно описать динамику активного словарного запаса индивида. По мере освоения новых учебных дисциплин в школе или в вузе словарный запас скачкообразно расширяется, а затем, когда человек завершает образование, по мере концентрации его внимания на выполняемых им профессиональных обязанностях, целые семантические блоки выпадают из его словарного запаса (нисходящая ветвь кривой). Этой же закономерностью описывается динамика интенсивности любой психической реакции человека в зависимости от времени (например, оргазм) при условии неизменного уровня интенсивности раздражителя, вызвавшего эту реакцию.

Использование логистических (в том числе обобщенных логистических) кривых в качестве кривых обучения и адаптации является стандартным и широко распространенным [23], что обуславливает широту- применения кривых данного вида в различных количественных моделях [8; 9]. Можно утверждать, что логистические кривые являются наиболее популярными при моделировании динамики величин типа фонда (stock), в том числе и в экономике.

Производная логистической кривой представляет собой колоколообразную кривую (кривую Гаусса, рис. 2.3), которой часто описывается динамика величин типа потока (flow).

Кривая Гаусса

Рис. 2.3. Кривая Гаусса

Многие вероятностные процессы описываются кривой данного вида. В качестве примера можно указать на зависимость вероятности потери работы во время кризиса от совокупных инвестиций работника в свой человеческий капитал [13]. Как показывает статистика, вероятность потерять рабогу во время кризиса и для дворника, и для академика пренебрежимо мала, она максимальна для лиц с неоконченным высшим и только что полученным высшим образованием, что соответствует средней части кривой Гаусса, содержащей точку максимума.

Данная кривая характеризует, в частности, нормальное (гауссово) распределение случайных величин, что весьма важно для моделирования многих процессов. При применении некоторых методов регрессионного анализа следует вначале убедиться в том, что оцениваемые случайные величины нормально распределены.

Почему нормальное распределение столь любимо и столь широко распространено? На это есть две причины, одна из них имеет математический смысл, другая связана с целеполаганнем в управляемых процессах.

Во-первых, распределение случайной величины, представляющей собой сумму случайных величин, ни одна из которых не имеет явного доминирования над другими, стремится к нормальному с бесконечным ростом их числа. Иначе говоря, сумма бесконечно большого количества равных по значимости случайных величин нормально распределена независимо от того, как распределены составляющие ее случайные величины.

Поэтому в ситуациях, когда исход событий зависит от множества факторов, ни один из которых не имеет достаточного перевеса над другими, разумно предположить, что этот исход имеет нормальное распределение.

Во-вторых, результат целенаправленного действия нормально распределен. Например, вы неподвижно укрепили винтовку' и стреляете по неподвижной цели. В итоге выстрелы распределятся вокруг некого центра, причем вероятность отклонения от этого центра обратно пропорциональна логарифму величины этого отклонения. Это касается любого целенаправленного действия, как в технике, так и в экономике, и в любой другой сфере.

Результат целенаправленного действия со стабильной помехой имеет логарифмически-нормальное распределение. Например, в случае стрельбы из неподвижного оружия по неподвижной цели это может быть влияние ветра, при условии, что он не слишком часто меняет направление и силу.

Во многих случаях при моделировании циклических, колебательных процессов вначале ищется тренд, «очищенный» от наблюдаемых колебаний. Такой подход требует предварительной обработки наблюдаемого временного ряда, причем разные методы этой обработки приводят, как и следовало ожидать, к разным результатам. В итоге получается тренд, относительно которого сразу возникают вопросы о его соответствии реально протекающим процессам.

Поэтому в некоторых случаях при моделировании колебательных процессов проще искать аппроксимационный тренд в виде некой монотонной фу нкции, уже промодулированной гармоническими колебаниями [15]. Таким образом возникают линейно-гармонические, показательно-гармонические, логисто-гармонические и прочие монотонно-гармонические тренды.

При этом для правильного выбора тренда имеют значение не только характер роста и скорость роста соответствующей объясняемой переменной, но и характер самих гармонических колебаний. Например, функция

имеет бесконечно много экстремумов и точек перегиба, а функция

расту щая тоже линейно и ровно с такой же скоростью, вовсе не имеет экстремумов и имеет бесконечно много точек перегиба. Правильный выбор коэффициентов, соответствующий реальным наблюдениям, возможен при условии не только адекватности и значимости модели в целом, но также значимости всех входящих в итоговое уравнение коэффициентов регрессии.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >