Меню
Главная
Авторизация/Регистрация
 
Главная arrow Экономика arrow Моделирование управленческих решений в сфере экономики в условиях неопределенности

Формализация выбора системы показателей для диагностики и прогнозирования банкротства на основе байесовской методологии

В параграфе 5.3 при обзоре методов и подходов моделей банкротств мы уже отмечали, что в настоящее время отсутствует формализованная и общепринятая процедура выбора и формализации системы показателей для моделей оценки риска банкротства.

Ниже описан предложенный авторами монографии формализованный метод выбора и сравнения между собой исторически сложившихся систем, основанный на байесовской методологии.

Информационной базой исследования послужили данные бухгалтерской отчетности (формы 1 и 2) 136 крупных российских предприятий строительной отрасли [22, с. 50—62].

Изложим сущность предлагаемого подхода.

1. На основе данных бухгалтерской отчетности формируется несколько альтернативных систем показателей, которые в рамках развиваемого авторами байесовского подхода можно назвать метагипотезами, которые отличаются между собой набором факторов:

где ХНк количество факторов (независимых переменных) X. в системе показателей Hk; G — количество альтернативных систем показателей. Например, по мнению А.О. Недосекина [57, с. 2—16], для диагностики банкротств нужно использовать 16 показателей, подробно перечисленных в главе 6 нашей монографии. Бухгалтерская отчетность рассматривается как метагипотеза более высокого, чем (5.21), уровня.

Некоторые исследователи утверждают, что невозможно построить универсальную модель диагностики банкротств, которая одинаково хорошо работала бы для предприятий любой отрасли. В данной работе делается попытка построения модели диагностики банкротств для строительных предприятий. При этом заранее неизвестно, какая из систем показателей наилучшим образом подходит для достижения этой цели.

2. Отдельного изучения требует вопрос о влиянии на качество обучения нейросетей так называемых аномальных или противоречивых наблюдений, содержащихся в данных. Пока ограничимся достаточно общим определением: противоречивыми (аномальными) можно считать наблюдения, явно выделяющиеся на фоне всей выборки (например, если значение переменной в десятки раз отличается от среднего). В рамках классического регрессионного анализа удаление аномальных наблюдений считается полезной и необходимой процедурой. Удаление аномальных наблюдений делает данные более однородными. Для задач аппроксимации это, несомненно, хорошо. Но при построении нейро- сетевой модели диагностики банкротств существует своя специфика: в процессе обучения нейросеть «учится» распознавать образ банкрота или небанкрота по некоторому набору значений входных переменных. Если перед обучением будут удалены все аномальные точки, то данные могут стать слишком однородными, «неконтрастными», и нейросети будет сложнее идентифицировать банкротов и небанкротов. До проведения пробных вычислений вопрос о влиянии аномальных наблюдений на качество модели остается открытым.

Какие данные можно считать аномальными? Для решаемой нами задачи необходимо подобрать подходящий критерий. Применение известного критерий Граббса 150, с. 14— 181 в данном исследовании осложнено, поскольку данный критерий требует нормального закона распределения наблюдений случайной величины Y.

В случае нарушения предположения о нормальности распределения можно при анализе данных на аномальность опираться на «истинный» закон распределения F(x,Q). Однако на практике вектор параметров 0 чаще всего приходится оценивать по той же самой выборке, которую мы анализируем. Содержащиеся в выборке выбросы отражаются на оценках вектора параметров 0 закона распределения /7(х,0). Полученный закон распределения существенно отличается от «истинного». В связи с этим параметрические методы отбраковки резко выделяющихся наблюдений становятся неустойчивыми. Здесь нужны робастные методы отбраковки.

В задачах с непрерывным значением моделируемой величины Y, как, например, для отношения затрат к выручке в задаче налогового контроля из параграфа 3.9 и главы 6, разработан оригинальный алгоритм 1.8

из рис. 3.5. Здесь для выявления противоречивых наблюдений используется аналог константы Липшица:

где ха, Зср — близкие по выбранной числовой мере вектор-строки; уа,

Ур — соответствующие им значения выходной величины.

Однако в рассматриваемой задаче бинарного отклика исходная переменная Y принимает дискретные значения 0 или 1, поэтому величина La р становится неинформативной.

Для выявления аномальных наблюдений предлагается следующее правило: вектор-строка j,yj > признается аномальной, если хотя бы один компонент вектора х, нарушает правило

где X: среднее по выборке значение фактора х:, о.. — выборочное

J J

среднеквадратическое отклонение фактора х; / — экспертно задаваемое значение (/=1,..., 4).

Аномальные наблюдения удаляются из базы данных и не участвуют в обучении нейросети, но включаются в тестовое множество и используются для оценки качества обучения.

3. Для выбора оптимальной системы показателей строится вспомогательная нейросеть, которая обучается на разных наборах данных, соответствующих гипотезам {Нк}, принадлежащих к одной метагипотезе верхнего уровня — данным бухгалтерской отчетности. При этом используется один и тот же алгоритм обучения, одинаковое количество эпох обучения, фиксируется количество точек в обучающем и тестовом множестве.

Оценка качества полученных нейросетевых моделей проводится по результатам тестирования на данных, не участвовавших в обучении. При этом недостаточно просто вычислить долю правильно идентифицированных предприятий, необходимо учитывать количество, а главное — характер допущенных моделью ошибок. В задачах классификации возможны два вида ошибок. Если предприятие-банкрот было классифицировано как надежное, то это ошибка II рода («пропуск цели», по терминологии радиолокации); если, наоборот, надежное предприятие было определено как банкрот, то это ошибка I рода («ложная тревога»). Очевидно, что при диагностике банкротств цена ошибок I и II рода различна. В большинстве случаев гораздо опаснее ошибки II рода (например, лучше отказать в займе надежному заемщику, чем выдать кредит потенциальному банкроту). Для окончательной оценки качества нейросетевых моделей предлагается использовать следующий критерий оптимизации процедуры отбора:

где N*H — количество верно идентифицированных предприятий для метагипотезы Нк, N^ — количество ошибок I рода; Nffi — количество ошибок II рода; г{, г2, /*3 — удельный вес каждого показателя. Веса /*,, rv г3 назначаются согласно правилу Фишберна 156, с. 641:

где п — количество ранжируемых параметров.

Формулу (5.24) можно использовать в случае, если некоторое множество критериев упорядочено в порядке убывания их значимости. В нашем случае будем считать, что при оценке качества диагностики наиболее важным является общее количество верно идентифицированных предприятий, а затем следует учитывать количество ошибок I и II рода. Таким образом, п = 3. Окончательный выбор системы показателей осуществляется по правилу

То есть наилучшей признается система показателей, для которой величина (5.23) будет наибольшей.

4. Одним из элементов байесовской методологии, изложенной в параграфе 3.6, является то, что для построения модели диагностики банкротств следует использовать не одну нейросеть, а ансамбль гипотез-нейросетей, принадлежащих к одному классу (например, многослойный персептрон). Нейросети, входящие в ансамбль, могут отличаться количеством скрытых слоев, количеством нейронов в скрытых слоях и видом активационных функций. Для обучения сетей байесовского ансамбля используется система показателей Нк опт. Очевидно, что качество нейро- сетевых моделей ансамбля будет различным, поэтому после обучения проводится процедура фильтрации, в результате которой будут отсеяны наименее удачные гипотезы-нейросети. В качестве критерия фильтрации логично использовать критерий (5.23). Фильтрация нейросетевых моделей байесовского ансамбля проводится по правилу

где г) — экспертно задаваемое значение.

Те нейросети, для которых правило (5.26) не выполняется, удаляются из байесовского ансамбля.

Окончательная классификация проводится путем осреднения (прямого или взвешенного) нейросетевого отклика Yq на отфильтрованном байесовском ансамбле:

где Q* — количество нейросетей-гипотез, прошедших процедуру фильтрации.

Роль весов в (5.27) могут выполнять величины {К /Ктлу), где ^max =t | (<> = 0; = 0), т.е. все точки тестового множества идентифицируются верно.

После этого рассчитываются оценки вероятности банкротства для всех предприятий тестового множества по (5.20). В качестве показателя

экспоненты в (5.20) используются значения Y по (5.27).

 
Посмотреть оригинал
Если Вы заметили ошибку в тексте выделите слово и нажмите Shift + Enter
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >
 
Популярные страницы