Меню
Главная
Авторизация/Регистрация
 
Главная arrow Менеджмент arrow Введение в количественный риск-менеджмент

ОБЩАЯ ХАРАКТЕРИСТИКА СТАТИСТИЧЕСКИХ ПРОЦЕДУР АНАЛИЗА ФАКТОРОВ РИСКА

Многомерная классификация при исследовании факторов риска

Наиболее очевидным подходом к статистическому анализу данных, собранных для исследования влияния факторов риска па размер ущерба, являются методы многомерной классификации. Действительно, близкие (в некотором смысле) наблюдения (xj,Wij,..., Wmj) можно считать принадлежащими однородной группе риска, так что формальные процедуры группировки, основанные на мерах близости или различия, могут быть весьма полезны.

Самым простым методом является комбинационная группировка, предполагающая разбиение значений факторов риска на подходящие интервалы и исследование распределений наблюдений по полученным сочетаниям интервалов. Графическая иллюстрация группировки представлена на рис. 4.1, где рассмотрены два фактора:

W И W2-

Пример результатов комбинационной группировки

Рис. 4-1- Пример результатов комбинационной группировки.

Достоинствами этого метода является простота алгоритма разбиения и отсутствие сложностей интерпретации. Последнее особенно важно, так как на практике предпочтительнее создавать классификаторы, являющиеся «пересечением» интервалов значений отдельных ковариат. Однако к недостаткам следует отнести высокую степень субъективности группировки, отражающую низкий уровень формализации процедуры, а также возможность получения пустых классов, для которых нельзя оценить меры риска.

Альтернативой является внедрение сложных статистических методов. В практике количественного риск-менеджмеита может использоваться классификация как с обучением, так и без обучения.

Первый подход применяется, в частности, тогда, когда нужно согласовать группировки прошлых периодов с новыми данными текущего года. В этом случае реализуется один из алгоритмов дискриминантного анализа. Его суть состоит в выведении правил распределения наблюдений по классам, априорно заданным на основе обучающих выборок, чтобы минимизировать функцию качества классификации. Обычно такая функция в той или иной степени базируется на отношении правдоподобия.

Однако сформировать обучающую выборку па практике возможно далеко не всегда, так что второй подход также популярен. Классификация без обучения может осуществляться следующим образом:

  • иерархическая классификация, которая реализуется путем последовательного разбиения всей совокупности многомерных наблюдений на группы, характеризующиеся максимизацией меры различий между этими группами (диви- зимные, или нисходящие, алгоритмы) либо путем последовательного объединения отдельных наблюдений в кластеры, максимизирующие меры близости (агломеративные, или восходящие, алгоритмы);
  • автоматическая классификация, которая позволяет разбить наблюдения по априорно заданному числу групп на основе меры внутригрупповой близости и межгруппового расстояния.

Основная проблема иерархической классификации заключается в том, па каком уровне иерархии остановиться, а автоматической — как выбрать число кластеров.

Получение подходящей классификации при использовании формальных статистических методов не гарантированно, так как соответствующие критерии и ограничения для этих методов задаются априорно и могут быть не согласованы с истинной структурой данных, выявляемой в ходе исследования. В такой ситуации полезно использовать разведочный анализ и проводить альтернативные расчеты, основанные на разных алгоритмах и мерах близости, с последующим сопоставлением результатов.

Важной проблемой практического использования многомерной классификации является вопрос, применять ли при статистической обработке все данные, т. е. в форме ..., Wmj), или только значения ковариат (wj,..., wmj). В первом

случае влияние статистики ущерба может быть слишком велико из-за единиц измерения, так что в один кластер могут попасть наблюдения со сходным уровнем ущерба, но довольно различными значениями факторов риска. Иными словами, велики шансы неправильной группировки. Однако при втором варианте остаточная неоднородность, связанная с разбросом значений Xj, может быть слишком велика, чтобы оценки среднего ущерба считались удовлетворительными. Поэтому универсального однозначного ответа на поставленный вопрос нет — каждая практическая ситуация требует отдельного решения.

Даже при идеальной классификации ее согласование с требованиями, предъявляемыми на практике к тарифным классам, может быть проблематично. В качестве соответствующего примера рассмотрим упрощенную ситуацию с двумя факторами риска, представленную на рис. 4.2.

Пример результатов автоматической классификации

Рис. 4-2. Пример результатов автоматической классификации.

Окружности па рисунке обозначают выделенные в результате статистической процедуры классы, а штриховые линии — границы критических областей, определяющие правила разбиения. Если различия между классами 2 и 3 хорошо увязываются с интервалами значений фактора риска гщ, то определение класса 1 требует сочетания информации об обоих факторах риска, что может быть неудобно для практического использования.

 
Посмотреть оригинал
Если Вы заметили ошибку в тексте выделите слово и нажмите Shift + Enter
 

Популярные страницы