Модели принятия решений в условиях риска

Общая постановка однокритериальной статической стохастической задачи принятия решений и некоторые принципы оптимальности, применяемые в стохастических задачах принятия решений

Ниже проанализированы получившие в настоящее время распространение подходы к принятию решений в условиях риска, иначе — в стохастических задачах принятия решений. Эти подходы рассматриваются применительно к простым ситуациям принятия решений, а именно таким, которые могут быть представлены в виде однокритериальных статических задач принятия решений.

Случай принятия решений в условиях риска классифицировался нами в § 2 настоящей главы как принятие решений в условиях, когда каждая стратегия оперирующей стороны связана с множеством возможных исходов, причем каждый исход имеет определенную вероятность появления, известную исследователю операции. В подобных

Таблица 5.1

Возможная стратегия изучаемой операции

ситуациях все рекомендации исследователя операции по выбору оптимальной стратегии действий неизбежно основаны на осредненных (статистических) характеристиках стохастических факторов. Поэтому, выбирая оптимальную стратегию, руководитель рискует в конкретной реализации операции получить не тот результат, на который он ориентируется исходя из статистических данных.

Подходы к принятию решений в условиях риска удобно рассматривать на примере некоторой операции, в которой количество возможных стратегий оперирующей стороны и количество возможных исходов операции конечны. Изучаемая операция может быть представлена в виде табл. 5.1.

В ней в верхней строке представлен набор возможных исходов операции Sb ..., S,, ..., Sn в крайней левой графе — набор возможных стратегий X,,..., Хк,..., Хг Стратегия Хк, к е 1, t представляет собой одно из значений вектора управления X =15..., хп), принадлежащее области его допустимых значений. Остальные клетки таблицы (кроме крайней правой графы) заполнены значениями величин Qk, и Нк1, к е 1,/;/ € 1, г, где Qkl значение некоторого показателя эффективности операции в случае появления /-го исхода при реализации оперирующей стороной А:-й стратегии, Нк, — вероятность появления /-го исхода при реализации к-й стратегии. В стохастической задаче принятия решений эти вероятности предполагаются известными. Примером рассматриваемой ситуации может служить любая военная операция, исход которой всегда зависит от случайных факторов, таких как рассеивание снарядов, ошибки определения координат цели и т. д.

Для оптимизации решения в подобных ситуациях прибегают к приему сведения стохастической задачи к детерминированной. Этот прием может быть основан на различных принципах. Широкое распространение получили следующие два принципа:

  • 1) искусственное сведение к детерминированной схеме;
  • 2) оптимизация в среднем.

Первый принцип основан на том, что неопределенная, вероятностная картина явления приближенно заменяется детерминированной. Для этого все участвующие в задаче случайные факторы приближенно заменяются какими-то неслучайными характеристиками этих факторов (как правило, их математическими ожиданиями). В результате стохастическая задача принятия решений заменяется детерминированной.

Рассматриваемый принцип применяется преимущественно в грубых, ориентировочных расчетах, а также в тех случаях, когда диапазон возможных значений случайных величин сравнительно мал, т. е. они без большой натяжки могут рассматриваться как неслучайные величины. Кроме того, указанный принцип при применении и приводит к тому же результату, что и «оптимизация в среднем», в тех случаях, когда показатель эффективности исхода операции линейно зависит от случайных параметров. Этот принцип применяется, например, при решении задач принятия плановых решений с использованием методов сетевого планирования и управления.

Второй принцип (оптимизация в среднем) более сложен. Он применяется в тех случаях, когда разброс случайных факторов велик и замена каждого из них его математическим ожиданием может привести к большим ошибкам.

Рассмотрим этот принцип более подробно, хотя суть его, очевидно, ясна уже из названия. Как показано в табл. 5.1, показатель эффективности в стохастической операции является случайной величиной, зависящей от факторов, влияющих на исход операции, т. е.

где А' — вектор управления; А — массив детерминированных факторов; уи у2,..., уя конкретные реализации случайных фиксированных факторов У,, Y2,..., Yq.

В табл. 5.1 представлены возможные значения Qkl некоторого показателя эффективности и вероятности Нк, их появления в операции, в которой возможны t различных стратегий и г различных исходов.

Прием оптимизации в среднем состоит в переходе от исходного случайного показателя эффективности Q к его некоторой осреднен- ной, статистической характеристике, например к математическому ожиданию M[Q:

где В — некоторый массив известных статистических характеристик случайных величин уи уъ ..., yq;f (Vi у2, ..., yq) — закон распределения вероятностей случайных величин Yb У2,..., Yq.

При оптимизации в среднем по критерию (5.34) в качестве оптимальной стратегии X будет выбрана стратегия, которая, удовлетворяя ограничениям на область ^допустимых значений вектораX, максимизирует величину математического ожидания F = М [Q] исходного показателя эффективности Q. Оптимальная стратегия должна удовлетворять такому условию:

Данный выбор физически означает, что в качестве оптимальной стратегии принимается такая, которая при многократном повторении операции в одинаковых условиях приводит к наилучшему в среднем результату. Всякая другая стратегия даст более плохой в среднем результат. Выбор той или иной статистической характеристики исходного показателя эффективности Q в качестве критерия оптимальности F при оптимизации в среднем представляет собой концептуальную проблему, решаемую на уровне лица, руководящего операцией.

Обратимся к рассмотрению процедуры выбора оптимальной в среднем стратегии в операции, имеющей дискретный характер, т. е. конечное количество возможных стратегий и возможных исходов. Подобная операция была представлена в табл. 5.1.

В рассматриваемой операции для каждой k-Vi стратегии Хк может быть определено математическое ожидание показателя эффективности по формуле:

Пользуясь формулой (5.37), заполним крайнюю правую графу табл. 5.1. В качестве оптимальной стратегии X при оптимизации в среднем будет выбрана такая стратегия из t возможных стратегий Хи Х2, ..., Х„ которая удовлетворяет условию:

т. е. та, для которой значение в столбце Fk максимально.

Выражения (5.37) и (5.38) по смыслу равнозначны выражениям (5.35) и (5.36); они представляют собой дискретный аналог этих выражений.

Принцип оптимизации в среднем не ликвидирует влияния на исход операции фактора случайности. Эффективность каждой отдельной операции, осуществляемой при случайных, заранее неизвестных реализациях величин У,, У2, ..., Y4, может сильно отличаться от ожидаемой средней как в лучшую, так и, к сожалению, в худшую сторону. При многократном повторении операции эти различия в среднем сглаживаются.

Принцип оптимизации в среднем часто применяют в случаях, когда операция осуществляется всего несколько и даже один раз. При этом надо считаться с возможностью риска, т. е. неприятных неожиданностей в каждом отдельном случае. Утешением здесь может служить мысль о том, что оптимизация в среднем все же лучше, чем выбор решения без всяких обоснований. Чтобы составить себе представление о том, чем мы рискуем в каждом отдельном случае, желательно кроме математического ожидания показателя эффективности оценивать и его дисперсию.

Как видно из выражения (5.35), для критерия оптимальности принцип оптимизации в среднем сводит задачу принятия решения в условиях риска к детерминированной постановке. Действительно, ос- редненный критерий оптимальности (5.35) зависит только от стратегий оперирующей стороны и неконтролируемых фиксированных неслучайных факторов, представленных массивами А и В. К аналогичному результату приводит и первый принцип — искусственное сведение к детерминированной схеме. Следовательно, все методы, которые применимы для решения задачи принятия решения в детерминированном случае, т. е. методы МП, могут быть с успехом использованы для решения задач принятия решений в условиях риска, если задачи с помощью какого-то приема сведены к детерминированной постановке.

Схема принципа искусственного сведения к детерминированной схеме

Рис. 5.7. Схема принципа искусственного сведения к детерминированной схеме

Схема принципа оптимизации в среднем

Рис. 5.8. Схема принципа оптимизации в среднем

Сравнение двух описанных принципов оптимизации в стохастических задачах принятия решений показывает, что они представляют собой детерминизацию исходной задачи на разных уровнях влияния стохастических факторов. Принцип «искусственное сведение к детерминированной схеме» представляет собой детерминизацию на уровне факторов, а принцип «оптимизация в среднем» (рис. 5.7) — на уровне показателя эффективности. Иллюстрацией этому служат рис. 5.8 и 5.9.

Из сказанного следует, что процессу решения стохастической задачи принятия решений сопутствуют по крайней мере две проблемы

Структурная схема процесса принятия решения при аналитической форме представления критерия оптимальности

Рис. 5.9. Структурная схема процесса принятия решения при аналитической форме представления критерия оптимальности

различного характера: 1) концептуальная проблема, связанная с выбором принципа сведения стохастической задачи к детерминированной схеме и выбором в ней критерия оптимальности; 2) формальноматематическая проблема, связанная с выбором метода решения и разработкой вычислительной схемы решения соответствующей детерминированной задачи принятия решений.

При использовании принципа оптимизации в среднем могут встретиться три различных случая, описанных ниже в порядке их усложнения: 1) критерий оптимальности F = MQ] или Fk = MMQkl] получен в аналитической форме (если интеграл (5.35) или выражение (5.37) берется в аналитическом виде); 2) критерий оптимальности F — M[Q или Fk — M[Qkl] получен в алгоритмической форме, т. е. получен алгоритм, позволяющий для конкретных значений неслучайных аргументов X, А, В, где В — массив статистических характеристик случайных факторов, получить численное значение критерия оптимальности Fили Fk, 3) получение критерия оптимальности F— M[Q или Fk — M[Qk, невозможно ни в аналитической, ни в алгоритмической форме. Однако возможно создание модели операций, позволяющей для различных стратегий X оперирующей стороны и различных конкретных реализацийУ,у2, Уq

случайных факторов Yb Уъ ..., Yq получать соответствующие численные значения показателя эффективности.

Первый случай является наиболее простым. Представление критерия оптимальности F в аналитической форме дает принципиальную возможность анализа характерных особенностей этого критерия и отнесения задачи оптимизации, если анализ позволит, к одному из специальных классов задач МП с присущими ему методами. В противном случае задачу следует решать с применением прямых методов поиска экстремума. Структурная схема процесса принятия решения в данном случае представлена на рис. 5.9.

Во втором случае, поскольку характер зависимости критерия оптимальности F от его аргументов заранее неизвестен в силу его ал го-

Структурная схема процесса принятия решения при алгоритмической форме представления критерия оптимальности

Рис. 5.10. Структурная схема процесса принятия решения при алгоритмической форме представления критерия оптимальности

Структурная схема процесса принятия решения при невозможности получения критерия ни в аналитической, ни в алгоритмической форме

Рис. 5.11. Структурная схема процесса принятия решения при невозможности получения критерия ни в аналитической, ни в алгоритмической форме

ритмического задания, возможно применение только прямых методов поиска экстремума (рис. 5.10).

В последнем случае для решения задачи с использованием принципа оптимизации в среднем приходится прибегать к методу статистических испытаний (методу Монте-Карло) для получения необходимых статистических характеристик, в частности математического ожидания F = MQ показателя эффективности Q (рис. 5.11). Очевидно, что при использовании первого принципа решения стохастической задачи принятия решений — искусственное сведение к детерминированной схеме — возникают в основном первые два из рассмотренных выше случаев (см. рис. 5.9 и 5.10).

Во многих современных зарубежных публикациях по прогнозированию и принятию решений серьезное внимание уделяется вопросам оптимального использования средств вооружения. При решении таких вопросов неизбежно возникают задачи целераспределения различного конкретного содержания. Ниже приведен простейший пример подобной задачи.

Постановка и формализация задачи. Рассматривается задача распределения однородных средств нападения в количестве NH по совокупности я точечных (малоразмерных) объектов поражения, различающихся своими коэффициентами относительной важности v„ / е 1 ,я. Величины v, образуют я-мерный вектор V= (vl5 v2, ..., v„), определяющий шкалу важности объектов.

Искомое распределение средств нападения по объектам поражения может быть представлено я-мерным вектором X = (х,, хъ ..., хп), где Xj — количество средств, выделенных для нападения на /-й объект. Компоненты вектора Xподчинены следующим ограничениям:

Для защиты от нападения обороняющаяся сторона располагает однородными средствами противодействия в количестве Nnp. Средства противодействия стационарно распределены по объектам.

Распределение средств противодействия по объектам может быть представлено я-мерным вектором:

где у, — количество средств противодействия, выделенное для защиты /-го объекта.

Каждое средство противодействия, входящее в группу yh может поразить любое средство нападения, атакующее /-й объект, с вероятностью pt, / е 1, я. Вероятности /?, образуют я-мерный вектор вероятностей перехвата Р = {рх,...п).

Каждое средство нападения, прорвавшееся к /-му объекту, может поразить его с вероятностью wp i е 1 ,я. Величины w, образуют я-мерный вектор W~ (wl5..., w„) условных вероятностей поражения.

Предполагается, что векторы V, Y, Р, W полностью известны нападающей стороне.

Исход рассматриваемой операции случаен. Каждая конкретная стратегия X нападающей стороны приводит к множеству возможных исходов, заключающихся в уничтожении той или иной части объектов поражения. При этом вероятность уничтожения /-го объекта, обстреливаемого нарядом средств нападения в количестве х, и защищаемого нарядом средств противодействия в количестве уь приближенно определяется следующим выражением:

Лицо, ответственное за распределение средств нападения, преследует определенную цель: причинить противнику максимально возможный ущерб. Соответствующим этой цели показателем эффективности может служить количество уничтоженных объектов с учетом их коэффициентов относительной важности. Величина этого показателя эффективности является случайной. Придерживаясь принципа оптимизации в среднем, руководитель операции в качестве критерия оптимальности F принимает средневзвешенное по коэффициентам относительной важности математическое ожидание количества уничтоженных объектов.

Можно показать, что критерий оптимальности F определяется по формуле:

Математической записью цели операции является выражение:

Средством достижения этой цели является определенное распределение средств нападения, т. е. выбор соответствующего X.

Следовательно, перед лицом, ответственным за распределение средств нападения, стоит задача определения оптимального вектора распределения X, максимизирующего величину ущерба F. Оптимальный вектор распределения X находится из условия:

где Qx — область допустимых значений вектора X, определяемая условиями (5.38).

Математическая постановка задачи. Дана критериальная функция:

где аргументы X, У, V, W, Р являются «-мерными векторами, причем векторы Y, V, W, Р заданы.

Требуется найти значения X вектора X и F функции F, удовлетворяющие условию:

где область определяется условиями:

Выбор метода решения. Как следует из приведенной математической постановки задачи, в результате использования приема оптимизации в среднем рассматриваемая задача принятия решения в условиях риска сведена к детерминированной задаче принятия решения. Последняя относится к классу задач целочисленного нелинейного невыпуклого программирования в силу того, что на компоненты вектора X накладывается требование целочисленности, а функция F (X) является невыпуклой, так как она равна сумме ^-образных функций f (х,). Для решения задачи может быть использован метод динамического программирования Веллмана, поскольку функция F (X) принадлежит к классу сепарабельных аддитивных функций, а функциональное ограничение области ?2* допустимых значений вектора стратегий X является линейным.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >