Критерии оптимальности принятия решений в условиях неопределенности и риска

В некоторых ситуациях лицу, принимающему решение, противостоит не разумный противник, а природа, которая действует случайно.

I. Принятие решений в условиях полной неопределенности.

Пусть рассматривается игра с природой с четырьмя стратегиями игрока А и тремя состояниями природы Я. Матрица выигрышей задана табл. 1.1:

Таблица 1.1

Матрица выигрышей

Матрица выигрышей

Расчетные показатели

П

П2

Я3

Mi

а,

со,

Ъ

А

20

30

15

21,7

15

30

21

Аг

75

20

35

43,3

20

75

40

Аъ

25

80

25

43,3

25*

80

47*

АЛ

85

5

45

45*

5

85*

37

Если данных о вероятностях состояний среды (природы) не имеется, то лицо, принимающее решения, находится в условиях неопределенности.

Основной метод, позволяющий найти оптимальное решение в условиях неопределенности, состоит в формулировке некоторой гипотезы о поведении среды, позволяющей дать каждому альтернативному решению числовую оценку.

Рассмотрим некоторые критерии, используемые при выборе оптимальной стратегии игрока А в условиях неопределенности.

1. Критерий БайесаЛапласа.

В качестве оптимальной выбирается та стратегия, которая дает максимум математического ожидания выигрыша, т. е.

где/?/ — вероятность реализации состояния Пг

Поскольку в нашем примере вероятности неизвестны, то предполагается равновероятность состояний природы (критерий Лапласа).

В столбце Mj табл. 1.1 указаны средние арифметические

Из величин Mi максимальное значение равно 45 (отмечено «*»), следовательно, оптимальной является стратегия А4.

2. Максиминный критерий Вальда (критерий пессимиста).

В качестве оптимальной выбирается та стратегия, при которой

минимальный выигрыш максимален, т. е.

Критерий является пессимистическим, поскольку считается, что природа будет действовать наихудшим образом для человека.

В столбце а, табл. 1.1 указаны ау = min atj. Из величин а, мак-

симальная величина есть 25, следовательно, оптимальной является стратегия А3.

3. Критерий максимума (критерий оптимиста).

В качестве оптимальной выбирается та стратегия, при которой максимальный выигрыш максимален, т. е.

Критерий является оптимистическим, считается, что природа будет наиболее благоприятна для человека.

В столбце со, таблицы указаны со, - max я, . Из величин со, макси-

мальная равна 85, следовательно, оптимальной является стратегия А4.

4. Критерий Гурвица.

В качестве оптимальной выбирается та стратегия, при которой максимальна линейная комбинация минимального и максимального выигрышей, т. е.

где X — показатель пессимизма.

Если X =1, критерий Гурвица превращается в пессимистический критерий Вальда, а при X = 0 — в критерий крайнего оптимизма. Обычно показатель X принимается в пределах от 0,5 до 0,7. Пусть X = 0,6.

В столбце у, табл. 1.1 указаны у, = 0,6«,•+ 0,4со,. Из величин у, максимальная равна 47, следовательно, оптимальной является стратегия А з.

5. Критерий Сэвиджа (критерий сожалеющего пессимиста).

В качестве оптимальной выбирается та стратегия, при которой минимален максимальный риск, т. е.

называют разность между выигрышем, который можно получить, если знать действительное состояние природы, и выигрышем, который будет получен при отсутствии этой информации, т. е

Риском называют разность между выигрышем, который можно получить, если знать действительное состояние природы, и выигрышем, который будет получен при отсутствии этой информации, т. е.

В столбце 5, построенной матрицы риска (табл. 1.2) указаны

  • 8. - max г...
  • 1 j U

Таблица 1.2

Матрица риска

Я,

П2

Пз

5,

Ах

65

50

30

65

а2

10

60

10

60*

Аз

60

0

20

60*

Л4

0

75

0

75

Из величин 8/ минимальная равна 60, следовательно, оптимальной является любая из стратегий А2, А3.

Каждый из рассмотренных критериев не может быть признан вполне удовлетворительным для окончательного выбора решений, однако их совместный анализ позволяет более наглядно представить последствия принятия тех или иных управленческих решений.

Пример 1.10. Фирма производит детские платья и костюмы, реализация которых зависит от состояния погоды. Затраты фирмы в течение августа — сентября на единицу продукции составили: платья — 7 ден. ед., костюмы — 28 ден. ед. Цена реализации составляет 15 и 50 ден. ед. соответственно.

По данным наблюдений за несколько предыдущих лет фирма может реализовать в условиях теплой погоды 1950 платьев и 610 костюмов, а при прохладной погоде — 630 платьев и 1050 костюмов.

В связи с возможными изменениями погоды определить стратегию фирмы в выпуске продукции, обеспечивающую ей максимальный доход от реализации продукции. Задачу решить с использованием критериев природы, приняв X = 0,5.

Фирма располагает двумя стратегиями:

  • •А] — в этом году будет теплая погода;
  • А2 — погода будет прохладная.

Возможные состояния природы:

  • •В | — будет теплая погода;
  • •В 2 — будет прохладная погода.

При выборе стратегии А и состоянии погоды В доход фирмы составит:

При выборе стратегии А и состоянии погоды В2 доход фирмы составит:

При выборе стратегии А2 и состоянии погоды В доход фирмы составит:

При выборе стратегии А2 и состоянии погоды В2 доход фирмы составит:

Рассматривая фирму и погоду в качестве двух игроков, запишем платежную матрицу со столбцами Mh а„ со,, у,.

5.

В2

Mi

а,

со,

У«

Ах

29020

9220

19120*

9220*

29020*

19120*

а2

6140

28140

17140

6140

28140

17140

Рассмотрим использование различных критериев природы. Критерий Лапласа: max М, = 19120, т. е. фирме целесообразно использовать стратегию А.

Критерий Вальда: тах(а() = 9220, т. е. фирме целесообразно

I

использовать стратегию А.

Критерий максимума: тах(сог) = 29020, т. е. фирме целесооб-

I

разно использовать стратегию А .

Критерий Гурвица: шах(у/) = 19120, т. е. фирме целесообраз-

/

но использовать стратегию А.

Критерий Сэвиджа. Запишем матрицу риска Гу со столбцом 5,:

В]

в2

5,

А1

0

18920

18920*

а2

22880

0

22880

min 5, = 18920, т. е. фирме целесообразно использовать стратегию A i. Оптимальной по всем критериям является стратегия А.

Таким образом, фирме целесообразно производить 1950 платьев и 610 костюмов, тогда при любой погоде она получит доход не менее 9220 ден. ед.

II. Принятие решений в условиях риска.

Математическая модель задачи принятия решений в условиях риска предполагает задание дополнительной информации о поведении «природы» в виде вероятностей ее различных состояний.

Когда состояниям природы поставлены в соответствие вероятности, заданные экспертно либо вычисленные, решение обычно принимается на основе критерия:

  • максимума ожидаемого среднего выигрыша;
  • минимума ожидаемого среднего риска.

Если для некоторой игры с природой, задаваемой платежной матрицей (ау)тхп, стратегиям природы П соответствует вектор вероятности р = (р, р2,..., р„) состояний среды, то лучшей стратегией игрока А будет та, которая обеспечит ему максимальный средний выигрыш, т. е.

Применительно к матрице рисков лучшей будет та стратегия игрока, которая обеспечивает ему минимальный средний риск, т. е.

Эти критерии эквивалентны в том смысле, что оптимальные значения для них обеспечивает одна и та же стратегия игрока А.

Пример 1.11. Пусть платежная матрица и вероятности состояния среды представлены таблицей

II

О

4^

II

О

to

II

О

to

р = 0,2

Mi

Ах

5

2

8

4

4,8

а2

2

3

4

12

4,6

Аз

8

5

3

10

6,8*

а4

1

4

2

8

3,2

В столбце Mi таблицы указаны

Поскольку тахМ/ = 6,8, то Аз — лучшая стратегия игрока А. Матрица риска, соответствующая искомой платежной матрице:

II

О

II

О

to

II

О

to

р = 0,2

Я,

А

3

3

0

8

3,4

а2

6

2

4

0

3,6

Аз

0

0

5

2

1,4*

а4

7

1

6

4

5

В столбце Rj таблицы указаны

Поскольку mini?, = 1,4, то А3 — лучшая стратегия игрока А.

Оптимальность по Парето. В рассмотренном примере была получена оптимизационная двухкритериальная задача по выбору наилучшего решения, так как каждое решение имеет две характеристики — средний ожидаемый доход М и средний ожидаемый риск R.

Существует несколько способов постановки таких оптимизационных задач. Рассмотрим один из них в общем виде.

Пусть А — некоторо е множество операций (решений). Каждая операция «а» имеет две числовые характеристики М(а) и R(a) (например, доход и риск), и разные операции обязательно различаются хотя бы одной характеристикой. При выборе наилучшей операции желательно, чтобы М было больше, a R меньше.

Будем говорить, что операция а доминирует операцию Ъ и обозначать а У Ь, где >- знак предпочтения, если М(а) > М(Ь) и R(a) < R(b) и хотя бы одно из этих неравенств строгое. При этом операция а называется доминирующей, а операция bдоминируемой.

Доминируемая операция не может быть наилучшей, следовательно, наилучшую операцию надо искать среди недоминируемых операций.

Множество недоминируемых операций называют множеством Парето, или множеством оптимальности по Парето.

На множестве Парето каждая из характеристик М, R — однозначная функция другой, т. е. по характеристике М можно определить характеристику R и наоборот.

Найдем множество Парето-оптимальных операций для рассматриваемого примера. Каждую операцию (Mh Rj отметим как точку на плоскости (М, R), получим четыре точки (рис. 1.1).

Чем выше точка (М„ Rj), тем более доходная операция, чем точка правее, тем более она рискованная. Значит, нужно выбирать точку выше и левее.

В рассматриваемом примере множество Парето состоит только из одной третьей операции.

Для нахождения лучшей операции иногда применяют подходящую взвешивающую формулу (обобщенный критерий), которая для операции i с характеристиками (М„ Rt) дает одно число, например, q(i) = Mj - 2Rj, по которому и определяют лучшую операцию.

Нахождение множества Парето-оптимальных решений

Рис. 1.1. Нахождение множества Парето-оптимальных решений

Тогда для операций рассматриваемого примера q(X) = 4,8 - 2 • 3,4 = = -2; q(2) - -2,6; q(3) =4; q(4) = -6,8. Видно, что третья операция — лучшая.

Взвешивающая формула выражает отношение ЛПР к доходу и риску. Если ЛПР применяет данную формулу, то оно согласно на увеличение риска операции на единицу, если доход операции при этом увеличится не менее чем на две единицы, поскольку q{M + 2, R+l) = q(M,R).

Пример 1.12. Фирма может выпускать продукцию одного из следующих шести видов: А, В, С, D, Е, F, спрос на которые зависит от погоды. Глава фирмы должен принять решение, какой из этих видов продукции выпускать в течение предстоящего летнего сезона.

Прибыль фирмы зависит от того, каким будет лето — дождливым (Д), жарким (Ж) или умеренным (У) и определяется таблицей:

Д

Ж

У

А

80

60

40

д

Ж

У

В

70

40

80

с

70

50

60

D

50

50

70

Е

75

50

50

F

35

75

60

Выбор какого варианта является оптимальным?

Рассмотрим сначала решение задачи в условиях неопределенности.

Для определения стратегии фирмы используем критерии природы, приняв X = 0,5. Составляем платежную матрицу со столбцами

Mh а„ СО/, у,-.

д

Ж

У

Mf

а,

се»,-

Ъ

А

80

60

40

60

40

80*

60

В

70

40

80

63,33*

40

80*

60

С

70

50

60

60

50*

70

60

D

50

50

70

56,67

50*

70

60

Е

75

50

50

58,33

50*

75

62,5*

F

35

75

60

56,67

35

75

55

Критерий Лапласа: max М, = 63,33 => стратегия В. Критерий Вальда: max а, = 50 => стратегии С или D, или F. Критерий максимума: шах со, = 80 => стратегии А или В. Критерий Гурвица: шах у, = 62,5 => стратегия Е.

Критерий Сэвиджа. Запишем матрицу риска.

Д

Ж

У

8,

А

0

15

40

40

В

10

35

0

35

С

10

25

20

20*

D

30

25

10

30

Е

5

25

30

30

F

45

0

20

45

min 5, = 20 => стратегия С.

Рассмотренные критерии не позволяют сделать однозначный выбор оптимальной стратегии.

Рассмотрим решение задачи в условиях риска.

Пусть лицо, принимающее решение, имеет информацию о состоянии среды в виде вероятностей наступления дождливого, жаркого и умеренного лета, равных соответственно р = 0,2, р2 = 0,5, /7з = 0,3.

Для каждой стратегии игрока А и различных состояний среды найдем математическое ожидание М, и среднее квадратическое отклонение О/ выигрыша, рассматриваемое в качестве показателя риска, т. е.

Результаты представим в виде таблицы.

М

с

А

58

14,0

В

58

18,3

С

57

7,8

D

56

9,2

Е

55

10,0

F

62,5

15,2

Фактически здесь рассматривается задача двухкритериальной оптимизации, где в качестве решения (операции) выступают М и о. Операция является рискованной, поскольку она может иметь несколько исходов, не равноценных для ЛПР. При выборе наилучшей операции желательно, чтобы М было больше, а о меньше.

Найдем множество Парето-оптимальных альтернатив для данной задачи. Каждую операцию (М„ а() отметим как точку на плоскости (М, о), получим шесть точек (рис. 1.2).

Из рисунка очевидно, что Парето-оптимальное множество состоит из трех элементов: {А, С, F).

Парето-оптимальные операции нужно сравнить и произвести их ранжирование. В качестве обобщенного критерия сравнения операций используем формулу

где к > 0 — мера несклонности к риску.

В данной задаче

Ранжирование Парето-оптимального множества

Рис. 1.2. Ранжирование Парето-оптимального множества

Для ранжирования Парето-оптимального множества {А, С, F} по обобщенному критерию q для каждой пары операций а, b из условия q(a) = q(b) найдем граничное значения X, отделяющее предпочтение этой пары:

Из полученных граничных значений X найдем минимальное и максимальное значения: min(0,16; 3,8; 0,74) = 0,16, шах(0,16; 3,8; 0,74) = 3,8.

В результате интервал (0; оо) изменения параметра к разбивается на три интервала: (0; 0,16), (0,16; 3,8), (3,8; со).

Если для ЛПР его мера несклонности к риску 0 < X < 0,16, то для него ранжирование множества Парето-оптимальных операций совпадает с их ранжированием по величине математического ожидания дохода:

F >- А >- С и оптимальной будет операция F.

При X > 3,8 ранжирование множества Парето-оптимальных операций совпадает с их ранжированием по показателю риска:

С х А у F и операция С будет оптимальной.

В случае 0,16 < X < 3,8 мера несклонности к риску находится в зоне неопределенности. Если взять А, = 0,5 < 0,74, то

Получили следующие ранжированные операции F У С У А, и оптимальной операцией будет F.

Если взять X — 1 > 0,74, то

Получили следующие ранжированные операции С > F > А, и оптимальной операцией будет С.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >