Теория риска и моделирование рисковых ситуаций. Игры с природой в условиях полной неопределенности. Понятия игры с природой. Принятие решений в условиях полной неопределенности. Критерии выбора оптимальных решений в условиях полной неопределенности. Проблема выбора оптимального решения. Критерий Сэвиджа

Решение задач и выполнение научно-исследовательских разработок: Отправьте запрос сейчас: irina@bodrenko.org    
математика, IT, информатика, программирование, статистика, биостатистика, экономика, психология
Пришлите по e-mail: irina@bodrenko.org описание вашего задания, срок выполнения, стоимость






Теория риска и моделирование рисковых ситуаций

Лекция 3

 

ИГРЫ С ПРИРОДОЙ В УСЛОВИЯХ ПОЛНОЙ НЕОПРЕДЕЛЕННОСТИ

1.      Понятия игры с природой. Принятие решений в условиях полной неопределенности.

2.      Критерии выбора оптимальных решений в условиях полной неопределенности.

3.      Проблема выбора оптимального решения.

1.1.                        ПОНЯТИЕ ИГРЫ С ПРИРОДОЙ.

 

Многие экономические задачи принятия решений в условиях неопределенности содержат    неопределенность особого вида.  Эта неопределенность заключается в том, что лицо, принимающее решение, недостаточно информировано об объективных внешних условиях, в которых будет приниматься это решение. Неопределенность такого вида не связана с сознательным целенаправленным противодействием противника; такая неопределенность  может порождаться различными причинами: нестабильностью экономической ситуации, рыночной конъюнктурой, курсами валют, уровнем инфляции, налоговой политикой, изменяющимся покупательским спросом и т.д.

 

То есть в задачах подобного рода выбор решения зависит от состояний объективной экономической действительности, называемой в модели «ПРИРОДОЙ», а математические модели подобных конфликтных  ситуаций называются ИГРАМИ «С ПРИРОДОЙ».

Термин «ПРИРОДА» характеризует некую объективную действительность, которую не следует понимать буквально. Хотя вполне могут встречаться ситуации, в которых игроком может действительно выступать природа. Например, обстоятельства, связанные с погодными условиями  или с природными стихийными  силами.

Игра человека с природой тоже отражает конфликтную ситуацию, возникающую при столкновении интересов в выборе решения. Но «стихийным силам природы» нельзя приписать разумные действия, направленные против человека  и тем более какой-либо «злой умысел». Таким образом, корректнее говорить о конфликтной ситуации, вызванной столкновением интересов человека и неопределенностью действий природы, но без явной антагонистической окраски.

В игре «с природой» участвуют два игрока.

 

Игрок 1 – это лицо, принимающее решение (ЛПР), обозначим его «А».

 

Игрок 2 – это «ПРИРОДА», обозначим его «Q».

 

В играх «с природой» сознательно действует только один из участников  – лицо, принимающее решение (ЛПР).  «ПРИРОДА» является вторым игроком, но не противником игрока А. Так как «ПРИРОДА» осознанно против первого игрока не действует, принимает то или иное свое состояние определенным образом, конкретных целей в игре не преследует и безразлична к результату игры.  То есть «ПРИРОДА», являясь игроком в игре «с природой», не является ни противником, ни союзником игрока А.

Формально изучение игр «с природой», так же как и стратегических, должно начинаться с построения матрицы выигрышей (платежной матрицы), что является, по существу, наиболее трудоемким этапом подготовки принятия решения. Ошибки, допущенные при формировании матрицы выигрышей (платежной матрицы), не могут быть компенсированы никакими вычислительными методами и приведут к неверному итоговому результату.

Матрица игры «с природой» аналогична платежной матрице стратегической игры «m x n» (рис.1).  Формализация задачи происходит следующим образом: у активного игрока (человека) возможные действия по-прежнему называются стратегиями, а возможные действия пассивного игрока (природы) – состояниями или условиями природы.

Пусть игрок 1 –  «A» (лицо, принимающее решение),  имеет m стратегий Ai, i = 1, …, m.   Игрок 2 – «ПРИРОДА»,  может находиться в одном из n возможных состояний Qj, j = 1, …, n. Состояния природы Qj можно рассматривать как ее возможные «стратегии». 

 

Обычно предполагается, что игрок A (ЛПР) в состоянии оценить результаты выбора им каждой из своих стратегий Ai,  i=1,…,m, при каждом состоянии природы Qj, j=1,…,n. Эти результаты количественно выражаются действительными числами aij, и называются выигрышами игрока A (ЛПР) в игре «с природой». 

 

Так как в играх «с природой» в качестве первого игрока всегда выступает человек (ЛПР), то можно составить матрицу выигрышей (платежную матрицу)  игры «с природой»    матрицу размера «m x n» с элементами {aij}.  Номер строки матрицы соответствует номеру стратегии, применяемой первым игроком – человеком (ЛПР).  Номер столбца соответствует номеру состояния  «ПРИРОДЫ»   – второго игрока. 

Элемент матрицы aij – это выигрыш  игрока 1 (ЛПР), если он выбрал стратегию Ai при состоянии природы Qj.

 

Содержательное отличие матрицы выигрышей в игре «с природой» от платежной матрицы антагонистической игры заключается в том, что элементы столбцов этой матрицы не являются проигрышами «природы» при соответствующих ее состояниях. Выигрыши aij платит, естественно, не «ПРИРОДА», а некая третья сторона или совокупность сторон, влияющих на принятие решения игроком 1, и объединенных в понятие «ПРИРОДА».

 

Подпись:                       СОСТОЯНИЯ  «ПРИРОДЫ»

СТРАТЕГИИ ЛПР 	Q1	Q2	…	Qn
A1	a11	a12	…	a1n
A2	a21	a22	…	a2n
…	…	…	…	…
Am	am1	am2	…	amn

 

 

 

 

 

 

 

 

 

 

 

Рис. 1. Матрица игры «с природой» (матрица выигрышей).

 

Если в распоряжении игрока A всего одна стратегия A1, то есть  m =1, то проблема выбора им оптимальной стратегии отпадает. Поэтому в дальнейшем целесообразно считать m 2.

 

Если «ПРИРОДА» Q может пребывать только в одном состоянии Q1, то есть n =1, то проблема выбора игроком A оптимальной стратегии превращается в тривиальную: игрок A  должен выбрать стратегию Ak  такую, что выигрыши аk1 ai1, i=1,…, m. Поэтому будем предполагать, что n 2.

 

В игре с природой можно также доминировать (мажорировать) стратегии.

 

Если k-я строка матрицы A доминируется (в частности, дублируется) какой-либо другой  s-й строкой этой матрицы (ks), то есть, если  выполнены неравенства:  akjasj, для всех j=1, ..., n,  (в частности, выполнены равенства: akj = asj, j = 1,…, n). То доминируемую (в частности, дублируемую) k-ю строку матрицы A можно удалить, как строку, определяющую стратегию Ak, заведомо не лучшую стратегии As. В результате матрица A упрощается за счет уменьшения числа строк.

 

Рассмотрим пример матрицы выигрышей в игре «с природой» (рис. 2).           

 

                                 Состояния «ПРИРОДЫ»

 

Стратегии ЛПР

Q1

Q2

Q3

Q4

Q5

A1

3

5

3

3

1

A2

8

5

6

1

3

A3

4

3

2

4

1

A4

3

9

3

0

2

A5

4

7

4

8

1

Рис. 2.  Доминирование стратегий в игре «с природой».

 

В данном примере стратегия A5 доминирует стратегии A1 и А3, поэтому строки, соответствующие стратегиям A1 и A3, можно вычеркнуть. Число строк в полученной матрице – на 2 меньше, чем в исходной матрице.  Размер матрицы игры будет равен «3x5» (рис. 3).

 

   

                             Состояния «ПРИРОДЫ»

 

Стратегии ЛПР

Q1

Q2

Q3

Q4

Q5

A2

8

5

6

1

3

A4

3

9

3

0

2

A5

4

7

4

8

1

Рис. 3.  Доминирование стратегий в игре «с природой».

 

Таким образом, в играх «с природой» можно и нужно пользоваться принципом доминирования стратегий игрока A (игрока – ЛПР). 

 

Но доминирование (мажорирование) стратегий в игре с природой имеет определенную специфику.

 

Исключать из рассмотрения можно лишь доминируемые стратегии игрока A (ЛПР).  А  столбцы, отвечающие состояниям «ПРИРОДЫ», вычеркивать из матрицы игры недопустимо. 

Поскольку «ПРИРОДА» не стремится к выигрышу в «игре» с человеком, для нее нет целенаправленно выигрышных или проигрышных состояний (стратегий). «ПРИРОДА» действует неосознанно.

 

Например, в полученной матрице (рис. 3) пятый столбец (Q5) доминирует первый, второй и третий столбцы (Q1, Q2, Q3). Поэтому в матричной игре эти столбцы можно было бы удалить. Но в игре «с природой» этого делать нельзя. Это обстоятельство является еще одним свойством, отличающим игры «с природой» от матричных игр.

 

Таким образом, в дальнейшем будем считать, что матрица выигрышей (рис. 1) не содержит доминируемых (в частности, дублируемых) строк.

 

Рассмотрим некоторые оценочные функции для выбора оптимальных решений в играх «с природой».

 

Пример 1. Функция эффективности.

 

Пусть Игрок A (ЛПР) располагает множеством стратегий (вариантов, альтернатив) решения проблемы A1, A2, …, Am. Указанные стратегии определяются контролируемыми (управляемыми) факторами. Например, в качестве таких факторов могут быть технические параметры проектируемых систем, экономические показатели состояния предприятия, различные варианты решения поставленных задач и т.п.

 

«ПРИРОДА» Q – это внешняя среда, в которой Игрок A (ЛПР) принимает решение.  Q может пребывать в одном из своих состояний Q1, Q2, …, Qn.

Состояния природы определяются действием неуправляемых факторов. Например, в качестве таких факторов могут быть:  уровень спроса на товары, рыночные цены, действия конкурентов, условия эксплуатации производственных и технических систем и т.д.

 

Таким образом, наряду с управляемыми факторами P1, P2, … , Pm,  действуют факторы неуправляемые T1, T2, …, Tn.

 

Для оценки эффективности принимаемых решений вводим функцию эффективности

E = E (P, T) по следующему правилу.

 

Каждой точке (Pi, Tj) ставится в соответствие число eij = E (Pi, Tj) – которое называется значением эффективности.

Следовательно, можно построить матрицу эффективности E = {e ij}(m x n) (рис. 5).

Подпись:                    Tj 
Pi 	T1	T2	…	Tn	Ei = min eij
          j
P1	e11	e12	…	e1n	E1= min e1j
        j
P2	e21	e22	…	e2n	E2 = min e2j
         j
…	…	…	…	…	…
Pm	em1	em2	…	emn	Em = min emj
          j

Рис. 5. Матрица эффективности.

 

Пример 2. Функция затрат.

 

В ряде экономических задач в качестве критерия эффективности принимаемых решений выступает показатель минимума затрат. В качестве затрат могут выступать: капитальные вложения, валовые издержки производства, приведенные годовые затраты и другие показатели.

 

Рассмотрим следующий пример.

 

Допустим, производится сравнение различных инвестиционных проектов A1, A2, …, Am.

 

Для реализации каждого из проектов A1, A2, …, Am необходима, соответственно,  определенная величина капитальных вложений K1, K2, …, Km.

 

Величины Ki, i = 1, …, m, являются управляемыми (контролируемыми) факторами.

 

Каждому инвестиционному проекту Ai соответствует определенное значение себестоимости продукции, которую предполагается выпускать при реализации проекта.

 

Для каждого из проектов  Ai имеются n возможных значений себестоимости продукции C1, C2, …, Cn.

 

Величины Cj определяются состояниями экономической обстановки Qj, j = 1, …, n. Состояния Qj на начальных этапах выполнения проекта Ai установить невозможно, поэтому величины Cj, j = 1, …, n, считаются неконтролируемыми факторами.

 

Функцию приведенных годовых затрат Z = Z (K,C) определяем по следующему правилу.

Каждой точке  (Ki, Cj) ставим в соответствие число zij = Z (Ki, Cj)    определенное значение приведенных годовых затрат,  вычисленное по формуле:

 

 

где EN – нормативный коэффициент эффективности капитальных вложений, Cj – величина себестоимости продукции, определенная состоянием экономической обстановки Qj.

Зная наборы значений Ki, i = 1, …, m;  Cj, j = 1, …n, можем составить матрицу приведенных годовых затрат Z = {z ij}(m x n) (рис. 6).

Подпись:                    Cj 
Ki 	C1	C2	…	Cn	Zi = max zij
           j
K1	z11	z12	…	z1n	Z1= max z1j
         j
K2	z21	z22	…	z2n	Z2 = max z2j
          j
…	…	…	…	…	…
Km	zm1	zm2	…	zmn	Zm = max zmj
           j

Рис. 6. Матрица приведенных годовых затрат.

 

 

1.2.                        ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ПОЛНОЙ НЕОПРЕДЕЛЕННОСТИ.

 

Методы принятия решений в играх «с природой» зависят от того, известны или нет вероятности состояний (стратегий) «ПРИРОДЫ» Q.

 

Случай 1. Пусть события, состоящие в том, что «ПРИРОДА» Q находится в одном из своих состояний Q1, …, Qn,  несовместны  и составляют полную группу событий.   При этом  вероятности pj  состояний «ПРИРОДЫ» Qj известны, то есть известны значения

 

 

где выполнены условия:     

 

В этом случае имеет место ситуация риска, и решения принимаются в условиях риска.

 

Случай 2. Если вероятности, с которыми «ПРИРОДА»  Q может находиться в том или ином своем состоянии,  неизвестны и отсутствует возможность получения о них какой-либо статистической информации, то имеет место ситуация полной неопределенности, и решения принимаются в условиях полной неопределенности.

 

Цель в играх «с природой»: независимо от вида матрицы игры требуется выбрать такую стратегию игрока A (ЛПР), которая была бы наиболее выгодной по сравнению с другими.

 

Рассмотрим игру «с природой», в которой вероятности pj состояний природы Qj неизвестны, и отсутствует всякая возможность получения о них какой-либо статистической информации. То есть мы находимся в состоянии полной неопределенности, связанной с отсутствием  информации о вероятностях состояний природы. 

 

2.      КРИТЕРИИ ВЫБОРА ОПТИМАЛЬНЫХ РЕШЕНИЙ В УСЛОВИЯХ ПОЛНОЙ НЕОПРЕДЕЛЕННОСТИ.

 

Неопределенность, связанную с отсутствием информации о вероятностях состояний среды (природы), называют «безнадежной» или «дурной». В случаях неопределенности такого вида («безнадежной» неопределенности) для выбора наилучших решений в играх «с природой» применяются следующие классические критерии.

 

Первая группа критериев – это КРИТЕРИИ ВЫБОРА ОПТИМАЛЬНЫХ РЕШЕНИЙ  относительно выигрышей.  Здесь мы рассмотрим следующие критерии.  

 

1)     МАКСИМИННЫЙ КРИТЕРИЙ ВАЛЬДА (КРИТЕРИЙ ГАРАНТИРОВАННОГО РЕЗУЛЬТАТА).

2)     КРИТЕРИЙ МАКСИМАКСА (КРИТЕРИЙ КРАЙНЕГО ОПТИМИЗМА).

3)     КРИТЕРИЙ ПРОИЗВЕДЕНИЙ В УСЛОВИЯХ ПОЛНОЙ НЕОПРЕДЕЛЕННОСТИ.

4)     КРИТЕРИЙ ПЕССИМИЗМА-ОПТИМИЗМА ГУРВИЦА ОТНОСИТЕЛЬНО ВЫИГРЫШЕЙ С ПОКАЗАТЕЛЕМ ОПТИМИЗМА λ.

5)     ОБОЩЕННЫЙ КРИТЕРИЙ ПЕССИМИЗМА-ОПТИМИЗМА ГУРВИЦА ОТНОСИТЕЛЬНО ВЫИГРЫШЕЙ С КОЭФФИЦИЕНТАМИ  (КРИТЕРИЙ ОБОБЩЕННОГО МАКСИМИНА ГУРВИЦА). 

 

Вторая группа критериев – это КРИТЕРИИ ВЫБОРА ОПТИМАЛЬНЫХ РЕШЕНИЙ относительно рисков. К ним относятся следующие критерии.

6)     КРИТЕРИЙ МИНИМАКСНОГО РИСКА СЭВИДЖА.

7)     КРИТЕРИЙ ПЕССИМИЗМА-ОПТИМИЗМА ГУРВИЦА ОТНОСИТЕЛЬНО РИСКОВ. 

 

1)     МАКСИМИННЫЙ КРИТЕРИЙ ВАЛЬДА.  

 

При применении данного критерия «ПРИРОДА» рассматривается  как агрессивно настроенный и сознательно действующий противник,  как в матричной игре. Поэтому выбирается стратегия, гарантирующая выигрыш не меньший, чем «нижняя цена игры с природой».

В соответствии с этим критерием из всех самых неудачных результатов выбирается самый лучший. Это перестраховочная позиция крайнего пессимизма, рассчитанная на худший случай. Такая стратегия приемлема, когда, например, игрок не столько заинтересован в крупной удаче, сколько хочет «застраховать» себя от неожиданных проигрышей.  Выбранное таким образом решение полностью исключает риск.  Это означает, что ЛПР не может столкнуться с худшим результатом, чем тот, на который он ориентируется. Это свойство позволяет считать максиминный критерий Вальда одним из фундаментальных. Поэтому в технических и экономических задачах он применяется чаще всего как сознательно, так и неосознанно. Таким критерием часто пользуются и в обиходе. Использование критерия Вальда подтверждается известными поговорками: «Береженого Бог бережет», «Лучше синица в руках, чем журавль в небе», «Семь раз отмерь, один отрежь».

 

Максиминный критерий Вальда (критерий гарантированного результата) обеспечивает максимизацию минимального выигрыша, или, что то же самое, минимизацию максимальных потерь, которые могут произойти при выборе одной из стратегий.  Выбор такой стратегии определяется отношением игрока к риску.

 

Обозначим показатель эффективности стратегии Аi по максиминному критерию Вальда через Wi.

 

Для показателя эффективности Wi имеем формулу:

 

 

Таким образом, показатель эффективности Wi стратегии Аi по максиминному критерию Вальда есть минимальный выигрыш игрока A при применении им этой стратегии.

 

Цена игры по максиминному критерию Вальда (обозначим ее через W) находится по формуле:

 

 

Оптимальной среди чистых стратегий по критерию Вальда является стратегия Ak с максимальным показателем эффективности:

Сформулируем правило выбора оптимальных решений в соответствии с максиминным критерием Вальда. 

 

Матрица выигрышей дополняется ещё одним столбцом с элементами Wi , i = 1, …, m,  – показателями эффективности стратегий Ai  . Действительное  число Wi  равно минимальному выигрышу игрока A при применении им стратегии Ai  и определяется по формуле (1). 

Среди всех чистых стратегий A1,  A2, …, Am , необходимо выбрать те стратегии Ak , у которых показатель эффективности Wk  является максимальным (то есть Wk = W, где W определяется по формуле (2)).

 

Таким образом, оптимальной среди чистых стратегий по максиминному критерию Вальда считается  та чистая стратегия, при которой минимальный выигрыш является максимальным среди минимальных выигрышей всех чистых стратегий.

 

Выбор оптимального решения, в общем случае, не является однозначным. Этому критерию оптимальности может соответствовать несколько чистых стратегий. 

 

Выбранные таким образом варианты решений полностью исключают риск. Это означает, что принимающий решение не может столкнуться с худшим результатом, чем тот, на который он ориентируется. Какие бы условия ни встретились, соответствующий результат не может оказаться ниже W. Оптимальная чистая стратегия по критерию Вальда гарантирует при любых состояниях «ПРИРОДЫ» выигрыш, не меньший «максимина» W. Максиминный критерий Вальда является критерием крайнего пессимизма игрока A, поскольку игрок A,  принимая решение, действует по принципу наибольшей осторожности.

 

Пример выбора оптимальной стратегии по максиминному критерию Вальда.

 

Допустим, что предприятие готовится к переходу на новые виды продукции. При этом возможны четыре решения A1, A2, A3, A4. Каждому из решений соответствует определенный вид выпуска продукции или их сочетание.  Результаты принятых решений существенно зависят от экономической ситуации, которая неопределенна. Экономическая ситуация зависит от структуры спроса на новую продукцию, которая может быть трех типов Q1, Q2, Q3.

Выигрыши – действительные числа aij, которые характеризуют относительную величину результата (например, доходы, прибыль и т.п.) для каждой пары («решение», «ситуация») – (Ai,Qj). 

 

Пусть имеется следующая матрица выигрышей (рис. 7), которая не содержит доминируемых (в частности, дублируемых) строк. Дополним эту матрицу столбцом Wi показателей эффективности стратегий Ai. Значения Wi вычисляем по формуле (1). Затем в столбце Wi находим максимальный элемент W.

 

В данном примере цена игры W, определенная  по формуле  (2),  равна:  W = max {0,3;  0,5;  0,3;  0,2}   = 0,5.

 

 

                                     Варианты   ситуации

Виды решений

Q1

Q2

Q3

Wi = min aij     

            j               

A1

0,3

0,8

0,4

0,3

A2

0,6

0,5

0,6

0,5

A3

0,4

0,3

0,8

0,3

A4

0,1

0,7

0,9

0,1

Рис. 7.  Матрица эффективности выпуска новых видов продукции.

 

Таким образом, по максиминному критерию Вальда (критерию гарантированного результата) оптимальным решением является A2, так как показатель эффективности W2 совпадает с «максимином» W (W2= W =0,5). 

 

Выбрав решение A2, мы независимо от вариантов экономической ситуации получим выигрыш не менее 0,5.  При любом другом решении в случае неблагоприятной обстановки может быть получен результат (выигрыш), меньший 0,5.   

Например, при выборе решений A1 и A3 выигрыш будет колебаться от 0,3 до 0,8;  а при выборе решения  A4 – от 0,1 до 0,9.  

 

Отметим, что максиминный критерий Вальда ориентирует ЛПР на крайне осторожную линию поведения. Например, этот критерий не учитывает, что в случае выбора стратегии A2 (с гарантированным выигрышем 0,5) максимальный выигрыш не превышает 0,6. А при выборе стратегии A4 при гарантированном выигрыше 0,1 в благоприятной обстановке можно получить выигрыш, равный 0,9.

 

В практических ситуациях излишний пессимизм этого критерия может оказаться очень невыгодным. Пословица  гласит: «Кто боится собственной тени, тому нет места под солнцем».

 

Применение максиминного критерия Вальда может быть оправдано, если  ситуация, в которой он применяется, характеризуется следующими обстоятельствами.

 

- о вероятности появления того или иного состояния Qj природы ничего не известно;

- с появлением того или иного состояния Qj природы необходимо считаться;

- реализуется лишь малое количество решений;

- не допускается никакой риск, то есть ни при каком состоянии Qj не допускается получать выигрыш меньший, чем W.

 

2)     КРИТЕРИЙ МАКСИМАКСА (КРИТЕРИЙ КРАЙНЕГО ОПТИМИЗМА). 

 

При использовании данного критерия игрок A (ЛПР) ориентируется на то, что условия функционирования анализируемых систем будут для него благоприятными. Вследствие этого оптимальным решением является та стратегия, которая приводит к получению максимального значения критерия оптимальности в платежной матрице.

 

Критерий максимакса максимизирует максимальные выигрыши для каждого состояния природы.

 

Критерий максимакса (крайнего оптимизма) противоположен максиминному критерию Вальда (крайнего пессимизма). Игрок A, пользуясь максимаксным критерием, предполагает, что природа Q будет находиться в благоприятнейшем для него состоянии. Поэтому игрок A ведет себя легкомысленно, с «шапкозакидательским» настроением, так как уверен в наибольшем выигрыше. 

 

Ситуации, требующие применения критерия максимакса в экономике нередки. Пользуются им не только безоглядные оптимисты, но и игроки, поставленные в безвыходное положение. Например, когда перед игроком A стоит дилемма: или получить наибольший выигрыш, или стать банкротом. В быту подобные ситуации иллюстрируются  поговорками: «или пан, или пропал», «кто не рискует, тот не выигрывает».

 

Оптимальная чистая стратегия по критерию максимакса гарантирует игроку A возможность выигрыша, равного «максимаксу».

 

Показатель эффективности стратегии Ai по максимаксному критерию обозначим через Mi и определим по формуле:

 

 

Таким образом, показатель эффективности чистой стратегии Ai по критерию максимакса равен максимальному выигрышу игрока A при выборе им этой стратегии.

 

Цена игры M по критерию максимакса определяется по формуле:

 

 

Оптимальная стратегия по критерию максимакса определяется как стратегия Аk с максимальным показателем эффективности:

Сформулируем правило выбора оптимальных решений в соответствии с критерием максимакса. 

 

Матрица выигрышей дополняется ещё одним столбцом с элементами Mi , i = 1, …, m,    показателями эффективности стратегий Ai  . Действительное  число Mi  равно максимальному  выигрышу игрока A при применении им стратегии Ai  и определяется по формуле (3). 

Среди всех чистых стратегий A1,  A2, …, Am , необходимо выбрать те стратегии Ak , у которых показатель эффективности Mk  является максимальным (то есть Mk = M, где M определяется по формуле (4)).

 

3)     КРИТЕРИЙ ПРОИЗВЕДЕНИЙ В УСЛОВИЯХ  ПОЛНОЙ НЕОПРЕДЕЛЕННОСТИ.

 

С самого начала этот критерий ориентирован на величины выигрышей, то есть  на положительные значения aij. Данный критерий применяется в случае, когда все элементы матрицы выигрышей положительны:  aij > 0, i= 1, …,  m; j = 1, …, n.

Опишем критерий произведений применительно к ситуациям полной неопределенности, то есть когда вероятности состояний природы неизвестны.

 

Показатель эффективности стратегии Ai в соответствии с критерием произведений в условиях полной неопределенности  обозначим через Pi и определим  по формуле:

 

 

Таким образом, показатель эффективности Pi чистой стратегии Ai по критерию произведений (в условиях полной неопределенности)  равен произведению всех выигрышей игрока A при выборе им этой стратегии.

 

Цена игры P по критерию произведений определяется по формуле:

 

     

Оптимальная стратегия Ak по критерию произведений определяется как стратегия с максимальным показателем эффективности Pk = P.

Правило выбора оптимальной стратегии по критерию произведений в условиях полной неопределенности формулируется так.

 

Матрица выигрышей дополняется ещё одним столбцом с элементами Pi , i = 1, …, m,    показателями эффективности стратегий Ai  . Действительное  число Pi  равно произведению всех  выигрышей игрока A при применении им стратегии Ai  и определяется по формуле (5). 

Среди всех чистых стратегий A1,  A2, …, Am , необходимо выбрать те стратегии Ak , у которых показатель эффективности Pk  является максимальным (то есть Pk = P, где P определяется по формуле (6)).

 

Применение критерия произведений (P-критерия) в условиях полной неопределенности обусловлено следующими  обстоятельствами:

 

- вероятности появления состояний Qj неизвестны;

- с появлением каждого из состояний Qj по отдельности необходимо считаться;

- критерий применим и при малом числе реализаций решения;

- некоторый риск допускается.

 

Если условие aij > 0, i= 1, …,  m; j = 1, …, n;  нарушается, а P-критерий приходится применять и в этом случае, то следует выполнить некоторый сдвиг  aij + b каждого элемента матрицы выигрышей aij с некоторой константой

 

Ясно, что результат применения P-критерия существенно зависит от этого значения b.

 

На практике в качестве значения b охотно используют

 

величину

 

Если же никакая константа не может быть признана имеющей смысл, то к таким проблемам Р-критерий не применим.

 

Выбор оптимального решения согласно Р-критерию  оказывается значительно менее пессимистическим, чем, например,  выбор в соответствии с максиминным критерием Вальда.

 

В результате применения Р-критерия  происходит некоторое выравнивание между большими и малыми  значениями выигрышей aij, и, устанавливая оптимальный вариант решения с помощью Р-критерия, мы можем при фиксированных состояниях Qj получить большую выгоду, чем при использовании критерия гарантированного результата, но при этом должна учитываться возможность  появления и худших результатов.

 

Следует отметить, что при  использовании этого критерия ни число реализаций, ни информация о распределении вероятностей не принимаются во внимание.

 

4)     КРИТЕРИЙ ПЕССИМИЗМА-ОПТИМИЗМА ГУРВИЦА ОТНОСИТЕЛЬНО ВЫИГРЫШЕЙ С ПОКАЗАТЕЛЕМ ОПТИМИЗМА .

 

Представляется логичным, что при выборе оптимального решения вместо двух крайностей в оценке ситуации придерживаться некоторой промежуточной позиции, учитывающей возможность как наихудшего, так и наилучшего, благоприятного поведения природы Q. Такой компромиссный вариант и был предложен Гурвицем.

 

Стараясь занять уравновешенную позицию, Гурвиц предложил критерий, оценочная функция которого находится где-то между точками предельного оптимизма и крайнего пессимизма.

 

Этот критерий при выборе решения рекомендует руководствоваться некоторым средним результатом, характеризующим состояние между крайним пессимизмом и безудержным оптимизмом.

 

Определим показатель эффективности Hi стратегии Ai по формуле:

 

 

где число λ удовлетворяет условию:  

 

В формуле (5)  величина   называется показателем оптимизма,  соответственно       это показатель пессимизма игрока A .

 

Цена игры H по критерию пессимизма-оптимизма Гурвица с показателем оптимизма    определяется по формуле

 

 

Согласно этому критерию оптимальная стратегия Ak выбирается в соответствии с максимальным показателем эффективности Hk = H.

Таким образом, согласно критерию пессимизма-оптимизма Гурвица для каждой стратегии Ai  необходимо определить линейную комбинацию Hi минимального и максимального выигрышей при данной стратегии, и выбрать  ту стратегию Ak, для которой величина Hk окажется максимальной.

 

Чем ближе к единице показатель оптимизма , тем ближе к нулю показатель пессимизма , и тем больше оптимизма и меньше пессимизма. И наоборот.

 

Таким образом, число   выбирается в пределах от 0 до 1 в зависимости от склонности игрока A к оптимизму или пессимизму.

 

При показателе оптимизма   = 1 критерий Гурвица превращается в кри­терий максимакса, а при     – совпадает c максиминным критерием Вальда.

 

В случае,  когда , то и  . То есть показатели оптимизма и пессимизма одинаковы. Это означает, что игрок A при выборе стратегии ведет себя нейтрально.

 

В прикладных задачах бывает трудно правильно выбрать значение показателя . Поэтому чаще всего весовой множитель  без возражений принимается в качестве некоторой «средней» точки зрения.

 

На выбор значения показателя оптимизма  оказывает влияние мера ответственности. Чем серьезнее последствия ошибочных решений, тем больше желание принимающего решение застраховаться, то есть показатель пессимизма  ближе к единице.

 

Применение критерия Гурвица оправдано, если ситуация, в которой он используется, характеризуется следующими обстоятельствами.

 

- о вероятностях появления состояний природы Qj ничего не известно;

- с появлением состояний природы Qj необходимо считаться;

- реализуется лишь малое количество решений;

- допускается некоторый риск.

 

5)     ОБОБЩЕННЫЙ КРИТЕРИЙ ПЕССИМИЗМА-ОПТИМИЗМА ГУРВИЦА ОТНОСИТЕЛЬНО ВЫИГРЫШЕЙ С КОЭФФИЦИЕНТАМИ ,  , …,   (КРИТЕРИЙ ОБОБЩЕННОГО МАКСИМИНА ГУРВИЦА).

 

Для применения этого критерия переставим в каждой строке Ai матрицы игры A выигрыши игрока 1 (ЛПР) в неубывающем порядке. Обозначим элементы полученной матрицы через bij, а саму матрицу - через B (рис. 8).

 

Подпись:                       «ПРИРОДА»
ЛПР 	1	2	…	n
B1	b11	b12	…	b1n
B2	b21	b22	…	b2n
…	…	…	…	…
Bm	bm1	bm2	…	bmn

 

 

 

 

 

 

 

Рис. 8. Матрица B.

 

Для элементов матрицы B (рис. 8) имеем следующие неравенства:

 

 

Матрица B получена из матрицы A перестановкой элементов каждой ее строки в неубывающем порядке.

 

В силу неравенств (9)  в первом столбце матрицы B расположены минимальные выигрыши игрока A при использовании стратегий Ai:

 

 

в последнем столбце матрицы B – максимальные выигрыши при использовании стратегий Ai:

 

Другими словами, в первом столбце матрицы B стоят показатели эффективности Wi  стратегий Ai по максиминному критерию Вальда, а в n-м столбце – показатели эффективности Mi стратегий Ai по критерию максимакса.

 

Рассмотрим неотрицательные числа ,  , …, , удовлетворяющие условию

 

 

Показателем оптимизма игрока A  называется число  , определенное по формулам:

и

 

где  - целая часть числа  , когда n - нечетное.

Соответственно, показателем пессимизма игрока A  называется число  , определенное по формулам:

и

 

 

Очевидно, что  

Показатель эффективности Gi стратегии Аi по критерию обобщенного максимина Гурвица определяется по формуле:

 

 

Цену игры по критерию обобщенного максимина Гурвица определим  по формуле:

 

 

Оптимальной чистой стратегией является та стратегия Аk, для которой показатель эффективности Gk является максимальным, то есть Gk=G.

Отметим, что критерий обобщенного максимина Гурвица учитывает все выигрыши при каждой стратегии, что необходимо для более полной картины эффективности стратегий.

 

Отметим следующие частные случаи критерия обобщенного максимина Гурвица.

 

Случай 1. Если  ,

то критерий обобщенного максимина Гурвица представляет собой максиминный критерий Вальда.

 

Случай 2. При ,

из критерия обобщенного максимина Гурвица получаем критерий максимакса.

 

Случай 3. Если   где ,  то критерий обобщенного максимина Гурвица является критерием пессимизма-оптимизма Гурвица относительно выигрышей с показателем оптимизма .

 

6)     КРИТЕРИЙ МИНИМАКСНОГО РИСКА СЭВИДЖА.

 

На практике, выбирая одно из возможных решений, часто останавливаются на том, осуществление которого приведет к наименее тяжелым последствиям, если выбор окажется ошибочным. Этот подход к выбору решения математически был сформулирован американским статистиком Сэвиджем (Savage) и получил название «принципа Сэвиджа». Он особенно удобен для экономических задач и часто применяется для выбора решений в играх человека с природой.

 

При выборе возможной стратегии в игре с природой игрок A (игрок-ЛПР) должен исходить из матрицы выигрышей. Однако, матрица выигрышей не всегда адекватно отражает имеющуюся ситуацию.

 

По принципу Сэвиджа каждое решение характеризуется величиной дополнительных потерь, которые возникают при реализации этого решения, по сравнению с реализацией решения, «правильного» при данном состоянии природы. Естественно считать, что «правильное» решение не влечет за собой никаких дополнительных потерь, и их величина равна нулю.

 

При выборе решения, наилучшим образом соответствующего различным состояниям природы, следует принимать во внимание только эти дополнительные потери, которые по существу, будут являться следствием ошибок выбора.

 

Для решения задачи строится так называемая «матрица рисков», элементы которой показывают, какой убыток понесет игрок A (ЛПР) в результате выбора «неправильного» варианта решения.

 

В соответствии с критерием «минимального риска» на выбор стратегии должны влиять не только выигрыши, составляющие матрицу решений.  Должны учитываться показатели благоприятности состояний природы для увеличения выигрыша и показатели удачности выбора игроком A своей чистой стратегии Ai при состоянии природы Qj.

 

ПОКАЗАТЕЛЕМ БЛАГОПРИЯТНОСТИ СОСТОЯНИЯ Qj ПРИРОДЫ Q называется максимальный выигрыш игрока А при этом состоянии, то есть максимальный элемент j-го столбца матрицы выигрышей: 

Для характеристики степени удачности выбора игроком А своей стратегии Ai при состоянии природы Qj, вводят понятие РИСКА.

 

РИСКОМ Rij ИГРОКА А ПРИ ВЫБОРЕ ИМ СТРАТЕГИИ Ai И ПРИ СОСТОЯНИИ ПРИРОДЫ Qj  называют разность между показателем благоприятности βj и выигрышем aij:

  

 

Другими словами, риск – это разность между выигрышем, который игрок А  получил бы, если бы он точно знал, что состоянием природы будет Qj,  и выигрышем, который игрок А получит, не имея этой информации и применяя свою стратегию Ai.

Таким образом, риск Rij игрока А представляет собой упущенную возможность максимального выигрыша  βj (то есть упущенную выгоду) при данном состоянии природы Qj. Эта упущенная возможность определяется невыигранной частью максимального выигрыша. Следовательно, величину риска Rij можно интерпретировать как своеобразную плату  за отсутствие информации  о действительном состоянии природы. Поскольку точная информация о состоянии природы Qj позволила бы игроку А выбрать ту стратегию Ai,  при которой его выигрыш был бы максимальным, то есть βj.

 

Введем величину γj

 

Величина γj    это минимальный выигрыш игрока А  при состоянии природы Qj.

 

Разность

 

между максимальным выигрышем βj игрока А при состоянии природы Qj и минимальным выигрышем γj игрока А при этом состоянии называют КОЛЕБАНИЕМ ВЫИГРЫШЕЙ ПРИ СОСТОЯНИИ ПРИРОДЫ Qj.

Мы можем установить границу изменения риска Rij:

 

.

 

Для данной матрицы выигрышей А размера «m x n» матрица рисков RA имеет тот же размер «m x n» (рис. 9).

 

Подпись: R11	R12	…	R1n
R21	R22	…	R2n
…	…	…	…
Rm1	Rm2	…	Rmn

 

 

             

 

 

 

 

 

Рис. 9. Матрица рисков RA.

 

В игре с природой возможны следующие ситуации.

1.      Возможны одинаковые выигрыши игрока 1 при одной и той же стратегии, но при разных состояниях природы.

2.      Возможны одинаковые выигрыши игрока 1 при разных стратегиях, но при одном и том же состоянии природы.  

 

Матрица рисков проясняет, насколько удачна стратегия Ai при разных состояниях природы  Qj и Ql . 

 

Случай 1. Пусть стратегия Ai дает одинаковые выигрыши aij  = ail при разных состояниях природы Qj и Ql, j l . При этом риски игрока А равны соответственно Rij и R il .

 

Если Rij <  Ril , то выбор стратегии  Ai по отношению к состоянию природы Qj более удачлив, чем по отношению к состоянию природы Ql.   

 

То есть МАТРИЦА РИСКОВ ПОКАЗЫВАЕТ НЕРАВНОЦЕННОСТЬ ОДИНАКОВЫХ ВЫИГРЫШЕЙ С ТОЧКИ ЗРЕНИЯ РИСКОВ ПРИ ОДНОЙ И ТОЙ ЖЕ СТРАТЕГИИ, НО ПРИ РАЗНЫХ СОСТОЯНИЯХ ПРИРОДЫ.

 

Случай 2. Пусть выигрыши игрока А одинаковы при разных стратегиях Ai, Ak , но при одном и том же состоянии природы, то есть aij = a kj. 

В этом случае риски Rij и R kj игрока 1 будут равны между собой:

Rij = βjaij = βja kj = R kj.

 

Таким образом, С ТОЧКИ ЗРЕНИЯ РИСКОВ ОДИНАКОВЫЕ ВЫИГРЫШИ ИГРОКА А ПРИ РАЗНЫХ СТРАТЕГИЯХ, НО ПРИ ОДНОМ И ТОМ ЖЕ СОСТОЯНИИ ПРИРОДЫ ВСЕГДА РАВНОЦЕННЫ.

 

Критерий минимаксного риска Сэвиджа аналогичен максиминному критерию Вальда.

Показатель эффективности Si стратегии Ai согласно критерию Сэвиджа определим по формуле

 

Таким образом, показатель эффективности Si стратегии Ai по критерию Сэвиджа равен максимальному риску игрока A при выборе им этой стратегии.

 

Определим значение S для выбора оптимальной стратегии по формуле

 

 

В соответствии с критерием Сэвиджа оптимальной является та стратегия Ak, которая имеет минимальный показатель эффективности Sk = S.

Пример выбора оптимальной стратегии по критерию минимаксного риска Сэвиджа.

 

Допустим, компания производит продукцию определенного ассортимента и осуществляет ее сбыт по четырем каналам:

- ежемесячный объем продукции с устойчивым сбытом на ряд лет в среднем составляет 49000 у.е.

- ежемесячный объем продукции с устойчивым сбытом на один год в среднем составляет 50000 у.е.;

- ежемесячный объем продукции, обеспеченный разовой закупкой, составляет 51000 у.е.;

- ежемесячный объем продукции, покупатель на которую заранее не определен, составляет  40000 у.е.

 

Компания может осуществлять производство продукции по трем проектам А1, А2, А3 в объемах  P1 = 98000 у.е., P2 = 150000 у.е., P3 = 198000 у.е., соответственно.

 

Требуется выбрать оптимальную стратегию производства продукции.

 

Контролируемым параметром является объем производства, ему соответствуют три стратегии A1, A2, A3. Объем производства при стратегии Ai  выражается числовым значением Рi.

 

Неконтролируемым параметром является колебание спроса. Ему соответствуют четыре варианта экономической обстановки: Q1 – низкая зависимость колебания спроса от изменения рыночной конъюнктуры,  Q2 – средняя зависимость, Q3 – высокая зависимость, Q4 – абсолютная зависимость.

 

Размер прибыли компании, соответствующий состоянию Qj,  выражается числовым значением Dj.

 

В зависимости от изменения рыночной конъюнктуры в связи с имеющимися возможностями реализации рассчитаны варианты среднегодовой прибыли, которые представлены в виде матрицы платежеспособного спроса (рис. 10). При расчете среднегодовой прибыли учитываются потери, связанные, например, с хранением нереализованной продукции и другие.     

 

В данном случае при построении платежной матрицы первостепенную роль имеют пропорции исходных и результативных показателей. Поскольку вызванные инфляционными процессами изменения цен, оказывая влияние на абсолютные величины, не изменяют их пропорциональных соотношений. Это позволяет использовать данную методику  в условиях инфляции без дополнительных расчетов.

 

Подпись:        Dj 
Pi 	D1	D2	D3	D4	Wi = min aij
            j	Mi = max aij
            j
P1 = 98000	4930	19720	19720	19720	W1= 4930
	M1 = 19720
P2 = 1 50000	– 6	14890	29780	29780	W2 = - 6 
	M2 = 29780
P3 = 1 98000	– 114	9840	19680	39360	W3 = - 114     
                         	M3 = 39360

Рис. 10. Анализ коммерческой стратегии при неопределенной конъюнктуре.

 

По матрице выигрышей (рис. 10) построим матрицу рисков (рис. 11).

 

 

Подпись:                 Dj 
Pi 	D1	D2	D3	D4	Si = max Rij
          j
P1 = 98000	0	0	10060	19640	S1= 19640

P2 = 1 50000	4936	4830	0	9580	S2 = 9580 

P3 = 1 98000	5044	9880	10100	0	S3 = 10110     
                         
βj = max aij
          i	β1 = 4930	β2 = 19720	β3 = 29780	β4 = 39360

Рис. 11. Матрица рисков {Rij}.

 

По критерию минимаксного риска Сэвиджа  найдем оптимальную стратегию. 

 

При стратегии A2  величина риска S2 = 9580 принимает минимальное значение в самой неблагоприятной   экономической ситуации.

 

Сущность этого критерия – стремление избежать большого риска при выборе решения. В соответствии с этим критерием следует производить продукцию в объеме P2 = 150000 у.е.

 

Таким образом, критерий Сэвиджа минимизирует возможные потери. Основным исходным допущением этого критерия является предположение,  что на выбор вариантов ситуации влияют действия разумных противников (природы), интересы которых прямо противоположны интересам ЛПР.  Поэтому если у противников (конкурентов) имеются возможности извлечь какие-либо преимущества, то они это обязательно сделают. Это обстоятельство заставляет ЛПР обеспечить минимизацию потерь вследствие этих действий.

 

7)     КРИТЕРИЙ ПЕССИМИЗМА-ОПТИМИЗМА ГУРВИЦА ОТНОСИТЕЛЬНО РИСКОВ.

 

Согласно этому критерию для каждой стратегии Ai  необходимо определить показатель эффективности HRi как линейную комбинацию минимального и максимального рисков при данной стратегии:


 

где число p удовлетворяет условию:   

 

Определим значение HR для выбора оптимальной стратегии по формуле:

 

 

В соответствии с критерием пессимизма-оптимизма Гурвица относительно рисков в качестве оптимальной стратегии выбирают ту стратегию Ak, для которой показатель эффективности HRk является минимальным:  HRk = HR.

В частности, при p = 1 выбор оптимальной стратегии осуществляется по критерию минимаксного риска Сэвиджа.     

 

3. ПРОБЛЕМА ВЫБОРА ОПТИМАЛЬНОГО РЕШЕНИЯ.

 

В случае отсутствия информации о вероятностях состояний среды теория не дает однозначных и математически строгих рекомендаций по выбору критериев принятия решений. Единственный разумный выход в подобных случаях – попытаться получить дополнительную информацию, например, путем проведения исследований или экспериментов. В отсутствие дополнительной информации принимаемые решения теоретически недостаточно обоснованы и в значительной мере субъективны.

 

Применение математических методов в играх «с природой» не дает абсолютно достоверного результата. Выбор оптимальной стратегии  в известной степени является субъективным вследствие произвольности выбора критерия принятия решения.

 

Но в любом случае, применение математических методов создает определенное упорядочение имеющихся в распоряжении ЛПР данных: определяются множество состояний природы, альтернативные решения, выигрыши и потери при различных сочетаниях состояния «среда – решение». Такое упорядочение представлений о проблеме само по себе способствует повышению качества принимаемых решений.

 

Перечисленные критерии не исчерпывают всего многообразия критериев выбора решения в условиях неопределенности, в частности, критериев выбора наилучших смешанных стратегий, однако и этого достаточно, чтобы проблема выбора решения стала неоднозначной.

 

Пример выбора оптимальной стратегии в игре «с природой» в условиях полной неопределенности.

 

Применим рассмотренные критерии для выбора оптимального решения на следующем примере. 

 

Допустим, инвестор принимает решение о строительстве жилья определенного типа в некотором месте. Инвестор действует в условиях неопределенности (информационной непрозрачности) на рынке жилья. Чтобы сформировать представление о ситуации на рынке жилья на момент завершения строительства ему необходимо учесть цены на недвижимость, конкуренцию на рынке жилья, соотношение предложения и спроса, курсы валют и многое другое. Статистические данные свидетельствуют о том, что одной из главных составляющих стоимости жилья является место его расположения.

 

Рассмотрим математическую модель данной ситуации. Мы имеем игру с природой, где игрок A – инвестор, природа Q– совокупность возможных ситуаций на рынке жилья на момент завершения строительства, из которых можно сформировать, например, пять состояний Q1, Q2, Q3, Q4, Q5 природы. Предположим, что игрок A располагает четырьмя (чистыми) стратегиями А1, А2, А3, А4, представляющими собой выбор определенного места для постройки жилья. Множество этих мест ограничено градостроительными решениями, стоимостью земли и т.д.

 

Инвестиционная привлекательность проекта определяется как процент прироста дохода по отношению к сумме капитальных вложений, оценка которых известна при каждой стратегии и каждом состоянии природы. Эти данные представлены в следующей матрице выигрышей игрока A (рис. 12).

 

                Состояния «ПРИРОДЫ»

 

Стратегии ЛПР

Q1

Q2

Q3

Q4

Q5

A1

1

6

2

14

5

A2

3

5

10

2

4

A3

5

3

8

9

4

A4

2

7

6

8

4

 

Рис.12. Выбор проекта инвестиций в игре «с природой».

 

Матрица решений (рис. 12) не содержит доминируемых (дублируемых) строк и все ее элементы положительны.

 

Инвестору предстоит выбрать участок земли так, чтобы наиболее эффективно использовать капиталовложения.

 

Для данной матрицы решений (рис. 12) вычислим показатели эффективности стратегий относительно выигрышей по следующим четырем критериям:

1)      по максиминному критерию Вальда;

2)      по критерию максимакса;

3)      по критерию произведений (в условиях полной неопределенности);

4)      по критерию пессимизма-оптимизма Гурвица относительно выигрышей (с показателем оптимизма );  

5)      по обобщенному критерию пессимизма-оптимизма Гурвица (с коэффициентами ).

 

А также, вычислим показатели эффективности стратегий относительно рисков по критерию минимаксного риска Сэвиджа.

 

1.      Дополним матрицу выигрышей столбцами с показателями эффективности Wi и Mi стратегий Ai по критериям Вальда, максимакса и произведений, соответственно.  Применяя формулы (1),  (3) и (5),  мы получим:

 

 

         Состояния «ПРИРОДЫ»

 

Стратегии ЛПР

Q1

Q2

Q3

Q4

Q5

Wi

Mi

Pi

A1

1

6

2

14

5

1

14

840

A2

3

5

10

2

4

2

10

1200

A3

5

3

6

9

4

3

9

3240

A4

2

7

6

8

4

2

8

2688

 

 

 

2.      В соответствии с формулой (11) построим матрицу B (рис. 13) для критерия обобщенного максимина Гурвица. Мы имеем: 

 

 

           

Стратегии ЛПР

1

2

3

4

5

A1

1

2

5

6

14

A2

2

3

4

5

10

A3

3

4

5

6

9

A4

2

4

6

7

8

 

 

Рис. 13. Матрица B.

 

Используя формулы (10), вычислим показатели эффективности Gi стратегий Ai по  критерию обобщенного максимина Гурвица. Мы имеем:

 

 


 

 

В обобщенном критерии Гурвица показатель пессимизма  ,  показатель оптимизма .

 

Таким образом, в применяемых критериях, учитывающих индивидуальные проявления игрока A к пессимизму и оптимизму (критерий пессимизма-оптимизма Гурвица и критерий обобщенного максимина Гурвица), игрок A более склонен к пессимистической оценке ситуации, чем к оптимистической.   

 

 

3.      Для применения критерия Сэвиджа  по данной матрице решений (рис. 12) найдем матрицу рисков (рис. 14).  Вычисляя показатели благоприятности состояний природы Qj по формулам (12), и применяя затем формулы (13), получим следующую матрицу рисков.

 

                Состояния «ПРИРОДЫ»

 

Стратегии ЛПР

Q1

Q2

Q3

Q4

Q5

Si

A1

5-1

7-6

10-2

14-14

5-5

8

A2

5-3

7-5

10-10

14-2

5-4

12

A3 *

5-5

7-3

10-6

14-9

5-4

5

A4

5-2

7-7

10-6

14-8

5-4

6

 j

5

7

10

14

5

 

Рис. 14.  Матрица рисков и показатели эффективности стратегий.

 

Затем по формулам (14) находим показатели эффективности Si стратегий Ai.

Значение S вычисляем  по формуле (15). В данной задаче S = 5.

Согласно критерию Сэвиджа оптимальная стратегия Ak – это стратегия, для которой  Sk = S.

Этому показателю эффективности по критерию Сэвиджа соответствует стратегия  A3.

 

Результаты подсчета показателей эффективности и оптимальные стратегии представлены в следующей таблице (рис. 15).

 

Критерии:

 

 

 

 

 

 

 

 

 

 

Стратегии

Вальда

максимакса

произведений

 Гурвица

 (  = 0,4)

Обобщенный

критерий

Гурвица:  

 

 1 =  0,35; 

 2 =  0,2;

 3  = 0,2;

 4 =  0,15;

 5 =  0,1.

Сэвиджа

A1

1

14 *

 840

6,2 *

4,05

 8

A2

2

10

 1200

5,2

3,85

12

A3

3 *

 9

 3240 *

5,4

4,65 *

 5 *

A4

2

 8

 2688

4,4

4,55

 6

Рис. 15. Таблица показателей эффективности и оптимальных стратегий.

 

В результате применения шести критериев мы видим, что в качестве оптимальной стратегии четыре раза выступает стратегия A3, два раза  – стратегия A1. Поэтому, если у инвестора (игрока  A)  нет никаких обоснованных серьезных возражений, то в качестве оптимальной стратегии можно рассматривать стратегию А3.

 

 

СПИСОК РЕКОМЕНДУЕМОЙ ЛИТЕРАТУРЫ.

 

[1] Дубров А.М.,  Лагоша Б.А., Хрусталев Е.В. Моделирование рисковых ситуаций в экономике и бизнесе.- М.: Финансы и статистика, 2000. – 176 с. 

[2] Лабскер Л.Г., Яновская Е.В. Общая методика конструирования критериев оптимальности решений в условиях риска и неопределенности //Финансовый менеджмент. – 2002, № 5 – С. 13- 24.  

[3] Мушик Э., Мюллер П. Методы принятия технических решений: Пер. с нем. – М.: Мир, 1990. – 208 с., ил.

[4] Садовин Н.С., Садовина Т.Н. Основы теории игр. Учебное пособие. – Йошкар-Ола, 2011. – 119 с.

 [5] Шапкин А.С., Шапкин В.А. Теория риска и моделирование рисковых ситуаций. Учебник. - М.: Издательско-торговая корпорация «Дашков и К0», 2005. - 880 с.