Bodrenko.com
Bodrenko.org

Учебные дисциплины на сайте Bodrenko.org
Портабельные Windows-приложения на сайте Bodrenko.com
Теория игр . Аналитическая геометрия и линейная алгебра . Bodrenko.com Bodrenko.org

Методы принятия управленческих решений

 

Лекция 3

 

Тема лекции 3: «Приемы разработки и выбора управленческих решений в условиях риска и неопределенности»

 

Разделы лекции:

 

  1. Принятие решений в условиях риска и неопределенности.
  2. Технологии принятия решений в условиях поведенческой неопределенности.
  3. Технологии принятия решений в условиях полной и стохастической неопределенности.

 

РАЗДЕЛ 1. ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ РИСКА И НЕОПРЕДЕЛЕННОСТИ.

 

КАКОВЫ ОТЛИЧИТЕЛЬНЫЕ ОСОБЕННОСТИ ОБОСНОВАНИЯ РЕШЕНИЙ В УСЛОВИЯХ РИСКА И НЕОПРЕДЕЛЕННОСТИ?

 

Задачи обоснования решений в условиях неопределенности имеют ряд отличительных особенностей по сравнению с уже рассмотренными задачами на лекции 2 «Методы оптимизации для разработки и выбора управленческих решений в условиях определенности». Поскольку для задач в условиях неопределенности каждой фиксированной альтернативе соответствует не один (вполне определенный), а множество возможных результатов, ЛПР испытывает существенные затруднения в выборе наилучшей альтернативы. При принятии решения для ЛПР значимыми обстоятельствами становятся не только размерность векторного критерия и важность отдельных его компонентов, но и величины предполагаемых выигрышей и потерь в каждой ситуации, а также характеристики степени возможности проявления тех или иных исходов. Другими словами, в подобных условиях для ЛПР становится далеко не безразличной степень риска, обусловленного возможностью получения неблагоприятных результатов из-за неопределенности ситуации принятия решений. Следует иметь в виду, что, обосновывая решение в условиях риска, ЛПР вынуждено упрощать ситуацию, учитывать минимум основных компонентов. В результате при описании  рискованных исходов ЛПР оперирует значениями оценок результатов, степенью подверженности возможным потерям, а также оценками возможности получения выигрышей. Естественно, что при этом для рационально мыслящего ЛПР наименее рискованной следует признать ту альтернативу, которой одновременно присущи:

1)     наибольшая уверенность суждений об исходах;

2)     наибольшая точность оценки степени возможности исходов;

3)     наибольшая предпочтительность величины выигрышей;

4)     наибольшая вероятность выигрышей;

5)     наименьшие потери;

6)     наименьшая степень возможности подвергнуться неблагоприятному исходу.

Однако, как правило, значения указанных характеристик исхода для разных альтернатив сочетаются так, что не позволяют ЛПР сразу, с одного взгляда, вынести суждение о предпочтительности. В подобных ситуациях приходится глубже разбираться в обстоятельствах, применять специальные эвристические и формальные методы решения задачи выбора. И не всегда эти методы просты. Иная задача требует от ЛПР специальных теоретических знаний, специальных умений и т. п. Но ведь ЛПР не может (и не обязано) знать всего, что может потребоваться для решения произвольной задачи выбора в условиях риска. Следовательно, рациональный подход в изучении технологии и методов разработки решений должен состоять в том, чтобы выяснить, с какими типами «механизмов» рискованных ситуаций чаще всего сталкивается ЛПР того или иного уровня руководства. Если это будет сделано, тогда далее можно будет целенаправленно, по мере необходимости, по частям изучать сложные методы анализа риска и совершенствоваться в их применении. Выбор наилучшего решения в условиях неопределенности существенно зависит от того, какова степень этой неопределенности, т.е. от того, какой информацией располагает ЛПР. Поскольку предположения являются субъективными, постольку должны различаться степени неопределенности со стороны лица, принимающего решение.

 

КАКИЕ ОСНОВНЫЕ ПОДХОДЫ К ПРИНЯТИЮ РЕШЕНИЙ ПРИМЕНЯЮТСЯ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ И РИСКА?

 

Практикуются два основных подхода к принятию решения в условиях неопределенности. Лицо, принимающее решение, может использовать имеющуюся у него информацию и свои собственные личные суждения, а также опыт для идентификации и определения субъективных вероятностей возможных внешних условий, а также оценки, вытекающие в результате отдач, для каждой имеющейся стратегии в каждом внешнем условии. Это, в сущности, делает условия неопределенности аналогичными условиям риска, а процедура принятия решения для условий риска, выполняется и в этом случае.  На рисунке 1 представлена диаграмма упорядочения основных типов задач принятия решений в условиях неопределенности на различных уровнях иерархии управления.

 

 

Рисунок 1.  Диаграмма упорядочения основных типов задач принятия решений.

 

Упорядочение произведено на основе анализа частоты решения тех или иных «рискованных» задач ЛПР различных концептуальных уровней иерархии управления. 

 

КАКИЕ ОСНОВНЫЕ ТИПЫ ЗАДАЧ ПРИНЯТИЯ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ И РИСКА МОЖНО ВЫДЕЛИТЬ?

 

Для удобства отображения на диаграмме основным типам «рискованных» задач присвоены краткие наименования, отражающие свойства того или иного источника риска.  Так, задача принятия решений в условиях стохастической неопределенности получила краткое обозначение «Случайность», в условиях поведенческой неопределенности — «Конфликт», а в условиях действия природно-неопределенных факторов — «Природа».

 

КАКИЕ ТИПИЧНЫЕ ЗАДАЧИ ПРИНЯТИЯ РЕШЕНИЙ ВСТРЕЧАЮТСЯ НА РАЗЛИЧНЫХ КОНЦЕПТУАЛЬНЫХ УРОВНЯХ РУКОВОДСТВА?

 

На горизонтальной линии диаграммы (рисунок 1) отмечены «зоны ответственности» ЛПР на различных концептуальных уровнях руководства — «Исполнитель», «Администратор», «Руководитель звена отрасли» и «Высшее руководство». Частоты обращения ЛПР к тем или иным типам задач моделируются высотами прямоугольников и задают уровни упорядочения задач. При этом, чем высота прямоугольника больше, тем соответствующая задача чаще встречается в практике руководства ЛПР данного иерархического уровня. Внутри прямоугольников вписаны краткие наименования типов задач.  Анализ диаграммы на рисунке 1 показывает, что, например, для ЛПР уровня «Исполнитель» типичной оказывается задача принятия решений в условиях стохастического риска. Здесь действуют типичные механизмы случайности типа: ошибки измерения, поломок, отказы и т. п. Примерно такая же частота решения задач в условиях случайности наблюдается и для категории «Высшее руководство». Однако причина того, что основным типом задачи принятия решений здесь оказывается «Случайность» — иная. На столь высоком уровне руководства результат взаимодействия огромного числа взаимодействующих факторов самой разнообразной природы нивелирует их последствия до статистической закономерности. Примерно столь же часто на высшем уровне руководства приходится решать задачи в условиях природного риска. Задачи принятия решений в условиях природной неопределенности весьма характерны для деятельности «Руководителя звена», а разрешение «Конфликта» — типичная работа «Администратора» и все того же «Руководителя звена отрасли».

 

КАКИЕ ОСНОВНЫЕ  ИСТОЧНИКИ ИНФОРМАЦИИ ДЛЯ ОПРЕДЕЛЕНИЯ ТИПА НЕОПРЕДЕЛЕННОСТИ ИСПОЛЬЗУЮТСЯ НА РАЗЛИЧНЫХ УРОВНЯХ ИЕРАРХИИ УПРАВЛЕНИЯ?

 

Отметим также, что когда ЛПР анализирует проблемную ситуацию с неопределенным исходом, оно одновременно принимает для себя решение о том, каков «ведущий тип неопределенности». В основу суждения им кладутся информация, полученная на основе объективных научных данных, сообщения по линии средств массовой информации, личные наблюдения (собственные представления о типе механизма ситуации), мнения экспертов, слухи и многое другое. Но хорошо известно, что на разных уровнях иерархии управления ЛПР по-разному оценивают точность, надежность, достоверность сведений, поступающих из разных источников. Другими словами, они по-разному им верят, придают разный вес. Степень доверия ЛПР информации о типе риска, природе «механизма ситуации», полученной из того или иного источника, также удобно отобразить в виде прямоугольной диаграммы. На рисунке 2 представлена диаграмма упорядочения источников информации для принятия решения о типе «механизма ситуации» для ЛПР на различных уровнях иерархии управления.

 

 

Рисунок 2. Диаграмма упорядочения источников информации для принятия решения о типе «механизма ситуации» для ЛПР на различных уровнях иерархии управления.

 

Так, из анализа диаграммы на рисунке 2 следует, что на уровне «Исполнителя» в качестве основных источников информации рассматриваются слухи и сведения, полученные из средств массовой информации. А вот на уровне «Высшего руководства» предпочитают больше доверять объективным научным данным, а также личным наблюдениям и опыту. «Администратору» в силу особенностей его деятельности почти не приходится оперировать точными научными данными. Он действует, используя в основном текущую информацию, слухи, опираясь на интуицию и личный опыт. Что касается «Руководителя звена отрасли», то львиную долю необходимой для руководства информации такое ЛПР получает от своего ближайшего окружения, на уровне слухов. Однако статус такого руководителя требует от него постоянно прибегать к информации из официальных источников, справочников, из приказов вышестоящего руководства и должностных инструкций, а также из средств массовой информации. Это, в определенной степени, делает его заложником навязываемых извне мнений, сковывает личную инициативу для принятия решений о типе «механизма ситуации». Следовательно, все из перечисленных обстоятельств также будут влиять на то, какой из возможных типов неопределенности ЛПР отнесет к «ведущему типу» и какие модели анализа решений ЛПР применит. И все же, ради систематизации знаний, ради перспективы целесообразно обязательно получить хотя бы минимум теоретических знаний по каждому из известных методов обоснования решений в условиях полной неопределенности и риска.

 

КАКОВЫ ОСНОВНЫЕ СОСТАВЛЯЮЩИЕ РИСКА, ВИДЫ РИСКОВ, ИСТОЧНИКИ ИХ ПОЯВЛЕНИЯ?

 

Рискуют всегда конкретные люди. Иных заставляют рисковать их амбиции, стремление к лидерству, честолюбие или авантюризм. Других толкает на риск профессия, их социальный и общественный статус. Любая организация, чтобы добиться высокой эффективности своего функционирования, действует в соответствии с принципом разделения труда. В таком случае одни отдают распоряжения и несут ответственность за их последствия, другие — выполняют конкретные поручения и здесь добиваются успеха или их постигает неудача. Другими словами, и одни и другие рискуют, но по-своему. В то же время разделение труда предполагает, в первую очередь, делегирование определенных полномочий и свободы принятия решений членам организации. И здесь кроется определенная ловушка для организации: индивидуальный риск отдельного субъекта становится ее риском. Кроме того, следует иметь в виду, что на различных должностях, для разных статусов субъектов уровни риска могут существенно различаться, однако сказать, кто или что "главный источник риска" подчас далеко не просто. Поэтому ответы на вопросы об источниках и составляющих риска, несомненно, помогут грамотному управленцу принять верное решение и о расстановке кадров, и о том, какими полномочиями их наделить, и о том, каких рискованных последствий от деятельности подчиненных следует ждать.  Каковы же основные составляющие риска, виды рисков, источники их появления?

 

На рисунке  3  представлена схема, отображающая составляющие риска.

 

КАКИЕ ГЛАВНЫЕ СОСТАВЛЯЮЩИЕ РИСКА МОЖНО ВЫДЕЛИТЬ?

 

В зависимости от того, какие группы факторов в наибольшей степени определяют риск в проблемной ситуации, выделены две главные составляющие риска: индивидуальный и ситуационный. Индивидуальный риск обусловлен исключительно самим субъектом, принимающим решения и проводящим операцию. В то же время человек как часть общества, организации, действует в соответствии со своей профессией и с занимаемой должностью, вступает в деловые контакты, отдает распоряжения и исполняет чужие решения. Все это определяют его общественная роль, социальный статус. Так, например, охранник фирмы обязан рисковать, не только выполняя конкретную поставленную ему задачу, но помимо этого — прикрывать товарищей, спасать жизнь руководителю. К ситуационной составляющей риска отнесем все, что непосредственно не зависит от рискующего индивида, а составляет, так сказать, операциональный контекст.

 

КАКОВЫ ИСТОЧНИКИ ИНДИВИДУАЛЬНОГО РИСКА?

 

На рисунке 4 приведены источники индивидуального риска.

 

 

 

 

Рисунок 4. Источники индивидуального риска.

 

Ясно, что практически в любой операции ЛПР испытывает ряд затруднений из-за того, что ему не хватает или времени, или ресурсов, или информации для принятия решений и проведении операции. Кроме того, интересы и действия других лиц, втянутых в операцию ЛПР, возможно, даже против их воли, могут существенно повлиять на качество исхода операции, а иногда даже — привести к срыву операции ЛПР. Следовательно, для ЛПР важно знать и учитывать возможные ответы на следующие вопросы.

 

- Кто эти другие субъекты, чьи интересы затрагиваются операцией, проводимой ЛПР?

- Почему это их «трогает» и почему они будут реагировать?

- Как конкретно могут отреагировать эти «другие лица» на действия ЛПР и в какой форме?

- С какой интенсивностью будут протекать эти реакции и будут ли они кратковременными, «взрывными» или примут «затяжной» характер, будут ли достаточно устойчивыми во времени?

- Какие дополнительные решения в связи с этим потребуется принять?

 

От полноты и правильности ответов на подобные вопросы зависят подверженность ЛПР ущербу и сам возможный ущерб его интересам. Ведь, в конечном итоге людьми всегда управляют их интересы. Наконец, значительный риск возникает при принятии ЛПР решений без учета того, какой уровень потребностей других лиц эти решения затрагивают. Например, большинство решений человека, связанных с удовлетворением его личных потребностей, связанных с обеспечением необходимой защиты и безопасности, с биологическим выживанием для него и его семьи, заставляют его подчас жестоко рисковать. Решение указанных «бытовых» проблем довлеет над психикой человека, делает его эгоистичным, заставляет проявлять невиданную склонность к риску. А раз это так, то ЛПР следует помнить, что чем более низкий уровень потребностей субъекта затрагивает деятельность ЛПР, тем более решительно будет действовать этот субъект ради удовлетворения своих потребностей. Другими словами, если ЛПР не хочет сознательно повышать ситуационный риск, ему не следует без необходимости своими действиями затрагивать первичные потребности и интересы других людей. И еще. Чем сильнее у субъекта агрессивные установки и потребность в доминировании, тем более высокий уровень риска он допускает.

 

КАКОВЫ ИСТОЧНИКИ СИТУАЦИОННОГО РИСКА?

На рисунке 5 представлены источники ситуационного риска.

Рисунок 5. Источники ситуационного риска.

 

Необходимо отметить, что, как правило, решения, принимаемые коллегиально, оказываются более рискованными, чем принимаемые индивидуально. Решения, последствия которых проявляются спустя значительное время, также обычно более рискованные, чем решения, чьи последствия проявляются почти мгновенно или с небольшой задержкой после их реализации. А как насчет нерешительности, которая также может быть источником риска? Оказывается, что нерешительность чаще всего проявляется и имеет наиболее тягостные последствия во время принятия решений стратегического характера, на уровне «Высшего руководства».  Кроме того, нерешительность возникает на любом уровне, когда у ЛПР есть трудности в оценке полезности альтернатив или когда оценки полезности близки по величине. К сожалению, знание этих закономерностей не означает, что ЛПР успешно может этим знанием воспользоваться. Руководители разного уровня часто ошибочно полагают, что если некая организационная структура или некий род деятельности прекрасно «работают» на бумаге, то они также хорошо будут работать и в жизни. Это далеко не так. Прежде всего, он должен подбирать людей на должности так, чтобы было как можно большее соответствие их личной склонности к риску и тем уровнем риска, который эта должность допускает. Нужно обучать будущих исполнителей знаниям и умениям по занимаемой должности. Но при этом постоянно помнить, как сказал Монтень, что можно передать знания и опыт, но нельзя передать умения воспользоваться ими. Поэтому нужно готовить исполнителей так, чтобы они постепенно приобрели такое умение — воспользоваться в нужный момент приобретенными знаниями. А это возможно, только если обучение и тренировки не будут идти по шаблону. Для снижения уровня риска ЛПР должно конкретно ставить исполнителям задачу и одновременно сообщать им четкие критерии  достижения цели, предоставлять исполнителям необходимую свободу принятия локальных решений в рамках конкретных обстоятельств.   В целях снижения уровней риска ЛПР обязано лично постоянно координировать работу исполнителей и побуждать их выполнять ее как можно более качественно. Короче говоря, ЛПР должно РУКОВОДИТЬ. Руководство должно быть непрерывным. Оставаясь длительное время без руководства, любое дело, как и автомобиль, может двигаться только в одном направлении — под откос! Таким образом, для обеспечения необходимого соответствия между возможным уровнем индивидуального риска в операции и допустимым, для обеспечения наименьшего уровня ситуационного риска ЛПР следует хорошо знать составляющие риска в операции и особенности проявления тех или иных из них.

 

РАЗДЕЛ 2. ТЕХНОЛОГИИ ПРИНЯТИЯ РЕШЕНИЙ В УСЛОВИЯХ ПОВЕДЕНЧЕСКОЙ НЕОПРЕДЕЛЕННОСТИ.

 

Пусть теперь главным фактором, определяющим «механизм проблемной ситуации», оказывается поведение одного или нескольких субъектов, оказавшихся втянутыми в операцию ЛПР и вынужденных взаимодействовать с ним, возможно, даже против своей воли. Чтобы при изложении материала однозначно понимать, кто есть кто, будем ЛПР, в интересах которого мы вырабатываем решения, называть «наше ЛПР», а остальных самостоятельно действующих суверенных субъектов — «другие ЛПР». Эти «другие ЛПР» на самом деле могут и не противостоять «нашему ЛПР», и не желать ему зла. Однако «нашему ЛПР» при обосновании им своих решений важно знать, как эти «другие» поступят или могут поступить. Если такой информации у «нашего ЛПР» не будет, то у него не будет иного выхода, как воспринимать «других ЛПР» как агрессивную среду. Причин подобного отношения к проблемной ситуации у ЛПР может быть несколько:

1) «наше ЛПР» точно знает, что его интересы вошли в противоречие, столкнулись с интересами «других ЛПР»;

2) «наше ЛПР» не знает, являются ли его устремления конфликтующими с интересами «других ЛПР», однако что-то заставляет его опасаться, что это так;

3) «наше ЛПР» знает, что его интересы совпадают с интересами «других ЛПР», что объективно оно желает им добра, однако эти «другие ЛПР» могут этого не понять или не принять из-за различия в позициях, точек зрения, культурных традиций, а это обязательно приведет к столкновению;

4) «наше ЛПР» знает, что иных субъектов кроме него в операции нет и действовать оно будет в объективной обстановке («в природе»); однако эта «природа» — «terra incognita». Поэтому ЛПР опасается подобной неопределенности, непредсказуемости, боится ее. Из-за этого ЛПР вынуждено считать «природу» как бы агрессивной, принимать ее возможные проявления как действия агрессивно настроенного «другого ЛПР».

 

Разработкой технологий и методов разработки решений в перечисленных проблемных ситуациях занимаются психологическая теория решений и теория игр. Но это своеобразные и сложные дисциплины. Воспользоваться напрямую результатами этих двух теорий обыкновенному управленцу, не специалисту по ТПР, не математику подчас довольно трудно. Например, только по-крупному в психологической теории решений выделяют психологию поведения индивида, психологию малых групп, психологию масс. В теории игр аналогично рассматривают игры двух и N лиц, антагонистические и неантагонистические игры, матричные, биматричные, оперативные игры и т. д. Даже альтернативы ЛПР в теории игр принято называть стратегиями, чтобы подчеркнуть принципиальное отличие подобных проблемных ситуаций от иных. Не раз в литературе подчеркивалось, что именно в подобных проблемных ситуациях значительную роль в выборе наилучшей стратегии играют искусство, интуиция, мнения и иллюзорные оценки ЛПР, а не наука, не строгий расчет, не строгие измерения. Однако современные достижения в теории игр более чем скромны, если применять критерии типа «искусство», «интуиция», «мнения» и т. п. В общем, трудно не специалисту! А как же быть? Постараться применить моделирование.

 

КАКИЕ МАТЕМАТИЧЕСКИЕ МЕТОДЫ ПРИМЕНЯЮТСЯ ДЛЯ ИЗУЧЕНИЯ И АНАЛИЗА КОНФЛИКТОВ?

 

В практических ситуациях часто появляется необходимость согласования действий компаний, объединений, министерств и других участников проектов в случаях, когда их интересы не совпадают. В подобных ситуациях теория стратегических игр позволяет найти оптимальное решение для поведения всех участников проектов, обязанных согласовывать действия при столкновении интересов.  Риск и неопределенность исходов игры обусловлены случайным состоянием среды, или выбором образа действия противоположной стороны, или вероятностным характером появления желаемого результата по возможным стратегиям. 

 

В практической деятельности часто приходится рассматривать явления и ситуации, в которых участвуют две (или более) стороны, имеющие различные интересы и обладающие соответствующими возможностями применять для достижения своих целей разнообразные действия. Подобные явления и ситуации называются конфликтными или просто конфликтами.

 

Типичная конфликтная ситуация характеризуется тремя основными составляющими:

 

1) заинтересованными сторонами (это потребители, фирмы, отдельные страны, финансовые и экономические союзы и т. д.);

2) интересами сторон (удовлетворение различных финансовых, экономических и политических потребностей, вытеснение конкурентов с рынка сбыта, повышение доходов и т. д.);

3) их возможными действиями (выбор объема потребления, способы формирования инвестиционного портфеля, выбор объема производства, выбор дивидендной политики и «демпинговая» политика и т. д.).

 

Любая конфликтная ситуация, взятая из реальной жизни, как правило, довольно сложна.  Ее изучение затруднено наличием многих разных обстоятельств, часть из которых не оказывает сколь-нибудь существенного влияния ни на развитие конфликта, ни на его исход. Поэтому для того, чтобы анализ конфликтной ситуации оказался возможным, необходимо удалить эти второстепенные факторы, что при удачном стечении обстоятельств позволяет построить упрощенную формализованную математическую модель конфликта, которую принято называть игрой и которая отличается от реальной конфликтной ситуации еще и тем, что ведется по вполне определенным правилам. Необходимость изучения и анализа конфликтов, представляемых в виде упрощенных моделей (игр) вызвала к жизни специальный математический аппарат — теорию игр. Обычно теорию игр определяют как раздел математики для изучения конфликтных ситуаций. Это значит, что можно выработать оптимальные правила поведения каждой стороны, участвующей в разрешении конфликтной ситуации. Кроме того, в экономике, например, оказался недостаточным аппарат математического анализа, занимающийся определением экстремума функций. Появилась необходимость изучения так называемых оптимальных минимаксных и максиминных решений. Следовательно, теорию игр можно рассматривать как раздел методов оптимизации, позволяющий решать задачи теории принятия решений, в частности управленческих решений в экономике.  Модельными компонентами теории игр являются игроки, цели игроков, доступная игрокам информация для принятия решений и правила реализации игроками собственных стратегий (осуществления ходов в игре). В зависимости от того, как конкретно сочетаются перечисленные элементы игр, их относят к тому или иному классу. В качестве классификационных признаков, характеризующих ту или иную игру, обычно используют следующие признаки:

 

1)     количество субъектов (игроков), интересы которых затрагиваются при проведении операции и которые могут влиять на ее результаты, а также возможность создания коалиций игроков;

2)     тип отношений между игроками, возникающих при стремлении игроков обеспечить наивыгоднейшее положение в игре для себя;

3)     возможность обмена информацией между игроками в целях сообщения своих возможных стратегий и оценочных функций;

4)     возможность образования коалиций игроков;

5)     типы множеств стратегий игроков;

6)     типы шкал для описания функций выигрышей игроков;

7)     возможность провести лишь небольшое количество (в частности — только одну) или достаточно много партий игры.

 

Например, по количеству игроков выделяют парные  множественные игры (игры N лиц); по типу отношений между игроками — игры со строгим соперничеством, нестрогим соперничеством или содействием друг другу; по возможности обмена информацией между игроками — кооперативные и некооперативные; по возможности образования коалиций игроков — коалиционные и бескоалиционные и др.

 

Математико-игровые модели находят свое применение не только в конфликтных ситуациях социально-экономической области, но и во взаимодействии человека с природой, в политике биологии, военной области и т. д.  Игра — это упрощенная формализованная модель реальной конфликтной ситуации. Формализация означает выработку определенных правил действия сторон в процессе игры: варианты действия сторон, исход игры при данном варианте, степень информированности каждой стороны о поведении всех других сторон. Заинтересованные играющие стороны (в частности, лица) называются игроками. Причем одну играющую сторону может представлять как один игрок, так и целый коллектив. Стратегией игрока называется любое возможное для игрока действие в рамках заданных правил игры. В условиях конфликта каждый игрок выбирает свою стратегию, в результате чего складывается набор стратегий, называемых ситуацией. Заинтересованность игроков в ситуации проявляется в том, что каждому игроку в каждой ситуации приписывается число, выражающее степень удовлетворения его интересов в этой ситуации и называемое его выигрышем в ней. Хотя не каждый выигрыш можно оценить количественно, но в теории игр качественные выигрыши не рассматриваются. Отметим также, что оценка игроком ситуации путем указания его количественного выигрыша, вообще говоря, возможна не всегда, а иногда просто не имеет смысла.  В этом случае численное значение выигрыша в каждой ситуации заменяют на сравнительную предпочтительность ситуаций для отдельных игроков. Что касается типов шкал для описания функций выигрышей игроков, то различают игры с предпочтениями (шкалы качественные) и игры с полезностями (шкалы количественные). Тогда речь ведут о теории игр с предпочтениями, которая включает в себя теорию игр с выигрышами как частный случай.

 

Основной целью теории игр является выработка рекомендаций для удовлетворительного поведения игроков в конфликте, то есть выявления для каждого из них «оптимальной стратегии».  Понятие оптимальной стратегии — одно из важнейших понятий теории игр, может пониматься в различных смыслах в зависимости от показателя оптимальности (эффективности). Стратегия, оптимальная по одному показателю, может не быть оптимальной по другому показателю. Поэтому чаще всего оптимальная стратегия, определенная в результате применения теории игр к реальным конфликтным ситуациям, является оптимальной теоретически и в большинстве случаев реально удовлетворительной.

 

Изучить все типы игр одинаково хорошо и сразу вряд ли удастся. Как всегда, следует сосредоточиться на чем-то и пожертвовать чем-то другим. При этом по-прежнему главным ключом разрешения этого познавательного затруднения следует выбрать уровень иерархии управления «нашего ЛПР» и перечень решаемых им задач.

 

Так, например (рисунок 1), мы уже отмечали, что «Исполнителю» почти не приходится сталкиваться с поведенческой неопределенностью. А вот если взять концептуальный уровень типа «Администратор», то здесь все как раз наоборот. Как правило, главный тип неопределенности, с которым приходится сталкиваться такому «нашему ЛПР» — это «Конфликт». Теперь можем уточнить, что обычно это нестрогое соперничество. Несколько реже «Администратор» принимает решения в условиях «природной неопределенности», и еще реже он сталкивается со строгим, антагонистическим конфликтом. Кроме того, столкновение интересов при принятии решений «Администратором» происходит, так сказать, «однократно», т. е. в нашей классификации он чаще разыгрывает только одну (иногда весьма небольшое количество) партий игры. Шкалы для оценки последствий чаще качественные, чем количественные. Стратегическая самостоятельность у «Администратора» довольно ограничена. Принимая во внимание сказанное, можно утверждать, что проблемные ситуации подобного масштаба чаще всего приходится анализировать с помощью бескоалиционных неантагонистических биматричных игр, причем, в чистых стратегиях. Если рассматривается проблемная ситуация на уровне «Руководитель звена отрасли», то здесь примерно одинаково часто приходится сталкиваться с природной неопределенностью или строгим конфликтом с повторяющимися ситуациями. Адекватными здесь будут методы теории игр с природой и решения матричных или биматричных игр в смешанных стратегиях. Для обоснования решений на уровне «Высшее руководство» в наибольшей степени подходят модели биматричных игр с угрозами, модели группового выбора и игр N лиц, а также особый игровой подход к разрешению поведенческой неопределенности — деловые беседы.

 

В ЧЕМ ЗАКЛЮЧАЕТСЯ СУЩНОСТЬ ТЕХНОЛОГИИ ПРЕДВАРИТЕЛЬНОГО АНАЛИЗА ПРОБЛЕМНОЙ СИТУАЦИИ С ИСПОЛЬЗОВАНИЕМ ТЕОРИИ МАТРИЧНЫХ ИГР?

 

Разработку решений в условиях поведенческой неопределенности целесообразно декомпозировать по этапам усложняющегося использования информации о проблемной ситуации. На первом этапе целесообразно провести предварительный анализ собственных стратегических возможностей при упрощенном подходе к обоснованию решений в схеме «один против всех». При этом для повышения надежности представлений, выводов и рекомендаций целесообразно предварительные оценки получить в качественных шкалах и без учета поведения «других ЛПР» как самостоятельных субъектов. Затем следует уточнить шкалы измерения предпочтений, а затем на основе дополнительной информации или рефлексий уточнить собственные предпочтения и предпочтения отдельных субъектов среди «других ЛПР». На завершающем этапе разработки решений следует оценить возможности блефа, угроз, кооперирования и вступления в коалиции с некоторыми из «других ЛПР». В целом использование принципов рефлексии и адаптации потенциально позволяет существенно повысить ожидаемую выгодность будущей стратегии поведения «нашего ЛПР». Итак, предварительный формальный анализ проводим в наиболее простой форме, а именно — для однократно разыгрываемой парной бескоалиционной некооперативной игры со строгим соперничеством и дискретными множествами стратегий игроков. Математической формой такой конфликтной ситуации является матричная игра в чистых стратегиях. В стратегических играх создание модели должно начинаться с построения платежной матрицы. Это наиболее трудоемкий и ответственный этап подготовки принятия решения, так как ошибки в платежной матрице не могут быть компенсированы никакими вычислительными методами и могут привести к неверному итоговому результату.

 

КАКИМИ МЕТОДАМИ РЕАЛИЗУЕТСЯ ТЕХНОЛОГИЯ ПРЕДВАРИТЕЛЬНОГО АНАЛИЗА ПРОБЛЕМНОЙ СИТУАЦИИ С ИСПОЛЬЗОВАНИЕМ ТЕОРИИ МАТРИЧНЫХ ИГР?

 

Матричные игры исследуют на основе принципа наибольшего гарантированного результата. Понятие гарантированного результата базируется на гипотезе о крайне неблагоприятном стечении обстоятельств для ЛПР. Согласно принципу наибольшего гарантированного результата рациональным следует считать такое поведение, которое обеспечивает наилучший из самых неблагоприятных результатов. В силу этого данный принцип часто называют принципом максимина (хотя, как это будет показано ниже, подобное утверждение не всегда семантически корректно). Помимо принципа наибольшего гарантированного результата руководствуются также принципом равновесия. Принцип равновесия означает, что рациональным поведением субъектов операции следует считать такое, при котором каждый из них стремится к ситуации, обеспечивающей ему наибольший гарантированный результат, отклонение от которой невыгодно никому.

 

Количественный анализ на основе применения принципов наибольшего гарантированного результата и равновесия ведется по следующей технологической схеме:

1)     формирование игры, т. е. множеств возможных стратегий игроков;

2)     оценка величин результатов, получаемых субъектами в каждой из ситуаций (предпочтительнее качественная шкала);

3)     выделение множества недоминируемых стратегий для каждого из игроков;

4)     выбор наилучшего варианта решения на основе принципов наибольшего гарантированного результата и равновесия.

 

Пусть первый игрок — это «наше ЛПР», а все остальные (если их несколько) — «другое ЛПР», или — второй  игрок. Обозначим через A и B множества стратегий первого и второго игроков соответственно. Для проведения формального анализа обозначим через v1(a, b), v2(a, b) оценочные функции игроков, заданных на множестве (а,b) ситуаций игры.  Эти функции скалярные, шкала их значений должна позволять оценивать как минимум «Тенденции». Качественная шкала «тенденций» позволит сравнительно легко упорядочить ситуации (а, b) игры по предпочтительности. Затем на качественной шкале вводят градации, чтобы можно было бы выявить хоть какие-то пропорции. Далее вводят допущение о том, что первый игрок выигрывает ровно столько, сколько ему проигрывает второй, и на этом основании полагают v1(a, b) = - v2 (a, b). После этого можно оставить только одну из оценочных функций, например функцию первого игрока, которая будет адекватно описывать предпочтительность исходов игры. Для определенности будем полагать, что это функция v(a,b) = v1 (a,b), т. е. она совпадает с оценочной функцией первого игрока. Чтобы сформировать матричную игру, сначала нужно сформировать множества стратегий игроков. Каждое из них должно быть обозримым. Достичь этого можно благодаря принципам цели, декомпозиции и композиции.

 

Как нам известно, любая альтернатива ЛПР может быть описательно задана следующими основными ее элементами:

• что сделать? — определяется целью предстоящих действий;

• когда? где? с помощью чего сделать? — диктуется обстоятельствами времени, места, характеристиками имеющегося активного ресурса;

• на что направить усилия? — определяется объектом приложения усилий.

 

Если зафиксировать некоторые из перечисленных элементов альтернативы, а остальные изменять по определенным правилам, то можно формировать различные варианты действий.

Именно эта схема положена в основу большинства из известных методов формирования вариантов решения, однако все они различаются степенью формализации основных операций. Обычно при формировании игры эвристические методы применяют одновременно с рефлексивными, которые как раз и ориентированы на случай, когда ведущим типом неопределенности является поведенческая. Вначале эвристически формируют множество стратегий первого игрока. В него включают альтернативы, которые обеспечивают достижение цели первого игрока хотя бы в принципе. Затем из полученного множества отсеиваются физически нереализуемые альтернативы, т. е. те, которые не могут быть осуществимы в отведенные на операцию сроки. Полученное множество дополняют альтернативами, придающими стратегиям гибкость и устойчивость. При этом руководствуются двумя основными идеями. Во-первых, стремятся обеспечить некую инвариантность, примерно одинаковую приемлемость альтернатив ЛПР по отношению к изменяющимся или неизвестным на данный момент составляющим условий проведения операции. Предпочтение следует отдавать тем стратегиям, которые можно оперативно, сравнительно просто и с незначительными потерями ресурсов скорректировать, когда прояснится обстановка. Во-вторых, следует внимательно изучить всю информацию о личности второго игрока. Главное внимание при этом сосредоточить на его морально-ценностных ориентирах и предпочтениях, сделать вывод о его подозрительности или доверчивости, самоуверенности или нерешительности, его склонности или несклонности к риску и др. Выводы из подобной оценки помогут первому игроку эффективно использовать блеф и сгенерировать достаточное количество псевдостратегий. При генерации псевдостратегий следует помнить важный принцип блефа: все, что привлекает внимание конкурента, может быть использовано в качестве приманки. Например, тщеславного, самоуверенного, рискованного субъекта с низкими моральными качествами, несомненно, соблазнит то, что вы, как его конкурент, выглядите слабым, неопасным и даже — не очень привлекательной жертвой. В подобной ситуации такое ваше поведение обычно провоцирует самоуверенного конкурента не очень скрывать от вас свои планы, подталкивает его к использованию не самых сильных его стратегий. Наоборот, если конкурент осторожен, неуверен, чрезмерно пессимистичен и т. п., вам следует показать себя сильным, решительным, готовым к самым безрассудным поступкам. Тогда вы сможете достаточно уверенно предположить, что или он задействует самые сильные из его стратегий, которые вы можете себе представить, или пойдет на уступки и переговоры. В любом случае у вас появится достаточная уверенность в том, какая ситуация в конфликте сложится, а это совсем немало.   Как только матричная игра сформирована, приступают к поиску ее решения на основе принципов рационального поведения.

 

ОСНОВНЫЕ ПОНЯТИЯ МАТРИЧНОЙ ИГРЫ.

 

Рассмотрим простейшую статическую модель — матричную игру, в которой участвуют два игрока, множество стратегий каждого из игроков конечно, а выигрыш одного игрока равен проигрышу другого. Для того чтобы составить экономико-математическую модель конфликтной  ситуации в виде матричной игры, необходимо построить матрицу выигрышей. Это весьма нетривиальная задача особенно для игр большой размерности. В общем виде матрица игры (платежная матрица) строится следующим образом:

1)      перечисляем все возможные чистые стратегии  Ai и Bj игроков;

2)        формализуем правила, по которым развивается конфликт, в виде функции выигрышей

 

В общем случае  платежная матрица матричной игры является прямоугольной (рисунок 6).

 

     Игрок 2

 

Игрок 1

B1

B2

Bn

A1

a11

a12

a1n

A2

a21

a22

a2n

Am

am1

am2

amn

 

        

 

Рисунок 6. Платежная матрица.

 

Номер строки матрицы соответствует номеру стратегии, применяемой игроком 1. Номер столбца соответствует номеру стратегии игрока 2. Выигрыш игрока 1 является элементом матрицы. Выигрыш игрока 2 равен проигрышу игрока 1.  Матричные игры всегда имеют решения в смешанных стратегиях. Они могут быть решены методами линейного программирования.

 

ИСХОДНАЯ МОДЕЛЬ МАТРИЧНОЙ ИГРЫ. ПОНЯТИЕ НУЛЕВОЙ СУММЫ. ПЛАТЕЖНАЯ МАТРИЦА.

 

Пусть игрок 1 («наше ЛПР») имеет m стратегий A1, A2, …,  Am , а игрок 2 имеет n  стратегий B1, B2, …, Bn . Игра может быть названа «игрой m x n».  Представим матрицу эффективности (платежную матрицу) игры двух лиц с нулевой суммой, сопроводив ее необходимыми обозначениями (рисунок 8).

          

     Игрок 2

 

Игрок 1

B1

B2

Bn

αi

A1

a11

a12

a1n

α1

A2

a21

a22

a2n

α2

Am

am1

am2

amn

αm

βj

β1

β2

βn

 

 

Рисунок 8.  Платежная матрица игры «m x n».

 

В данной матрице элементы aij — это значения выигрышей игрока 1, они могут означать и  математическое ожидание выигрыша (среднее значение), если выигрыш является случайной величиной.

Величины α1, α2, …, αm – это минимальные значения элементов a ij по строчкам.

Величины β1, β2, …, βn – это максимальные значения элементов  a ij по столбцам.

 

Их содержательный смысл будет отражен ниже.

 

Рассмотрим матричную игру, представленную матрицей выигрышей m x n,  где число строк  равно  числу m, а число столбцов равно  числу  n (рисунок 8).

 

Применим принцип получения максимального гарантированного результата при наихудших условиях.

 

Игрок 1 («наше ЛПР») стремится принять такую стратегию, которая должна обеспечить максимальный проигрыш игрока 2.

 

Соответственно игрок 2 («другое ЛПР») стремится принять стратегию, обеспечивающую минимальный выигрыш игрока 1.

 

Рассмотрим оба этих подхода.

 

Подход игрока 1 («наше ЛПР»). Он должен получить максимальный гарантированный результат при наихудших условиях.

 

Значит, при выборе отвечающей этим условиям своей чистой i-й стратегии (на рисунке 8 этой стратегии соответствует i-я строка выигрышей) он должен выбрать гарантированный результат в наихудших условиях, т.е. наименьшее значение своего выигрыша a ij , которое обозначим αi  .

 

Чтобы этот гарантированный эффект в наихудших условиях был максимальным, нужно из всех αi выбрать наибольшее значение. 

 

Обозначим его α  и назовем чистой нижней ценой  игры («максимин»): 

 

 

Таким образом, максиминной стратегии отвечает строка матрицы, которой соответствует элемент α. Какие бы стратегии ни применял игрок 2, игрок 1 максиминной чистой стратегией гарантировал себе выигрыш не меньший, чем α.

Таково оптимальное поведение игрока 1.

 

Подход игрока 2 («другое ЛПР»). Своими оптимальными стратегиями он стремится уменьшить выигрыш игрока 1, поэтому при каждой j-й чистой стратегии он отыскивает величину своего максимального проигрыша βj в каждом j-м столбце

 

То есть игрок 2  определяет максимальный выигрыш игрока 1, если игрок 2 применит j-ю чистую стратегию.

 

Из всех своих n чистых стратегий B1, B2, …, Bn  игрок 2 отыскивает такую, при которой игрок 1 получит минимальный выигрыш, то есть  игрок 2 определяет  - чистую верхнюю цену игры («минимакс»):

 

Чистая верхняя цена игры показывает, какой максимальный выигрыш может гарантировать игрок 1, применяя свои чистые стратегии, – выигрыш, не меньший, чем α.

 

Игрок 2 за счет указанного выше выбора своих чистых стратегий не допустит, чтобы иuрок 1 мог получить выигрыш, больший, чем β. Таким образом, минимаксная стратегия отображается столбцом платежной матрицы, в котором находится элемент β (рисунок 8).

 

Она является оптимальной чистой гарантирующей стратегией игрока 2, если он ничего не знает о действиях игрока 1.

 

Чистая цена игры ν   есть  цена данной игры, если нижняя и верхняя ее цены совпадают, то есть

 

В этом случае игра называется игрой с седловой точкой.

 

ПРИМЕР 1. Определить верхнюю и нижнюю цены при заданной матрице игры и указать максиминную и минимаксную стратегии.

 

Задана матрица игры (рисунок 9).

            

     Игрок 2

 

Игрок 1

B1

B2

B3

αi

A1

2

1

3

1

A2

4

5

6

4

βj

4

5

6

 

 

Рисунок 9. Матричная игра 2 x 3 с седловой точкой.

 

Решение. Определим нижнюю цену игры α:

α 1 = 1; α 2 = 4; α = 4 (см. столбец αi).

Определим верхнюю цену игры β:

β 1 = 4; β 2 = 5;  β 3 = 6;  β = 4 (см. строку βj).

Таким образом, α = β = 4, т.е.

 

 

Значит, α = β = ν  = 4 – чистая цена игры при стратегиях А2 и В 1 .  Следовательно, имеем игру с седловой точкой. Максиминная стратегия игрока 1: A2, минимаксная стратегия игрока 2: B1.

 

Стратегии игроков, определенные по принципам максимина и минимакса, будут удовлетворять принципу равновесия, если реализуемая ситуация (a*, b*) обеспечивает равенство нижней и верхней цены игры. То есть игра имеет ситуацию равновесия в чистых стратегиях. Если равновесный по степени его предпочтительности не устраивает первого игрока, то ему следует либо попробовать сформировать новую игру с использованием других стратегий, либо оценить возможности введения в игру стратегий угроз, либо пойти со вторым игроком на переговоры и тогда — заняться планированием деловой беседы. В общем случае ситуация в максиминных стратегиях не всегда является равновесной. Рассмотрим следующий пример.

 

ПРИМЕР 2. Определим максиминную и минимаксную стратегии игроков при заданной платежной матрице (рисунок 10).

 

     Игрок 2

 

Игрок 1

B1

B2

B3

B4

αi

A1

2

7

9

10

2

A2

8

5

4

6

4

βj

8

7

9

10

 

 

Рисунок 10. Матричная игра «2 x  без седловой точки.

 

Решение. Определим максиминную стратегию:

 

α 1 = 2; α 2 = 4; α = 4 (см. столбец αi).

 

Максиминная стратегия игрока 1 –  А2 .

 

Определим минимаксную стратегию:

 

β 1 = 8; β 2 = 7;  β 3 = 9;   β 4 = 10; β = 7 (см. строку βj).

 

Минимаксная стратегия  игрока 2:  В2 . Здесь α< β, следовательно, седловой точки нет.

 

КАКОВЫ ОСОБЕННОСТИ ВЫБОРА ОПТИМАЛЬНЫХ СТРАТЕГИЙ В МАТРИЧНОЙ ИГРЕ?

 

1.      В игре с седловой точкой.

Если матрица игры содержит элемент, минимальный в своей строке и максимальный в своем столбце, то он, как уже сказано выше, является седловой точкой. В этом случае мы имеем игру с седловой точкой.

Если в игре с седловой точкой один игрок придерживается седловой точки, тогда другой получит лучший результат, если также будет придерживаться этой точки. Лучшее поведение игрока не должно повлечь уменьшение его выигрыша. Зато худшее поведение может привести к этому. В данном случае решением игры являются:

 

чистая стратегия игрока 1;

чистая стратегия игрока 2;

седловой элемент.

 

В данном случае оптимальные чистые стратегии – это чистые стратегии, образующие седловую точку.

 

2.      В игре без седловой точки.

Если игрок 1 информирован о стратегии, принятой игроком 2, он сможет принять оптимальную стратегию, которая не совпадает с максиминной.

 

Рассмотрим следующий пример.

 

ПРИМЕР 3. Дана матрица игры (рисунок 11):

 

     Игрок 2

 

Игрок 1

B1

B2

B3

B4

B5

αi

A1

7

5

3

6

11

3

A2

8

4

6

7

9

4

βj

8

5

6

7

11

 

 

Рисунок 11. Матричная игра «2 x  без седловой точки.

 

Определим минимаксную стратегию игрока 2:

 

β 1 = 8; β 2 = 5;  β 3 = 6;   β 4 = 7;    β 5 = 11; β = 5 (см. строку βj).

Верхняя цена игры β = 5; минимаксная стратегия  игрока 2 –  В2 .

Допустим, что игроку 1 стало известно, что игрок 2 принял минимаксную стратегию. Игрок 1 должен выбрать оптимальную стратегию при условии, что В2 – стратегия игрока 2 (β =5).

 

Решение. Определим максиминную стратегию игрока 1:

 

α 1 = 3; α 2 = 4; α = 4 (см. столбец αi).

 

Максиминная стратегия игрока 1 –  А2 .

 

Здесь α< β (4<5), следовательно, седловой точки нет.

 

Выберем оптимальную стратегию для игрока 1 при условии, что игрок 1 знает, что игрок 2 принял минимаксную стратегию B2. 

Ею будет не максиминная А2, дающая игроку 1 выигрыш α = 4, а та стратегия, которая соответствует максимальному элементу в столбце В2.  То есть  max a i2 = 5 – это элемент a 12, который находится в первой строке матрицы  - в строке A1. В этом случае максимальный гарантированный выигрыш игрока 1 будет равен верхней цене игры β = 5, поэтому игрок 1 выбирает свою оптимальную стратегию А1 , зная, что игрок 2 выбрал свою стратегию В2 .

 

Таким образом, рассмотренный пример дает результат, отличный от результата при игре с седловой точкой. На примере 3 показано, что бывают ситуации, когда игрок 1 может получить выигрыш, превосходящий максиминный, если ему известны намерения игрока 2. Стратегия является оптимальной, если ее применение обеспечит игроку наибольший гарантированный выигрыш при любых возможных стратегиях другого игрока. При многократном повторении игры в сходных условиях можно добиться гарантированного среднего выигрыша, превосходящего для игрока 1 («наше ЛПР») максиминный. Это заставляет игроков адаптироваться друг к другу, выдвигать последовательно усложняющиеся гипотезы об ответных реакциях конкурента и собственных контрмерах. Такое поведение называют рефлексивным. Оно побуждает каждого игрока отклоняться от своей максиминной (минимаксной) стратегии с целью улучшения значения выигрыша в свою пользу. В таком случае первый игрок («наше ЛПР») может только предполагать, как поступит второй: будет ли он придерживаться своей максиминной стратегии B* или отклонится от нее. В значительной степени на решения игроков по-прежнему будут влиять их личностные качества, величина предполагаемого выигрыша v(a*, b*), а также их искусство блефовать и рефлексировать. В конечном итоге выиграет тот, кто более искусно маскировал свои истинные намерения и удачнее предсказал намерения своего соперника. Если игра может повторяться достаточно большое количество раз (не менее 25—30), а шкала оценочной функции v(a,b) достаточно близка к количественной, то для получения равновесной ситуации первому игроку следует прибегнуть к применению не чистых, а так называемых смешанных стратегий. Ситуация равновесия в смешанных стратегиях существует всегда, это доказано строго математически.

 

ЧТО ТАКОЕ СМЕШАННАЯ СТРАТЕГИЯ?

 

СМЕШАННЫЕ СТРАТЕГИИ.

 

Рассмотрим теперь подробнее случай, когда в игре отсутствует седловая точка, то есть случай, когда α <  β.

 

Если в матричной игре отсутствует седловая точка в чистых стратегиях, то находят верхнюю и нижнюю цены игры. Они показывают, что игроку 1 гарантирован выигрыш, не меньший нижней цены игры α. А игрок 2 может обеспечить себе проигрыш, не больший β, то есть  игрок 1 не получит выигрыша, превосходящего верхнюю цену игры β. В примере 3 игрок 1 получил при своей оптимальной стратегии А1, отличной от максиминной,  выигрыш, равный верхней цене игры β = 5. Такова плата за информированность о стратегии игрока 2. Это крайний случай.  Не улучшится ли результат игрока 1, если информация о действиях противной стороны будет отсутствовать, но игрок будет многократно применять чистые стратегии случайным образом с определенной вероятностью? Возникает вопрос, как «справедливо»  разделить разность (β – α > 0) между игроками? Оказывается, что компромиссного распределения разности (β – α) между игроками можно добиться путем случайного чередования игроками чистых стратегий. При этом игрок 1 может получать выигрыши, в среднем большие нижней цены игры α, но меньшие верхней цены игры β.  

 

Для этого применяют смешанные стратегии, которые можно представить в виде случайных величин, возможными значениями которых являются  чистые стратегии.  

 

Пусть для игрока 1 смешанная стратегия S1  заключается в применении чистых стратегий А1,  А2,...,  Аm с соответствующими вероятностями р1, р2, ..., pm:

 

 

где

 

Число      это вероятность того, что игрок 1 применит чистую стратегию 

 

Для  игрока 2 смешанная стратегия S2 заключается в применении чистых стратегий B1, B2, … Bn  с вероятностями q1, q2, …, qn:


 

                                                

где

 

Число     это вероятность того, что игрок 2 применит чистую стратегию .

 

В случае, когда pi = 1 , для игрока 1 имеем чистую стратегию:

                                                

 

Если мы окажемся в ситуации  {Ai, Bj}, то есть когда игрок 1 применит стратегию Ai, а игрок 2 при этом применит стратегию Bj, то она реализуется с вероятностью
.

В матричной игре, зная платежную матрицу A (она относится и к игроку 1, и к игроку 2), можно определить средний выигрыш игрока 1:

где  p, q – векторы с компонентами pi, qj, соответственно.

 

Стратегии      и    

называются оптимальными смешанными стратегиями игроков, если выполнено следующее условие оптимальности:

                    (*)

 

Поясним полученные соотношения.

Левая часть этого неравенства

означает, что если первый игрок отклоняется от оптимальной стратегии p0, то его выигрыш может только уменьшиться при условии, что второй игрок придерживается оптимальной стратегии q0.

Аналогично, неравенство

означает, что если второй игрок отклоняется от оптимальной стратегии q0, то его проигрыш может только увеличиться.

Условие  оптимальности (*) аналогично условию:

 

Величина


  

называется ценой игры

 

Решить игру означает найти цену игры и оптимальные стратегии. То есть решением игры является нахождение «набора»  ( 

 

Естественно, что возникают следующие вопросы.

 

КАКИЕ МАТРИЧНЫЕ ИГРЫ ИМЕЮТ РЕШЕНИЕ В СМЕШАННЫХ СТРАТЕГИЯХ И КАК НАЙТИ ЭТО РЕШЕНИЕ, ЕСЛИ ОНО СУЩЕСТВУЕТ?

 

Ответ на этот вопрос дает основная теорема теории матричных игр.

 

Теорема (Неймана). 

Для матричной игры с любой матрицей A величины 



 

существуют и равны между собой:

Более того, существует, по крайней мере, одна ситуация

),  для которой выполняется соотношение:

 

 

Другими словами, любая матричная игра имеет решение в смешанных стратегиях. В состав оптимальных смешанных стратегий  игроков могут входить не все чистые стратегии  Ai, B j. То есть вероятности некоторых из них будут равны нулю: ,    Значит, не все заданные чистые стратегии игроков будут входить априори в их оптимальные смешанные стратегии.  Тогда те чистые стратегии, которые входят в оптимальные смешанные стратегии, называются активными чистыми стратегиями. 

 

Справедлива следующая теорема.

 

Теорема.
Оптимальная смешанная стратегия p0 первого игрока смешивается только из тех чистых стратегий Ai,   , для которых справедливы равенства:

 

А в оптимальной смешанной стратегии q0 второго игрока смешиваются только те стратегии Bj,   , для которых справедливы равенства:

 

 

КАКОВЫ УСЛОВИЯ ПРИМЕНЕНИЯ СМЕШАННЫХ СТРАТЕГИЙ?

 

Перечислим условия применения смешанных стратегий:

1.      Игра без седловой точки;

2.      Игроки используют случайную смесь чистых стратегий с заданными вероятностями;

3.      Игра многократно повторяется в сходных условиях;

4.      При любом ходе ни один из игроков не информирован о  стратегии другого игрока;

5.      Допускается усреднение результатов игр.

 

ОПТИМАЛЬНЫЕ СМЕШАННЫЕ СТРАТЕГИИ В МАТРИЧНОЙ ИГРЕ 2x2.

 

Рассмотрим простейшую матричную игру, описываемую матрицей 2х2.  При отсутствии седловой точки можно полу­чить две оптимальные смешанные стратегии. Как уже отмеча­лось, эти смешанные стратегии записываются так:

                                         

Значит, имеется платежная матрица

                                         

При этом

                                                     

откуда получаем оптимальные значения  и :

                                         

Зная  и  находим g:

                              

Вычислив g, находим  и :

                              

Задача решена, так как найдены векторы

и цена игры g.

 

Общим подходом решения к решению игры в смешанных стратегиях является сведение ее к задаче линейного программирования.

 

МЕТОДЫ ОБОСНОВАНИЯ РЕШЕНИЙ С ИСПОЛЬЗОВАНИЕМ БИМАТРИЧНЫХ БЕЗКОАЛИЦИОННЫХ И БИМАТРИЧНЫХ КООПЕРАТИВНЫХ ИГР.

 

ИГРЫ С НЕНУЛЕВОЙ СУММОЙ. ПОНЯТИЕ БИМАТРИЧНОЙ  ИГРЫ.

 

Предыдущие рассмотрения касались игр двух лиц, в которых  интересы игроков были прямо противоположны (антагонистические, или матричные игры). Однако ситуации, в которых интересы игроков хотя и не совпадают, но уже не обязательно являются противоположными, встречаются значительно чаще. Рассмотрим, например, конфликтную ситуацию, в которой  каждый из двух участников имеет следующие возможности для  выбора своей линии поведения: игрок A — может выбрать любую из стратегий А1..., Аm, игрок B — любую из стратегий В1 ..., Вn. При этом всякий раз их совместный выбор оценивается вполне определенно: если игрок А выбрал i-ю стратегию Ai,  а игрок В — j-ю стратегию Вj,  то в итоге выигрыш игрока А будет равен  некоторому числу aij, а выигрыш игрока В некоторому, вообще говоря, другому числу bij. Иными словами, всякий раз каждый из игроков получает свой приз. Последовательно перебирая все стратегии игрока A и все  стратегии игрока B, мы сможем заполнить их выигрышами две таблицы.  Здесь A — платежная матрица игрока А, а В - матрица игрока В.

При выборе игроком A  i-й стратегии Ai, а игроком Bj-й стратегии Bj их выигрыши находятся в матрицах выплат на пересечении i-х строк и j-х столбцов: в матрице А это элемент aij,   а в матрице В — элемент bij.

Таким образом, в случае, когда интересы игроков различны (но не обязательно противоположны), получаются две платежные матрицы: одна — матрица выплат игроку A, другая — матрица  выплат игроку В.  Поэтому совершенно естественно звучит название, которое обычно присваивается подобной игре — биматричная игра. Рассматриваемые ранее матричные игры, разумеется, можно  рассматривать и как биматричные, где матрица выплат игроку B  противоположна матрице выплат игроку A:  bij = - aij.

 

Тем не менее, в общем случае биматричная игра — это игра с ненулевой суммой. Вполне естественно время от времени сопоставлять наши рассмотрения с рассуждениями, проведенными ранее для  матричных игр (особенно при попытках разрешения схожих проблем). Подобные сопоставления часто оказываются одновременно и  удобными и полезными. Конечно, класс биматричных игр значительно шире класса матричных (разнообразие новых моделируемых  конфликтных ситуаций весьма заметно), а, значит, неизбежно  увеличиваются и трудности, встающие на пути их успешного разрешения.

 

Рассмотрим, например, принципы принятия решений на примере биматричных игр.

ПРИМЕР БИМАТРИЧНОЙ ИГРЫ «БОРЬБА ЗА РЫНКИ».

 

Небольшая фирма (игрок А) намерена сбыть  партию товара на одном из двух рынков, контролируемых другой, более крупной фирмой (игрок В). Для этого фирма А готова предпринять на одном из  рынков соответствующие приготовления (например, развернуть рекламную  компанию). Господствующая на рынках фирма В может попытаться воспрепятствовать этому, приняв на одном из рынков предупредительные меры  (разумеется, в рамках закона). Не встречая противодействия на рынке, фирма А захватывает его; при наличии препятствий — терпит поражение. Будем считать для определенности, что проникновение фирмы А на  первый рынок более выгодно для нее, нежели проникновение на второй.  Естественно также считать, что и борьба за первый рынок потребует вложения больших средств. Например, победа фирмы А на первом рынке принесет ей вдвое больший выигрыш, чем победа на втором, но зато и поражение при попытке освоиться на первом рынке полностью разорит ее, избавив фирму В от конкурента. Что же касается второго рынка, то при поражении фирмы A ее потери будут не столь разорительны, но и победа принесет немного.

 

Таким образом, у фирмы A две стратегии:

Α1 — «выбор первого рынка», Α2 — «выбор второго рынка».

Такие же стратегии и у фирмы B:

B1 — «выбор первого рынка»,  B2 — «выбор второго рынка».

Для того,  чтобы составить платежные матрицы игроков, нужны расчетные количественные показатели, которые мы приведем здесь в условных  единицах:

 

Взглянем на выписанные матрицы выплат. Из сказанного выше ясно, что если оба игрока выберут один и тот же рынок, то победа останется за более сильной фирмой В.

То, что в ситуации (A1,Β1) выигрыш игрока В равен 5, а в ситуации

(Α2,Β2) = 1, подчеркивает, что первый рынок более выгоден (удобно  расположен, хорошо посещаем и т.п.), чем второй. Выигрыш (-10) игрока A в ситуации (Α1,Β1) (а точнее, проигрыш) в сопоставлении с его выигрышем (— 1) в ситуации (А2,B2) выглядит, разумеется, вполне сокрушительно.

 

Что же касается ситуации, когда фирмы уделяют основное внимание разным  рынкам (А1,B2)   и (А2, Β1), то здесь фирму A ждет настоящий выигрыш, больший на более выгодном рынке. Потери, которые при этом несет фирма B,  оказываются прямо противоположными.

Ясно, что точно рассчитать выгоду и ущерб сторон в этом  конфликте заранее довольно трудно.  

 

ЧТО ПОНИМАЮТ ПОД РЕШЕНИЕМ БИМАТРИЧНОЙ ИГРЫ?

 

В приведенном  примере описана ситуация, в которой интересы  игроков не совпадают. Естественно встает вопрос о том, какие  рекомендации необходимо дать игрокам для того, чтобы моделируемая конфликтная ситуация разрешилась. Иными словами, что мы  будем понимать под решением биматричной игры? Вследствие того, что интересы игроков не совпадают, нам нужно построить такое (компромиссное) решение, которое бы в том или ином, но в одинаковом смысле  удовлетворяло обоих игроков. Попробуем найти некую равновесную ситуацию, явное отклонение от которой одного из игроков уменьшало бы его выигрыш. Подобный вопрос мы ставили и при рассмотрении матричных игр. Напомним, что возникающее при разработке минимаксного подхода понятие равновесной ситуации приводило нас к поиску седловой точки, которая, как оказалось, существует далеко не  всегда — конечно, если ограничиваться только чистыми стратегиями игроков A и B, т. е. стратегиями A1, …, Am и B1, …, Bn. Естественно ожидать, что в более сложном случае биматричной игры дело вряд ли обстоит проще. На вопрос о существовании ситуации равновесия отвечает следующая теорема.

Теорема (Дж. Нэш). Всякая биматричная игра имеет хотя бы одну равновесную ситуацию (точку равновесия) в смешанных стратегиях.

Рассмотренные примеры являются иллюстративными в смысле условности значений выигрышей сторон. Эти выигрыши назначались нами в соответствии с простым предпочтением одного исхода над другим без детализации, на сколько или во сколько раз сильнее то или иное предпочтение. Для таких игр — «игр с предпочтениями» — бессмысленно говорить о применении смешанных стратегий. Если же биматричная игра описывается в шкале полезностей не менее совершенной, чем интервальная, то рассмотрение смешанных стратегий оправдано, если это допустимо их интерпретацией в рамках данного конфликта.  Итак, ситуация равновесия по Нэшу — это схема анализа, пригодная для случая, когда никакое кооперирование не допускается.

 

ЧТО ДЕЛАТЬ, ЕСЛИ И РАВНОВЕСНЫЙ (ПО НЭШУ) ВЫИГРЫШ УЧАСТНИКОВ НЕ УСТРАИВАЕТ? 

 

В таком случае им ничего не остается, как начать обмениваться информацией и договариваться о совместном поведении в игре.  Математической моделью конфликта при таком подходе становится кооперативная игра, которая ведется по следующим правилам:

• разрешено заключать совместные соглашения;

• допускается совместный выбор стратегий (в общем случае — смешанных);

• допускается передавать полезность от одного игрока к другому (хотя, возможно, и не всегда линейно).

 

Каждый из приведенных пунктов правил ведения кооперативных игр в целом означает следование принципу групповой рациональности. Однако последний пункт, хотя и предполагает, что игроки могут «покупать и продавать» друг другу имеющуюся в их распоряжении полезность, чтобы улучшить собственное положение в игре, не накладывает каких-либо ограничений на то, как это должно делаться.

 

ПОНЯТИЕ КООПЕРАТИВНОЙ ИГРЫ.

Выше мы рассматривали игры, в которых игроки не имели права вступать в соглашения, образовывать коалиции. Рассмотрим теперь так называемые кооперативные игры, в которых игроки могут вступать в соглашения, образовывать коалиции. Такие ситуации могут возникать особенно часто, если рассматриваются игры n лиц. Следует отметить, что при содержательном анализе процедур совместного принятия решений в таких кооперативных играх необходимы дополнительные сведения, касающиеся возможных действий коалиций, их предпочтений, способов обмена ими информацией о принимаемых решениях и т. д. Как отмечалось выше, равновесие является важнейшим принципом оптимальности в бескоалиционных играх, в которых не рассматривается образование коалиций. Коалиция является формой кооперации, направленной на увеличение персональных возможностей игроков, то есть на увеличение их выигрышей. В матричной игре кооперация игроков лишена смысла, так как в такой игре улучшение положения одного из них приводит к ухудшению положения другого. Ситуация меняется при переходе от матричной игры к биматричной, так как в биматричных играх кооперация может улучшить положение обоих игроков. В биматричной игре имеется лишь одна нетривиальная коалиция (коалиция, состоящая более чем из одного игрока) — коалиция обоих игроков. Для пояснения отличий между индивидуальным выбором решений обоими игроками и совместным принятием решения коалицией этих игроков рассмотрим следующий пример.

ПРИМЕР БИМАТРИЧНОЙ ИГРЫ «КОНКУРС НА РЕАЛИЗАЦИЮ ПРОЕКТА». 

 

Две фирмы участвуют в конкурсе на реализацию проекта, причем доход от реализации проекта составит 10 у.е. Каждая фирма может либо подать простую заявку на участие в конкурсе (затраты равны 1 у.е.), либо представить программу реализации проекта (затраты составят 3 у.е.). По условиям конкурса, если обе фирмы выбирают одинаковый способ подачи заявки, то заказ (и доход) на реализацию проекта делится между ними пополам. Если же фирмы выбирают различные способы действий, то предпочтение отдается фирме, которая представит программу. Требуется разрешить эту конфликтную ситуацию.

 

РЕШЕНИЕ. Представим описанную конфликтную ситуацию в виде биматричной игры. Игроками A и B здесь выступают фирмы, стратегия A1 (B1) — подача заявки на участие в конкурсе, стратегия A2 (B2 ) — представление программы действий.

Количественно выигрыши игроков можно выразить следующим образом:

 

Решив эту игру, найдем единственную равновесную ситуацию p = q = 0 , или (A2 , B2)

с выигрышем H1(0, 0) = H2 (0, 0) = 2 . В этом случае каждая фирма получает прибыль, равную 2 у.е. Для этого обе фирмы должны представить программу действий и поделить пополам доход от реализации проекта. Ни одному из этих игроков невыгодно отклоняться от этой стратегии, так как это может только уменьшить его выигрыш. Но если игроки одновременно отклоняются от оптимальной (равновесной по Нэшу) стратегии, то возникает ситуация (A1,B1), которая очевидно является более выгодной для обоих из них с выигрышем H1(1,1)=  H2(1,1) = 4. Однако переход к этой ситуации возможен только как результат договора между игроками, что осуществимо лишь при создании коалиции этих игроков. Объединение игроков в коалицию требует как минимум возможности обмена информацией между ними. Если же игроки не могут обмениваться информацией, то каждый из них будет опасаться менять выбранную им чистую стратегию A2 (B2) на стратегию A1 (B1) , так как это приводит к уменьшению выигрыша отклонившегося игрока.

Рассмотренный пример демонстрирует важную особенность биматричных игр — возможность наличия противоречия между выгодностью и устойчивостью (положением равновесия). Действительно, ситуация (A2 , B2) является устойчивой, но невыгодной; а ситуация (A1 , B1) — выгодной, но неустойчивой. Поэтому если игроки заключают между собой договор — обоим придерживаться стратегии (A1 , B1) , то этот договор будет находиться под угрозой нарушения, так как каждому игроку выгодно его одностороннее нарушение.

ОПТИМАЛЬНОСТЬ В КООПЕРАТИВНЫХ ИГРАХ.

 

При исследовании кооперативного аспекта в теории игр внимание обращается, как правило, не на ситуации игры, а на ее исходы. В соответствии с этим в основе оптимальности лежит идея выгодности. Проанализируем, как может реализовываться идея выгодности в рамках неантагонистической игры двух лиц. Пусть Ai — множество стратегий первого игрока, а Bj — множество стратегий второго игрока. Если игроки образуют коалицию, то они могут создавать любую ситуацию (Ai , Bj), и, таким образом, реализовать любой исход игры. Возникает вопрос, какой исход игры следует считать в этом случае наиболее выгодным для коалиции, то есть оптимальным для нее.

Так, в рамках примера «КОНКУРС НА РЕАЛИЗАЦИЮ ПРОЕКТА»  игроки, объединившись в коалицию, предпочтут исход (A1 , B1) исходу (A2 , B2), однако исходы (A1, B2) и (A2, B1) также являются «кандидатами» на оптимальность.

В общем случае для биматричной игры рассмотрение вопроса о ее оптимальности с точки зрения коалиции удобно представить в геометрической форме. На координатной плоскости (Н1 , Н2 ) изобразим точки, координатами которых являются выигрыши игроков (aij , bij) для каждой возможной ситуации (Ai, Bj). При этом возникает «картинка», похожая на ту, что изображена на рисунке 12.

Так как коалиция может выбирать любой из представленных девяти исходов, то фактически получается задача двухкритериальной оптимизации, где первый игрок стремится максимизировать критерий H1 , а второй — критерий H2 . Анализ такой многокритериальной задачи можно провести в два этапа.

 

1)     На первом этапе мы проводим мажорирование (доминирование) стратегий по Парето. Отбрасывая исходы, доминируемые по Парето, получаем множество Парето-оптимальных исходов. В примере, представленном на рисунке 12,  Парето-оптимальными являются исходы {4, 5, 6, 8} .  Выбор оптимального исхода следует производить из множества Парето-оптимальных исходов.

2)     На втором этапе необходимо решить вопрос — какое из Парето-оптимальных решений следует считать оптимальным? На первом этапе игроки выступают как союзники, так как этот шаг выгоден обоим из них. Однако на втором этапе, при сравнении любых двух Парето-оптимальных решений, игроки из союзников превращаются в противников: так как увеличение выигрыша одного из них влечет за собой уменьшение выигрыша другого.

2)

Овал: 8
 


Овал: 6H2

Овал: 9
Овал: 1 Овал: 4
Овал: 2
Овал: 3
Овал: 5
Овал: 7
 

 

 

 

 

 

 

 

 

 

 


0                                                                                                      H1

Рисунок 12.  Нахождение Парето-оптимальных решений.

 

Для решения задачи нахождения оптимального исхода в кооперативной игре сделаем еще одно допущение: возможно использование не только чистых, но и смешанных стратегий.

Это приводит к тому, что вместе с двумя чистыми исходами (H1 , H2 ) и ( H1’ , H2’) коалиция может реализовать также исход:

λ × (H1, H2) + (1-λ) × ( H1’, H2’) = (λ × H1 + (1-λ) ×  H1’,  λ × H2 + (1-λ) ×  H2’), 

 

где число λ  удовлетворяет условию 0 λ ≤ 1.

 

С геометрической точки зрения, это означает, что множество исходов биматричной игры превращается в многоугольник D (рисунок 13), вершинами которого будут точки (aij, bij). При этом исходы, оптимальные по Парето, образуют «северо-восточную» границу этого многоугольника, а именно, это ломаная (8, 6, 4, 5).

 

Овал: 8
 


H2

 

 

 

 

 

 

 

 

 

 

 


0                                                                                             H1

Рисунок 13. Многоугольник исходов D.

 

Задача нахождения кооперативного решения биматричной игры сводится теперь к построению правила, которое для каждого такого многоугольника исходов D указывает единственный оптимальный исход, принадлежащий его «северо-восточной» границе.  Рассмотрим решение этой задачи, известное как АРБИТРАЖНОЕ РЕШЕНИЕ НЕША.

ЧТО ТАКОЕ АРБИТРАЖНОЕ РЕШЕНИЕ НЭША?

 

Арбитражное решение представляет собой некую систему требований (аксиом), с помощью которых для любой игры выделяется ее единственное решение — оптимальный исход этой игры.

Пусть νA и νB — цены матричных игр с матрицами A и B соответственно. Тогда в явном виде арбитражное решение Нэша для пары (H1, H2) — это точка (H1* , H2*), для которой произведение (функция полезности):

U = (H1    νA) × (H2 –  νB)

достигает своего наибольшего значения в той части области D возможных исходов биматричной игры, в которой выполняются условия:

H1 >  νA, H2 >  νB.

 

РАЗДЕЛ 3. ТЕХНОЛОГИИ ПРИНЯТИЯ РЕШЕНИЙ В УСЛОВИЯХ ПОЛНОЙ И СТОХАСТИЧЕСКОЙ НЕОПРЕДЕЛЕННОСТИ.

 

В ЧЕМ СОСТОИТ ОСОБЕННОСТЬ ПРИНЯТИЯ РЕШЕНИЙ В УСЛОВИЯХ ДЕЙСТВИЯ ПРИРОДНО-НЕОПРЕДЕЛЕННЫХ ФАКТОРОВ («ПРИРОДА»)?

 

Многие экономические задачи принятия решений в условиях неопределенности содержат    неопределенность особого вида.  Эта неопределенность заключается в том, что лицо, принимающее решение, недостаточно информировано об объективных внешних условиях, в которых будет приниматься это решение. Неопределенность такого вида не связана с сознательным целенаправленным противодействием противника; такая неопределенность  может порождаться различными причинами: нестабильностью экономической ситуации, рыночной конъюнктурой, курсами валют, уровнем инфляции, налоговой политикой, изменяющимся покупательским спросом и т.д. То есть в задачах подобного рода выбор решения зависит от состояний объективной экономической действительности, называемой в модели «ПРИРОДОЙ», а математические модели подобных конфликтных  ситуаций называются ИГРАМИ «С ПРИРОДОЙ».  Термин «ПРИРОДА» характеризует некую объективную действительность, которую не следует понимать буквально. Хотя вполне могут встречаться ситуации, в которых игроком может действительно выступать природа. Например, обстоятельства, связанные с погодными условиями  или с природными стихийными  силами. Игра человека с природой тоже отражает конфликтную ситуацию, возникающую при столкновении интересов в выборе решения. Но «стихийным силам природы» нельзя приписать разумные действия, направленные против человека  и тем более какой-либо «злой умысел». Таким образом, корректнее говорить о конфликтной ситуации, вызванной столкновением интересов человека и неопределенностью действий природы, но без явной антагонистической окраски.

 

ОСНОВНЫЕ ПОНЯТИЯ ИГРЫ С «ПРИРОДОЙ».

 

В игре «с природой» участвуют два игрока.

 

Игрок 1 – это лицо, принимающее решение (ЛПР), обозначим его «А».

 

Игрок 2 – это «ПРИРОДА», обозначим его «Q».

 

В играх «с природой» сознательно действует только один из участников  – лицо, принимающее решение (ЛПР).  «ПРИРОДА» является вторым игроком, но не противником игрока А. Так как «ПРИРОДА» осознанно против первого игрока не действует, принимает то или иное свое состояние определенным образом, конкретных целей в игре не преследует и безразлична к результату игры.  То есть «ПРИРОДА», являясь игроком в игре «с природой», не является ни противником, ни союзником игрока А. Формально изучение игр «с природой», так же как и стратегических, должно начинаться с построения матрицы выигрышей (платежной матрицы), что является, по существу, наиболее трудоемким этапом подготовки принятия решения. Ошибки, допущенные при формировании матрицы выигрышей (платежной матрицы), не могут быть компенсированы никакими вычислительными методами и приведут к неверному итоговому результату.

Матрица игры «с природой» аналогична платежной матрице стратегической игры «m x n» (рисунок 14).  Формализация задачи происходит следующим образом: у активного игрока (человека) возможные действия по-прежнему называются стратегиями, а возможные действия пассивного игрока (природы) – состояниями или условиями природы.

Пусть игрок 1 –  «A» (лицо, принимающее решение),  имеет m стратегий Ai, i = 1, …, m.   Игрок 2 – «ПРИРОДА»,  может находиться в одном из n возможных состояний Qj, j = 1, …, n. Состояния природы Qj можно рассматривать как ее возможные «стратегии».   Обычно предполагается, что игрок A (ЛПР) в состоянии оценить результаты выбора им каждой из своих стратегий Ai,  i=1,…,m, при каждом состоянии природы Qj, j=1,…,n. Эти результаты количественно выражаются действительными числами aij, и называются выигрышами игрока A (ЛПР) в игре «с природой». 

 

Так как в играх «с природой» в качестве первого игрока всегда выступает человек (ЛПР), то можно составить матрицу выигрышей (платежную матрицу)  игры «с природой»    матрицу размера «m x n» с элементами {aij}.  Номер строки матрицы соответствует номеру стратегии, применяемой первым игроком – человеком (ЛПР).  Номер столбца соответствует номеру состояния  «ПРИРОДЫ»   – второго игрока. 

Элемент матрицы aij – это выигрыш  игрока 1 (ЛПР), если он выбрал стратегию Ai при состоянии природы Qj.

 

В ЧЕМ СОСТОИТ СОДЕРЖАТЕЛЬНОЕ ОТЛИЧИЕ МАТРИЦЫ ВЫИГРЫШЕЙ В ИГРЕ С «ПРИРОДОЙ»?

 

Содержательное отличие матрицы выигрышей в игре «с природой» от платежной матрицы антагонистической игры заключается в том, что элементы столбцов этой матрицы не являются проигрышами «природы» при соответствующих ее состояниях. Выигрыши aij платит, естественно, не «ПРИРОДА», а некая третья сторона или совокупность сторон, влияющих на принятие решения игроком 1, и объединенных в понятие «ПРИРОДА».

 

                      СОСТОЯНИЯ  «ПРИРОДЫ»

 

СТРАТЕГИИ ЛПР

Q1

Q2

Qn

A1

a11

a12

a1n

A2

a21

a22

a2n

Am

am1

am2

amn

 

Рисунок 14. Матрица игры «с природой» (матрица выигрышей).

 

Если в распоряжении игрока A всего одна стратегия A1, то есть  m =1, то проблема выбора им оптимальной стратегии отпадает. Поэтому в дальнейшем целесообразно считать m ≥ 2.

 

Если «ПРИРОДА» Q может пребывать только в одном состоянии Q1, то есть n =1, то проблема выбора игроком A оптимальной стратегии превращается в тривиальную: игрок A  должен выбрать стратегию Ak  такую, что выигрыши аk1 ≥ ai1, i=1,…, m. Поэтому будем предполагать, что n ≥ 2.

 

В ЧЕМ ЗАКЛЮЧАЮТСЯ ОТЛИЧИТЕЛЬНЫЕ ОСОБЕННОСТИ ПРИНЯТИЯ РЕШЕНИЙ В УСЛОВИЯХ ПОЛНОЙ И СТОХАСТИЧЕСКОЙ НЕОПРЕДЕЛЕННОСТИ?

 

Методы принятия решений в играх «с природой» зависят от того, известны или нет вероятности состояний (стратегий) «ПРИРОДЫ» Q.

 

Случай 1. Пусть события, состоящие в том, что «ПРИРОДА» Q находится в одном из своих состояний Q1, …, Qn,  несовместны  и составляют полную группу событий.   При этом  вероятности pj  состояний «ПРИРОДЫ» Qj известны, то есть известны значения