Главная Случайная страница


Категории:

ДомЗдоровьеЗоологияИнформатикаИскусствоИскусствоКомпьютерыКулинарияМаркетингМатематикаМедицинаМенеджментОбразованиеПедагогикаПитомцыПрограммированиеПроизводствоПромышленностьПсихологияРазноеРелигияСоциологияСпортСтатистикаТранспортФизикаФилософияФинансыХимияХоббиЭкологияЭкономикаЭлектроника






Принятие решений с помощью теории игр в условиях неопределённости и риска

В условиях полной неопределённости возможен и другой способ задания матрицы игры в виде матрицы рисков R или матрицы упущенных возможностей.

Величина риска – это размер платы за отсутствие информации о состоянии среды. Матрица рисков строится из условий задачи или из матрицы выигрышей. Риск при использовании стратегии Аi в состоянии среды Вj – это разность между выигрышем, который игрок получил бы, если бы он знал, что состояние среды Вj, и выигрышем, который игрок получит не имея этой информации.

Зная состояние среды, игрок выбирает ту стратегию, которая даёт максимальный выигрыш при этом состоянии.

Например, для матрицы выигрышей, представленной в последней таблице, матрица рисков будет выглядеть следующим образом.

R (риск) В1 В2 В3 В4 В5
А1 8-3=5 5-5=0 12-8=4 7-6=1 11-11=0
А2 8-8=0 5-4=1 12-12=0 7-7=0 11-9=2

Или

R (риск) В1 В2 В3 В4 В5
А1
А2

В условиях полной неопределённости используются и другие критерии выбора стратегий:

Критерий максимакса – используются стратегия максимизирующая максимальный выигрыш (критерий крайнего оптимизма). Пусть есть матрица выигрышей

Вj Ai B1 B2 B3 B4
A1
A2
А3

Для неё стратегия А1 будет наилучшей по этому критерию.

Этим критерием часто пользуются и в экономике, если ситуация безвыходная «или пан, или пропал».

Максиминный критерий Вальда – это тот же максиминный критерий, что и в стратегических играх, где противник настроен агрессивно по отношению к игроку. И решением является стратегия, при которой достигается нижняя цена игры. В нашем случае – это стратегия А2. Такая стратегия приемлема, если игрок хочет застраховать себя от неожиданных проигрышей. Выбор такой стратегии определяется отрицательным отношением игрока к риску.

Критерий минимаксного риска Сэвиджа аналогичен критерию Вальда, но игрок руководствуется не матрицей выигрышей, а матрицей рисков. Для выше приведённой игры матрица рисков будет выглядеть следующим образом:

Вj Ai B1 B2 B3 B4
A1
A2
А3

Выбирается стратегия, у которой минимален максимальный риск. Для этого в каждой строчке выписывается максимальное значение (максимальный риск), а затем выбирается та стратегия, для которой этот риск минимален, то есть опять ищется наилучшее решение в наихудших условиях. Для стратегии А1 максимальный риск равен 4,для А2 – 6 и для А3 – 7, то есть в нашем случае критерий Сэвиджа указывает на стратегию А1.

Критерий пессимизма-оптимизма Гурвица. Согласно этому критерию, стратегия в матрице выигрышей выбирается в соответствии с максимальным значением Hi, вычисленным для каждой строки в соответствии с заданным значением коэффициента пессимизма для данного ЛПР в данной задаче (р). Коэффициент задаётся каждый раз отдельно самим ЛПР, но он всегда заключён в пределах от 1 до 0, при р=1 ЛПР настроен 100% пессимистично, а при р=0 – оптимистично. Значение Hi вычисляется по формуле
Hi=p*min(aij)+(1-p)*max(aij).

При р=0, критерий Гурвица совпадает с максимаксным критерием, а при р=1, с критерием Вальда.

Посчитаем, какую стратегию в нашей игре лучше выбрать, при р=0,6.

Н1=0,6*1+0,4*9=4,2

Н2=0,6*3+0,4*8=5

Н3=0,6*2+0,4*6=3,6

В этом случае лучше выбрать вторую стратегию.

В случае, если критерий даёт несколько решений, выбор между ними может осуществляться по дополнительному критерию, например, по среднему квадратичному отклонению от среднего выигрыша. Однозначного решения нет, всё зависит от склонности к риску ЛПР.

Для примера определить стратегии по всем приведённым критериям для следующей матрицы выигрышей

Вj Ai B1 B2 B3 B4
A1
A2
А3
А4

Если стратегия фигурирует по нескольким критериям, то лучше выбрать её, как более надёжную.

Выполните следующие упражнения:

Задание 1

Определите верхнюю и нижнюю границы игры для ниже представленных платёжных матриц, а также определите, являются ли данные игры играми с седловой точкой:

А)

  В1 В2 В3 В4
А1
А2 2+n
А3 10-n 13-n
А4 17-n 1+m

В)

  В1 В2 В3
А1 4+n
А2 8+m
А3 (10-m)*10
А4 11-n

Где n– первая цифра в номере студенческого билета, а m- вторая.

Задание 2

Для задач, предложенных в разделе «Дерево решений», составить платёжные матрицы и определить наилучшее решение, воспользовавшись всеми 4 критериями рассмотренными выше. Коэффициент пессимизма считать равным 0,5.

Задание 3

Для матриц из первого задания построить матрицы рисков, считая, что они составлены для решения конкретных задач в условиях полной неопределённости, и определить наилучшую стратегию для каждой задачи по критерию Сэвиджа.

Смешанные стратегии в матричных играх.[3]

Смешанная стратегия – это полный набор применения чистых стратегий игрока при многократном повторении игры в одних и тех же условиях с заданными вероятностями. В такой ситуации можно получить выигрыши в среднем большие нижней цены игры, но меньшие верхней.

Условия применения смешанных стратегий:

· Игра без седловой точки;

· Игроки используют случайную смесь чистых стратегий с заданными вероятностями;

· Игра многократно повторяется в сходных условиях;

· При каждом из ходов ни один игрок не информирован о выборе стратегии другим игроком;

· Допускается осреднение результатов игры.

Для игрока 1 смешанная стратегия S1 задаётся матрицей

S1= , где =1, i=1…m, А – стратегии первого игрока, а р – вероятность (частота применения) стратегий

Для игрока 2 смешанная стратегия S2задаётся матрицей

S2= , где =1, j=1…n, В – стратегии второго игрока, а – вероятность (частота применения) стратегий

Задача в общем случае решается из соображений, что игрок 1 стремится увеличить свой средний выигрыш, а игрок 2 довести этот эффект до минимума (соответственно увеличив свой выигрыш).

Если известны все значения pi и qj, то средний выигрыш (математическое ожидание эффекта)
M(A,P,Q) =

Пусть элементы матрицы А положительны, если есть отрицательные, то каждый элемент матрицы можно увеличить на абсолютную величину наименьшего из отрицательных элементов. Матрица, где каждый элемент увеличен на величину наименьшего из отрицательных, даст следующее математическое ожидание
M(A1,P,Q) = =M(A,P,Q) +b* =M(A,P,Q) +b, то есть надо после решения такой задачи найденную цену игры уменьшить на b.

Существует теорема, доказывающая, что в этом случае всегда существует решение для выбора оптимальных смешанных стратегий следующим образом.

После обозначения g- цены игры при оптимальных стратегиях обоих игроков, и ui=pi/g, получают задачу линейного программирования для определения стратегии первого игрока:

Z= ®min

³1 для всех j (AT*U³en), то есть будет jнеравенств

для всехi
решив эту задачу, получим решение игры в смешанных стратегиях для первого игрока. g=1/Zmin, Р =UT*g

Аналогично для второго игрока получаем задачу линейного программированияg=1/Wmax

W= ®max

1 для всех i (A*V£em), то есть будет j неравенств

для всех j
Такие задачи удобно решать в Excel, ниже приведён лист с решением такой задачи с использованием надстройки «Поиск решения»

  В1 В2 В3 В4 мин   Решение Вероятности
А1 -3 -1 -3 -3   0,083333 0,33
А2 -3 -2 -4 -4   0,00
А3 -2 -2   0,166667 0,67
макс        
  Седловая точка отсутствует   Целевая функция Цена
            0,25  
  В1 В2 В3 В4        
А1   Ограничения  
А2    
А3    
            1,5  
  Транспонированная матрица    
           
           
           
           

Окно параметров поиска решений

Задание

Найти смешанные стратегии для игр, платёжные матрицы которых заданы ниже

А)

  В1 В2 В3 В4
А1
А2 2+n
А3 10-n 13-n
А4 17-n 1+m

В)

  В1 В2 В3
А1 4+n
А2 8+m
А3 (10-m)*10
А4 11-n

Где n– первая цифра в номере студенческого билета, а m- вторая.

Последнее изменение этой страницы: 2016-07-22

lectmania.ru. Все права принадлежат авторам данных материалов. В случае нарушения авторского права напишите нам сюда...