Категории:

Дом Здоровье Зоология Информатика Искусство Искусство Компьютеры Кулинария Маркетинг Математика Медицина Менеджмент Образование Педагогика Питомцы Программирование Производство Промышленность Психология Разное Религия Социология Спорт Статистика Транспорт Физика Философия Финансы Химия Хобби Экология Экономика Электроника

Решения игр в смешанных стратегиях.

Если матричная игра содержит седловую точку, то ее решение находится по принципу минимакса. Если же платежная матрица не имеет седловую точку, то применение минимаксных стратегий каждым из игроков показывает, что игрок I обеспечит себе выигрыш не меньше a, а игрок II обеспечит себе проигрыш не больше b. Так как a < b, то игрок I стремится увеличить выигрыш, а игрок II уменьшить проигрыш. Если информация о действиях противной стороны будет отсутствовать, то игроки будут многократно применять чистые стратегии случайным образом с определенной вероятностью. Такая стратегия в теории игр называется смешанной стратегией. Смешанная стратегия игрока — это полный набор его чистых стратегий при многократном повторении игры в одних и тех же условиях с заданными вероятностями. Для применения смешанных стратегий должны быть следующие условия:

1) в игре отсутствует седловая точка;

2) игроками используется случайная смесь чистых стратегий с соответствующими вероятностями;

3) игра многократно повторяется в одних и тех же условиях;

4) при каждом из ходов один игрок не информирован о выборе стратегии другим игроком;

5) допускается осреднение результатов игр.

Основная теорема теории игр Дж. фон Неймана: любая парная конечная игра с нулевой суммой имеет, по крайней мере, одно решение, возможно среди смешанных стратегий.

Отсюда следует, что каждая конечная игра имеет цену, которую обозначим через g, средний выигрыш, приходящийся на одну партию, удовлетворяющий условию a £ g £ b. Каждый игрок при многократном повторении игры, придерживаясь смешанных стратегий, получает более выгодный для себя результат. Оптимальное решение игры в смешанных стратегиях обладает следующим свойством: каждый из игроков не заинтересован в отходе от своей оптимальной смешанной стратегии, если его противник применяет оптимальную смешанную стратегию, так как это ему невыгодно.

Чистые стратегии игроков в их оптимальных смешанных стратегиях называются активными.

Теорема об активных стратегиях. Применение оптимальной смешанной стратегии обеспечивает игроку максимальный средний выигрыш (или минимальный средний проигрыш), равный цене игры g, независимо от того, какие действия предпринимает другой игрок, если только он не выходит за пределы своих активных стратегий.

Смешанные стратегии игроков S₁и S₂обозначим соответственно A₁ , A₂ , … A_mи B₁ , B₂ , B₃ … B_n , а вероятности их использования через p_A = (p₁, p₂, ..., p_m) и q_B = (q₁, q₂, ..., q_n), где p_i ³ 0, q_j ³ 0, при этом .

Тогда смешанная стратегия игрока I — S_I, состоящая из стратегий A₁, A₂, ..., A_m, имеет вид:

Соответственно для игрока II:

Зная матрицу А для игрока I можно определить средний выигрыш (математическое ожидание) :

Игрок I, применяя свои смешанные стратегии, стремится увеличить свой средний выигрыш, достигая

Игрок II добивается:

Обозначим через и векторы, соответствующие оптимальным смешанным стратегиям игроков I и II, при которых выполняется равенство:

При этом выполняется условие:

Решить игру — это означает найти цену игры и оптимальные стратегии.

Рассмотрим наиболее простой случай конечной игры 2 ´ 2 без седловой точки с матрицами:

С платежной матрицей

Требуется найти оптимальные смешанные стратегии игроков , и цену игры g.

Каковы бы ни были действия противника, выигрыш будет равен цене игры g. Это означает, что если игрок I придерживается своей оптимальной стратегии , то игроку II нет смысла отступать от своей оптимальной стратегии .

В игре 2 ´ 2, не имеющей седловой точки, обе стратегии являются активными.

Для игрока I имеем систему уравнений:

Для игрока II аналогично:

Если g ¹ 0 и игроки имеют только смешанные оптимальные стратегии, то определитель матрицы не равен нулю, следовательно, эти системы имеют единственное решение.

Решая систему уравнений (10) и (11) находим оптимальные ешения , и g:

Пример: Дана платежная матрица:

Найти решение.

Решение. Так как a = 3, b = 5, то a ¹ b, то и матрица игра не имеет седловой точки. Следовательно, решение ищем в смешанных стратегиях. Запишем системы уравнений:

для игрока I:

для игрока II:

Решив эти системы находим:

Следовательно оптимальные стратегии игроков имеют вид:

Геометрический метод.

Решение игры в смешанных стратегиях допускает наглядную геометрическую интерпретацию. Геометрический метод решения игры включает следующие этапы.

1. В декартовой системе координат по оси абсцисс откладывается отрезок А₁А₂, длина которого равна 1 (рис. 2.1.). Левый конец отрезка точка x = 0 соответствует стратегии A₁, правый, где х = 1,0 — стратегии А₂. Все промежуточные точки этого отрезка соответствуют смешанным стратегиям S₁ = (p₁, p₂).

2. По оси ординат от точки O откладываются выигрыши при стратегии А₁.

3. На линии, параллельной оси ординат, от точки 1 откладываются выигрыши при стратегии А₂ .

Пусть имеется игра с платежной матрицей:

Если игрок II применяет стратегию В₁, то выигрыш игрока I при использовании чистых стратегий А₁ и А₂ составляет соответственно a₁₁ = 0,4 и a₂₁ = 0,6. Соединим эти точки прямой В₁В₁ .

Если игрок I при стратегии В₁ применяет смешанную стратегию , то средний выигрыш, определяемый по формуле математического ожидания g₁ = a₁₁p₁ + a₂₁p₂, изображается ординатой точки N на прямой B₁B₁. Прямая B₁B₁ называется стратегией В₁. Ордината любой точки отрезка B₁B₁ равна величине выигрыша игрока I при применении им стратегии A₁и А₂ с соответствующими вероятностями p₁ и p₂.

Аналогично строим отрезок В₂В₂, сооветствующий применению игороком II с тратегии В₂ .

Ординаты точек отрезка определяют средний стратегий А₁ и А₂ с соответствующими вероятностями p₁ и p₂и равных g₂ = a₁₂p₁ + a₂₂p₂.

Пример № 1. Найти оптимальную смешанную стратегию руководителя коммерческого предприятия и гарантированный средний выигрыш при выборе из двух новых технологий продажи товаров и , если известны выигрыши каждого вида продажи по сравнению со старой технологией, которые представлены в виде матрицы игры.

Игрок II Игрок I
	0,4	0,9	0,4
	0,6	0,5	0,5
	0,6	0,9

Решение: находим гарантированный выигрыш определяемый нижней ценой игры которая указывает на максиминную чистую стратегию . Верхняя цена игры что свидетельствует об отсутствии седловой точки, т.к. , тогда цена игры находиться в пределах находим решение игры в смешанных стратегиях геометрическим методам рис. 2.1.

Рис. 2.1. Геометрический метод решения игры

Оптимальная смешанная стратегия и цена игры ровны.

Гарантированный средний выигрыш составляет 0,57.

3.6. Метод линейного программирования.

Антагонистическую игру m ´ n (где m > 3, n > 3) с конечными значениями m и n можно свести к паре двойственных задач линейного программирования.

Рассмотрим игру m ´ n, заданную платежной матрицей:

При постановке задач, необходимо иметь в виду некоторые преобразования, которые помогают упростить сложную задачу путем изменения – уменьшения размерности платежной матрицы посредством выделения и исключения доминирующих и дублирующих стратегий. Стратегия игрока А_i доминирует над стратегией А_к, если при любом поведении противника даст не меньший выигрыш, а если такой же, то дублирует А_к. В таком случае все элементы i строки больше (доминируют) или равны (дублируют) всех элементов строки k.

Пример. С учетом вариантов конъюнктуры В₁, В₂, В₃, В₄, В₅сложившейся на рынке и поведения покупателей в микрорайоне города коммерческое предприятие разработало шесть технологий продажи товаров А_1,А_2, А₃, А₄, А₅, А₆. Найти оптимальное решение. Возможные варианты среднедневного товарооборота в млн.руб. приведены в таблице:

	В₁	В₂	В₃	В₄	В₅
А₁	0,4	0,9	0,5	0,5	0,6
А₂	0,6	0,5	0,7	0,8	0,9
А₃	0,6	0,3	0,8	0,6	0,7
А₄	0,3	0,8	0,5	0,4	0,3
А₅	0,1	0,3	0,5	0,4	0,3
А₆	0,4	0,8	0,5	0,4	0,5

Стратегия А₁ доминирует над стратегией А₆, а стратегия А₄доминирует над стратегией А₅, следовательно исключаем 5 и 6 строки матрицы

	В₁	В₂	В₃	В₄	В₅
А₁	0,4	0,9	0,5	0,5	0,6
А₂	0,6	0,5	0,7	0,8	0,9
А₃	0,6	0,3	0,8	0,6	0,7
А₄	0,3	0,8	0,5	0,4	0,3

С позиций проигрышей строки В стратегии В_3,В₄ и В₅ доминируют над стратегией В_1,поэтому эти столбцы исключаем из таблицы:

	В₁	В₂
А₁	0,4	0,9
А₂	0,6	0,5
А₃	0,6	0,3
А₄	0,3	0,8

С позиций игрока А стратегия А₁ доминирует над стратегией А₄, а стратегия А₂ доминирует над стратегией А₃, следовательно исключаем 3 и 4 строки матрицы:

	В₁	В₂
А₁	0,4	0,9
А₂	0,6	0,5

Допустим, что все элементы (выигрыши) платежной матрицы положительны (a_ij ³ 0) (если это не так, то можно ко всем элементам прибавлять достаточно большое число M, сделав их положительными. При этом цена игры увеличится на M, а решение задачи и не изменится). Если все a_ij ³ 0, то g > 0. Пусть платежная матрица не содержит седловой точки, т.е. игра решается в смешанных стратегиях:

Применение игроком I оптимальной смешанной стратегии гарантирует ему средний выигрыш, не меньше цены игры g, независимо от поведения игрока II. Игрок II, применяя оптимальную смешанную стратегию гарантирует для себя минимальный проигрыш (не больше g).

Если игрок II применяет свою чистую стратегию B_j, а игрок I — свою оптимальную стратегию , то средний выигрыш игрока I равен:

Если игрок I применяет чистую стратегию А_i, а игрок II – свою оптимальную смешанную стратегии , то средний выигрыш игрока II составит

Учитывая, что g_j не может быть меньше g для игрока I, а и не может быть больше g для игрока II, двойственную задачу линейного программирования можно записать следующим образом:

1) для игрока I:

2) для игрока II:

Смысл этих систем уравнений заключается в следующем: игрок I стремится увеличить цену игры (g ® max), он действует так, чтобы его средний выигрыш при использовании его стратегий с вероятностями p_i для любой j-й стратегии игрока II был не меньше величины g, которую он стремится увеличить. Игрок II стремится уменьшить свой проигрыш (g ® min), т.е. он действует так, чтобы его средний проигрыш при использовании его стратегий с вероятностями q_j при любой i-й стратегии игрока I не превышал величину g, которую он стремится уменьшить.

Задача состоит в нахождении двух оптимальных смешанных стратегий и , которые дают для игрока I максимально возможный для него средний выигрыш, а для игрока II минимально возможный для него средний проигрыш.

Разделив левую и правую части неравенств на цену игры g > 0, получим:

Введем обозначения:

Тогда выражения примут следующий вид:

Из равенств и следует, что переменные x_i и y_j должны удовлетворяют условиям:

Учитывая, что игрок I стремится максимизировать g, а игрок II стремится минимизировать g, переменные x_i и y_j должны быть выбраны так, чтобы целевая функция достигала минимума, а целевая функция достигала максимума.

Таким образом, задача решения игры сводится к задаче линейного программирования. Оптимальные стратегии и игры с платежной матрицей А могут быть найдены путем решения симметричной пары двойственных задач линейного программирования: