Разделы сайта

Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Теоретические сведения. Для двух игроков А и В задана платежная матрица

⇐ ПредыдущаяСтр 22 из 26Следующая ⇒

Для двух игроков А и В задана платежная матрица

		Стратегии игрока B
B₁	B₂	B₃	B₄	B₅
Стратегии игрока A	A₁	-2		-1
A₂	-1		-2
A₃				-1
A₄	-1
A₅		-1		-1	-1

Игрок А использует логику, которая гарантирует ему максимальный выигрыш вне зависимости от поведения игрока В.

Определяются минимальные элементы каждой строки, что соответствует минимальным выигрышам игрока А при каждой стратегии и среди них, находится максимальное число, равное -1.

Таким образом, свой выбор, игрок А остановит на стратегии A₃, которая обеспечит ему выигрыш -1, т.е. потерю не более 1 ден.ед.

Значение равное -1, называется нижней ценой игры.

		Стратегии игрока B	Минимальный элемент в строке
B₁	B₂	B₃	B₄	B₅
Стратегии игрока A	A₁	-2		-1			-2
A₂	-1		-2			-2
A₃				-1		-1
A₄	-1					-1
A₅		-1		-1	-1	-1

Игрок В использует логику, которая гарантирует ему минимальный проигрыш вне зависимости от поведения игрока А.

Определяются максимальные элементы каждого столбца, что соответствует максимальным проигрышам игрока В при каждой стратегии и среди них, находится минимальное число, равное 1.

Свой выбор, игрок В остановит на стратегии В₃, которая обеспечит ему проигрыш 1, т.е. потерю не более 1 ден.ед.

Значение равное 1, называется верхней ценой игры.

		Стратегии игрока B	Минимальный элемент в строке
B₁	B₂	B₃	B₄	B₅
Стратегии игрока A	A₁	-2		-1			-2
A₂	-1		-2			-2
A₃				-1		-1
A₄	-1					-1
A₅		-1		-1	-1	-1
Максимальный элемент в столбце

Если верхняя цена игры равна нижней цене игры (седловая точка), то было бы найдено решение, которое устраивает обоих игроков, исходя из их логики. В рассматриваемом примере, если игроки пользуются только чистыми стратегиями, оптимальное решение не найдено. Но, всегда есть решение в смешанных стратегиях.

Смешанной стратегией игрока А называется применение чистых стратегий A₁, A₂, A₃, A₄, A₅ c вероятностями p₁, p₂, p₃, p₄, p₅.

Смешанную стратегию первого игрока обозначают как вектор

P = (p₁, p₂, p₃, p₄, p₅),

где p₁ + p₂ + p₃ + p₄ + p₅ = 1; p₁, p₂, p₃, p₄, p₅ 0.

Смешанной стратегией игрока B называется применение чистых стратегий B₁, B₂, B₃, B₄, B₅ c вероятностями q₁, q₂, q₃, q₄, q₅.

Смешанную стратегию второго игрока обозначают как вектор

Q = (q₁, q₂, q₃, q₄, q₅),

где q₁ + q₂ + q₃ + q₄ + q₅ = 1 и q₁, q₂, q₃, q₄, q₅ 0

Оптимальное решение игры (или просто - решение игры) - это пара оптимальных смешанных стратегий

P* (p*₁, p*₂, p*₃, p*₄, p*₅) и Q* (q*₁, q*₂, q*₃, q*₄, q*₅),

Таким образом, если один из игроков придерживается своей оптимальной стратегии, то другому невыгодно отступать от своей стратегии.

Выигрыш игрока А равный проигрышу игрока В, соответствующий оптимальному решению, называется ценой игры v.

Цена игры больше либо равна нижней цены игры и меньше или равна верхней цены игры, т.е. -1 v 1.

Исходную платежную матрицу можно уменьшить, если исключить из нее стратегии, которыми заведомо не выгодно пользоваться игрокам.

		Стратегии игрока B
B₁	B₂	B₃	B₄	B₅
Стратегии игрока A	A₁	-2		-1
A₂	-1		-2
A₃				-1
A₄	-1
A₅		-1		-1	-1

1. Стратегия A₄ является доминирующей над стратегией A₁, т.к. каждый элемент строки 4 больше или равен соответствующего элемента строки.

Игроку А заведомо не выгодно пользоваться стратегией A₁. Удаляем стратегию A₁ из рассмотрения.

		Стратегии игрока B
B₁	B₂	B₃	B₄	B₅
Стратегии игрока A	A₂	-1		-2
A₃				-1
A₄	-1
A₅		-1		-1	-1

2. Стратегия A₃ является доминирующей над стратегией A₅, поэтому удаляем стратегию A₅ из рассмотрения.

		Стратегии игрока B
B₁	B₂	B₃	B₄	B₅
Стратегии игрока A	A₂	-1		-2
A₃				-1
A₄	-1

3. Стратегия B₄ является доминирующей над стратегией B₅. Удаляется стратегия B₅ из рассмотрения.

		Стратегии игрока B
B₁	B₃	B₄
Стратегии игрока A	A₂	-1	-2
A₃			-1
A₄	-1

4. Игроку А заведомо не выгодно пользоваться стратегией A₂. Удаляется стратегия A₂ из рассмотрения.

		Стратегии игрока B
B₁	B₃	B₄
Стратегии игрока A	A₃		-1
A₄	-1

После преобразований платежной матрицы, оптимальное решение будем искать в виде:

P* = (0, 0, p*₃, p*₄, 0),

Q* = (q*₁, 0, q*₃, q*₄, 0).

В задаче, значение цены игры определяется неравенством -1 v 1. В дальнейшем, потребуется, чтобы цена игры была положительной, для этого воспользуемся следующей теоремой.

Если к каждому элементу платежной матрицы прибавить положительное число, то цена игры увеличится на это число, при этом оптимальное решение игры не изменится. Если все элементы матрицы больше или равны нулю, то и цена игры будет положительной.

Таким образом, необходимо ко всем элементам матрицы прибавить число, равное по модулю наименьшему элементу матрицы.

Прибавим 1 к каждому элементу матрицы. Тогда, цена исходной игры v = v₁ -1, где v₁ - цена игры новой матрицы.

		Стратегии игрока B
B₁	B₃	B₄
Стратегии игрока A	A₃
A₄

Если P* = (0, 0, p*₃, p*₄, 0) и Q* = (q*₁, 0, q*₃, q*₄, 0) являются оптимальным решением, то должны выполняться две следующие системы неравенств:

8 p*₃ v₁

2 p*₃ + p*₄ v₁

4 p*₄ v₁

8 q*₁ + 2 q*₃ v₁

q*₃ + 4 q*₄ v₁

Рассмотрим первую систему.

Разделим все члены системы на цену игры v₁. Знаки в неравенствах системы не изменятся, так как цена игры положительная.

Введем новые обозначения:

y₁ = p*₃ / v₁, y₂ = p*₄ / v₁

Рассмотрим сумму:

y₁ + y₂ = p*₃ / v₁ + p*₄ / v₁ = 1/v₁ * (p*₃ + p*₄) = 1/v₁,

где (p*₃ + p*₄)=1 (сумма вероятностей используемых стратегий равна единице).

Игрок A старается увеличить свой выигрыш, т.е. цену игры v₁, поэтому выражение 1/v₁ будет стремиться к минимуму. Таким образом, из первой системы будет получена задача линейного программирования.

Требуется найти минимум линейной функции

F = y₁ + y₂

при следующей системе ограничений:

8 y₁ 1

2 y₁ + y₂ 1

4 y₂ 1

Рассмотрим вторую систему.

Введем новые обозначения:

x₁ = q*₁ / v₁, x₂ = q*₃ / v₁, x₃ = q*₄ / v₁

Рассмотрим сумму:

x₁ + x₂ + x₃ = q*₁ / v₁ + q*₃ / v₁ + q*₄ / v₁ = 1/v₁ * (q*₁ + q*₃ + q*₄) = 1/v₁

Игрок B старается уменьшить свой проигрыш, т.е. цену игры v₁, поэтому выражение 1/v₁ будет стремиться к максимуму. Таким образом, из первой системы будет получена задача линейного программирования.

Требуется найти максимум линейной функции

L = x₁ + x₂ + x₃

при следующей системе ограничений:

8 x₁ + 2 x₂ 1

x₂ + 4 x₃ 1

Полученные задачи являются парой симметричных взаимно двойственных задач.

Если решить одну из этих задач, то автоматически будет получено решение второй.

Для решения воспользуемся симплекс-методом, реализованного в виде надстройки Excel Поиск решений (лабораторная работа 3).

В книге Поиск решений на странице Таблица с формулами последовательно внести данные первой и второй систем и найти решение. Предварительно изменить формат ячеек для переменных и целевой функции на числовой с двумя знаками после запятой.

Решение для первой задачи

y₁ = 0, 38; y₂ = 0, 25; F = 0, 63.

Решение для второй задачи

х₁ = 0; х₂ = 0, 5; х₃ = 0, 13; L = 0, 63.

Максимальное значение функции прямой задачи равно минимальному значению функции двойственной задачи.

Найдем цену игры v₁.

v₁= 1 / F = 1 / L = 1/0, 63 = 1, 6

Так как к каждому элементу матрицы мы прибавили 1, следовательно, цена исходной игры равна:

v = v₁ - 1 = 1, 6 - 1 = 0, 6.

Теперь можно найти оптимальное решение игры.

Вероятности стратегий игрока А.

p*₁ = 0;

p*₂ = 0;

p*₃ = y₁ * v₁ = 0, 38 * 1, 6 = 0, 6;

p*₄ = y₂ * v₁ = 0, 25 * 1, 6 = 0, 4;

p*₅ = 0;

P* = (0; 0; 0, 6; 0, 4; 0);

Цена игры v = 0, 6.

Вероятности стратегий игрока В.

q*₁ = x₁ * v₁ = 0 * 1, 6 = 0;

q*₂ = 0;

q*₃ = x₂ * v₁ = 0, 5 * 1, 6 = 0, 8;

q*₄ = x₃ * v₁ = 0, 13 * 1, 6 = 0, 2;

q*₅ = 0.

Q* = (0; 0; 0, 8; 0, 2; 0)

Цена игры v = 0, 6.

Анализ результата решения задачи.

Выигрыш игрока А составит 3/5 денежных единиц, а проигрыш игрока В составит ту же сумму (игра с нулевой суммой).

Игрок А использует свои стратегии следующим образом:

- A₁ на 0 %

- A₂ на 0 %

- A₃ на 60 %

- A₄ на 40 %

- A₅ на 0 %

Игрок B использует свои стратегии следующим образом:

- B1 на 0 %

- B2 на 0 %

- B3 на 80 %

- B4 на 20 %

- B5 на 0 %

⇐ Предыдущая 17 18 19 20 212223 24 25 26 Следующая ⇒

© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.