Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






  • Сервис онлайн-записи на собственном Telegram-боте
    Тот, кто работает в сфере услуг, знает — без ведения записи клиентов никуда. Мало того, что нужно видеть свое расписание, но и напоминать клиентам о визитах тоже. Нашли самый бюджетный и оптимальный вариант: сервис VisitTime.
    Для новых пользователей первый месяц бесплатно.
    Чат-бот для мастеров и специалистов, который упрощает ведение записей:
    Сам записывает клиентов и напоминает им о визите;
    Персонализирует скидки, чаевые, кэшбэк и предоплаты;
    Увеличивает доходимость и помогает больше зарабатывать;
    Начать пользоваться сервисом
  • Решение игры 2х2 в смешанных стратегиях аналитическим методом






     

    Рассмотрим игру с размерностью платежной матрицы 2 х 2, которая является простейшим случаем конечной игры. Если такая игра имеет седловую точку, то оптимальное решение - это пара чистых стратегий, соответст­вующих этой точке.

    Для игры, в которой отсутствует седловая точка, в соответствии с основной теоремой теории игр оптимальное решение существует и определяется парой смешанных стратегий и

    Для того чтобы их получить, воспользуемся теоремой об активных стратегиях. Если игрок А придерживается своей оптимальной стратегии RA*, то его средний выигрыш будет равен цене игры V, какой бы активной стратегией ни пользовался игрок В.

    Для игры 2 x 2 любая чистая стратегия противника является активной, если отсутствует седловая точка. Выигрыш игрока А (проигрыш игрока В) - случайная величина, математическое ожидание (среднее значение) которой является ценой игры. Поэтому средний выиг­рыш игрока А (оптимальная стратегия) будет равен V и для l-й, и для 2-й стратегии противника.

    Пусть игра задана платежной матрицей

    Средний выигрыш игрока А, если он использует оптимальную смешанную стратегию

    ,

    а игрок В - чистую страте­гию В1 (это соответствует l-му столбцу платежной матрицы Н ), равен цене игры V:

    Тот же средний выигрыш получает игрок А, если 2-й игрок применяет стратегию В2, т .

    Учитывая, что , получаем систему уравнений для определения оптимальной стратегии RA* и цены игры V:

    Решая эту систему уравнений, получим аналитические выражения для вычисления вероятностей оптимальной смешанной стратегии

    и цену игры

     

    .

    Применяя теорему об активных стратегиях при отыскании SB*- оптимальной стратегии игрока В, получаем, что при любой чистой стратегии игрока А (R1 или R2 ) средний проигрыш игрока В равен цене игры V, т.е.

     

    Тогда вероятности применения оптимальной стратегии SB(q1*, q2*)определяется по формулам:

    Пример 3. Применим полученные результаты для отыскания оптимальных стратегий для игры, имеющей следующее вербальное описание.

    Игра «поиск». Игрок А может спрятаться в одном из двух убежищ (I или II). Игрок В ищет игрока А. Если найдет, то получает штраф 1 ден.ед, в противном случае - платит игроку В 1 ден. ед. Необходимо получить решение игры.

     

    Решение. Определим стратегии игрока A:

    - стратегия A1 – игрок A прячется в убежище I;

    - стратегия A2 – игрок A прячется в убежище II.

    Определим стратегии игрока В:

    - стратегия В1 – игрок В ищет игрока А в убежище I;

    - стратегия В2 – игрок В ищет игрока А в убежище II;

    Если игрок А принял стратегию А1 (прячется в убежище I) и игрок В принял стратегию В1 –(отыскивает игрока А в убежище I), то игрок В обнаруживает игрока А и игрок А платит штраф игроку В 1 д.. ед, т.е. а11 = -1. Аналогично получается а22 = - 1. Очевидно, что стратегии (А1, В2) и (А2, В1) дают игроку А выигрыш в 1 д. ед, т.е. а12 = а21 = 1.

    Получаем платежную матрицу вида .

     

    Вычислим нижнюю α и верхнюю β цену игры:

    α = - 1; β = 1.

    Вывод: игра не имеет седловой точки, решения в чистых стратегиях нет и его необходимо вычислять в смешанных стратегиях.

    Используя полученные формулы, произведем расчеты вероятностей, использования стратегий:

    =

    Подставляя значения коэффициентов aij из платежной матрицы в остальные формулы, получим:

    p2* = q1* = q2* = ½. V = 0.

    Это означает, что оптимальная стратегия каждого игрока состоит в том, чтобы применять свои чистые стратегии случайным образом, выбирая каждое из убежищ с вероятностью 1/2, при этом средний выигрыш (средний проигрыш) будут равны 0.

    Задание 2. В соответствии с номером фамилии в журнале решить игру с заданной платежной матрицей аналитическим методом. Дать интерпретацию полученных результатов.

    Вариант 1. H = . Вариант 2. H =

    Вариант 3. H = . Вариант 4. H = .

    Вариант 5. H = . Вариант 6. H = .

    Вариант 7. H = . Вариант 8. H = .

    Вариант 9. H = Вариант 10. H = .

    Вариант 11. H = . Вариант 12. H = .

    Вариант 13. H = . Вариант 14. H = .

    Вариант 15. H = .






    © 2023 :: MyLektsii.ru :: Мои Лекции
    Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
    Копирование текстов разрешено только с указанием индексируемой ссылки на источник.