Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






  • Сервис онлайн-записи на собственном Telegram-боте
    Тот, кто работает в сфере услуг, знает — без ведения записи клиентов никуда. Мало того, что нужно видеть свое расписание, но и напоминать клиентам о визитах тоже. Нашли самый бюджетный и оптимальный вариант: сервис VisitTime.
    Для новых пользователей первый месяц бесплатно.
    Чат-бот для мастеров и специалистов, который упрощает ведение записей:
    Сам записывает клиентов и напоминает им о визите;
    Персонализирует скидки, чаевые, кэшбэк и предоплаты;
    Увеличивает доходимость и помогает больше зарабатывать;
    Начать пользоваться сервисом
  • Елементи теорії ігор.






    Основний постулат теорії ігор – будь-який суб'єкт системи – щонайменше так само розумний, як і сторона, що оперує, і робить усе можливе, щоб досягти своїх цілей. Від реального конфлікту гра (математична модель конфлікту) відрізняється тим, що вона ведеться за визначеними правилами, що встановлюють порядок і черговість дій суб'єктів системи, їх поінформованість, порядок обміну інформацією, формування результату гри.

    Існує багато класів ігор, що відрізняються кількістю гравців, числом ходів, характером функцій виграшу і т.д. Виділимо такі основні класи ігор:

    · антагоністичні (гри зі строгим суперництвом) і неантагоністичні. У першому випадку цілі гравців протилежні, у другому – можуть співпадати;

    · стратегічні і нестратегічні (у перших суб'єкт системи діє незалежно від інших, переслідуючи свої цілі, у других – суб'єкти вибирають єдину для всіх стратегію);

    · парні ігри й ігри для N- осіб;

    · коаліційні і безкоаліційні;

    · кооперативні і некооперативні (у перших можливий обмін інформацією про можливі стратегії гравців);

    · кінцеві і нескінченні (у перших – кінцеве число стратегій).

    Найбільше поширення на практиці мають парні стратегічні безкоаліційні кінцеві некооперативні ігри. Модель проблемної ситуації в цьому випадку має вигляд:

    < U, V, W1, W2, R1, R2 >,

    де U – множина стратегій сторони, що оперує, (конструктора);

    V – множина стратегій сторони, що опонує, (технолог і природа);

    W1 і W2 – показники якості гравців;

    R1 і R2 – системи переваг гравців.

    Системи переваг гравців, у свою чергу, ґрунтуються на двох провівдних принципах раціонального поводження: принципі найбільшого гарантованого результату і принципі рівноваги.

    Перший грунтується на тому, що раціональним вибором одного з гравців повинен вважатися такий, при якому він розраховує на найнесприятливішу для нього реакцію з боку іншого гравця.

    Другий принцип говорить, що раціональним вибором будь-якого гравця вважається така стратегія u$ (чи v$), для якої ситуація (u$, v$) взаємовигідна: будь-яке відхилення від даної ситуації гри не є вигідним ні для одного з гравців.

    Вирішується парна матрична гра з нульовою сумою (виграш однієї сторони дорівнює програшу іншої) на основі розгляду платіжної матриці, що являє собою сукупність значень U і V (пари стратегій (u, v) U ´ V називається ситуацією гри) а також виграшів Wij при парному сполученні всіх можливих стратегій сторін.

    Рішення парної матричної гри може бути в чистих стратегіях, коли для кожної зі сторін може бути визначена єдина оптимальна стратегія, відхилення від який невигідно обом гравцям. Якщо вигідно використовувати кілька стратегій з визначеною частотою їхнього чергування, то рішення знаходиться в змішаних стратегіях.

    Основні особливості використання методів теорії полягають у наступному. Як можливі стратегії з боку проектованої системи розглядаються можливі варіанти її побудови, з яких варто вибрати найбільш раціональний. Як стратегії супротивника розглядаються можливі варіанти його протидії, стратегії їхнього застосування.

    Необхідно відзначити, що при розгляді ігор з використанням адаптивної системи число її стратегій може бути істотно розширене завдяки реалізації " гнучких" рішень. Аналіз ігрових ситуацій у цьому випадку може бути спрямований не тільки на вибір раціонального варіанта проектованої системи, але і на визначення алгоритмів раціонального застосування системи в конфліктній ситуації.

    Інша особливість застосування методів теорії ігор полягає у виборі рішень, одержуваних на основі аналізу конфліктної ситуації. У теорії ігор доводиться теорема про те, що оптимальна стратегія для кожного з гравців є оптимальною і для іншого. Так, якщо рішення гри отримане в чистих стратегіях (є сідлова точка), то вибір рішення однозначний. Наприклад, якщо для парної антагоністичної гри 3´ 4 скласти матрицю, де елементами uij будуть виграші (програші) гравців, то сідлова точка знаходиться на перетині максиміну рядків і мінімаксу стовпців.

    Оптимальними стратегіями гри наведеної в табл. 8.1 будуть для A – 2, для B – 2. Ціна гри дорівнює 5. Відзначимо, що у випадку наявності сідлової точки жоден із гравців не може поліпшити стратегію, і стратегії такі називаються чистими. Відзначимо, що гра з чистими стратегіями може існувати тільки при наявності повної інформації про дії супротивника.

    Таблиця 8.1

    Стратегії A Стратегії B min рядків
           
               
               
          -4   -4
    max стовпців          

    Якщо ж рішення гри отримане в змішаних стратегіях, то це еквівалентно створенню безлічі варіантів проектованого компонента і використанню їх з оптимальними частотам, що відповідають оптимальній змішаній стратегії. У випадках, коли немає повної інформації про дії супротивника, вводяться імовірності застосування тієї чи іншої стратегії у вигляді векторів


     

    P< n> =< p1, p2,..., pn> - для гравця A, де ;
    Q< m> =< q1, q2,..., qn> - для гравця B, де .

     

    При цьому гравець A вибирає стратегію відповідно до принципу максиміну за виразом:

    а гравець B за принципом мінімаксу

    Розглянемо приклад: нехай розглядається прийняття рішення в грі 2´ 2, де гравець A знає імовірність стратегії 1, тобто p1, тоді очевидно імовірність стратегії 2 буде 1- p, відповідно стратегії гравця B будуть q1 і 1-q1. Платіжна матриця буде мати вигляд:

        B   (8.1)
        q1 1-q1
    A p1 a11 a12
      1-p1 a21 a22

    На підставі матриці (8.1) і наведених вище виразів складається таблиця:

    Таблиця 8.2

    Чисті стратегії гравця В Очікувані виграші гравця А
      (a11-a21)p1 + a21
      (a12-a22)p1 + a22

    З табл. 8.2 видно, що очікуваний виграш гравця A лінійно залежить від імовірності p1 (у даному випадку задача може бути вирішена графоаналітично). Тоді змішана стратегія гравця А буде мати вид

    < p*1, p*2>,

    тобто гравцю A вигідно застосовувати стратегію 1 з частотою (імовірністю) – p1, а стратегію 2 з частотою p2.

    Очевидно, що розробка декількох варіантів поведінки пов’язана з великими витратами, не завжди може бути реалізована й ускладнює використання системи. Тому при одержанні рішення в змішаних стратегіях рекомендуються такі випадки прийняття остаточного рішення:

    · для подальшого застосування вибирається той варіант, що гарантує максимальну якість (вибір за максимінною стратегією аналогічно критерію Вальда);

    · вибирається той варіант, що у змішаній стратегії повинен використовуватися з максимальною імовірністю;

    · реалізується кілька варіантів поведінки з частотами, що відповідають змішаній стратегії (створення адаптивно-модульних конструкцій).

    Важливе значення в задачах дослідження якості адаптивних систем має не тільки рішення гри, але й аналіз платіжної матриці. Це особливо важливо в тих випадках, коли рішення в змішаних стратегіях не реалізується. Цей аналіз може проводитися на основі:

    - оцінки можливих втрат ефективності у випадку реалізації чистої стратегії;

    - визначення додаткових витрат на їхню компенсацію за допомогою " гнучких" рішень;

    - оцінки імовірності розглянутих стратегій протидії;

    - визначення можливості реалізації компромісних варіантів і т.ін.

    Для аналізу конфліктної ситуації потрібно на основі математичної моделі операції побудувати платіжну матрицю [Wmn] = [Wij], де Wij характеризує якість вибору при виборі
    i- го варіанта реалізації і при j- му варіанті протидії супротивника.

    Рішення може бути отримане в чистих стратегіях, коли є сідлова точка. Умова сідлової точки має вигляд

    (8.2)

     

    де ліва частина виразу – нижня ціна гри, права – верхня ціна гри.

    Якщо умова

    де М – математичне очікування – не виконується, то сідлова точка відсутня і потрібна реалізація змішаної стратегії.

    Рішення в змішаних стратегіях полягає в реалізації чистих стратегій з різними імовірностями, що задаються розподілом:

    для шуканого вибору – у в идгляі вектора-стовпця

    G = {gi}, де i = 1, 2...m; ;

    для протидії – у вигляді вектора-рядка

    F = {fj}, де j = 1, 2...n; ,

    де gi – імовірність вибору стратегії ui;

    fj – імовірність вибору стратегії vj.

    Платіжну функцію запишемо в токому вигляді:

    де індексом " т" позначена процедура транспонування.

    Платіжна функція W(G, F) завжди має сідлову точку, тобто завжди існує рішення матричної гри. Це твердження відповідає основній теоремі теорії матричних ігор: кожна матрична гра з нульовою сумою має, принаймні, одне рішення в чистих чи змішаних стратегіях.

    Послідовність вирішення гри така:

    1. Аналізується платіжна матриця на предмет виключення свідомо невигідних і дублюючих стратегій.

    2. Перевіряється наявність сідлової точки за умовою (8.2).

    3. Якщо рішення в чистих стратегіях відсутнє, то шукається рішення в змішаних стратегіях за допомогою методів лінійного програмування або методом Монте-Карло.

    У співвідношенні стратегії і результатів в задачах прийняття рішень можливі три ситуації, які суттєво визначають моделі і процедуру рішення.

    1. Визначеність. Кожна альтернатива приводить до єдиного рішення (усі розглянуті раніше задачі відносяться до цього класу).

    2. Характеризуються наявністю ризику – кожна альтернатива приводить до безлічі результатів. Відомі імовірності появи результатів. Для рішення задач з ризиком використовується оптимізація в середньому. У якості найкращої вибирається така стратегія, що перетворює в максимум математичне очікування показника ефективності.

    3. Найбільш складні задачі – це задачі, що вирішуються в умовах невизначеності. У таких задачах відомий набір результатів, але не відомі імовірності їхньої появи. Для рішення задач в умовах невизначеності використовуються спеціальні критерії: Вальда, Севіджа, Гурвіца.


    Питання до курсу






    © 2023 :: MyLektsii.ru :: Мои Лекции
    Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
    Копирование текстов разрешено только с указанием индексируемой ссылки на источник.