Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Критерии выбора наилучших стратегий в условиях неопределенности.






1. Критерий Вальда. Этот критерий основан на принципе крайнего пессимизма. Принимающий решение считает, что какую бы стратегию он ни выбрал, природа реализует свое наихудшее состояние. В наихудших условиях принимающий решение находит наилучший выход.

j
Таким образом, принимающий решение для каждой стратегии Аi находит наименьший выигрыш аi=min аij, Затем среди наименьших выигрышей он находит наибольший:

(6.4.1)

Стратегия , соответствующая будет наилучшей по Вальду. Ее часто называют максиминной стратегией.

 

2. Критерий Сэвиджа. Этот критерий основан на принципе минимизации максимального риска. Риском rij, , , принимающего решение называют разницу между тем выигрышем, который он бы получил, если бы знал, какое состояние реализует природа и его реальным выигрышем, то есть, rijij, где .

Матрица рисков R имеет вид:

П1 П2 … Пn

       
   
 
 


А2 r21 r22 … r2n
R=

 
 

 

 


Принимающий решение для каждой стратегии Аi находит максимальный риск ri, ri= . Затем из максимальных рисков выбирает минимальный:

(6.4.2)

Стратегия Аi0, соответствующая минимальному из максимальных рисков ri0, будет наилучшей по Сэвиджу.

3. Критерий Гурвица. Критерий Гурвица является критерием пессимизма-оптимизма. Наилучшей по Гурвицу является стратегия Аi0, соответствующая числу аi0, которое рассчитывается по формуле:

(6.4.3)

Значение параметра γ задает принимающий решение на основании своего опыта и характера. Если γ =1, то критерий Гурвица преобразуется в критерий крайнего пессимизма:

.

Если γ =0, то получаем критерий крайнего оптимизма:

.

Обычно, на практике, выбирают 0< γ < 1.

Пример 6.4.1. Небольшое частное предприятие выпекает диетические хлебобулочные изделия. Оборудование позволяет выпекать 500, 600 или 700 кг изделий в день. Спрос на эти изделия так же может составлять 500, 600 или 700 кг в день. Если хлебобулочные изделия не продаются в этот день, то они возвращаются на предприятие для переработки. Затраты на производство 1 кг изделий составляют 2 тысячи рублей, а цена реализации – 3, 5 тысячи рублей. Дополнительные затраты в случае возврата составляют 1 тысяча рублей на 1 кг изделий. Необходимо определить ежедневный объем выпечки диетических хлебобулочных изделий.

Решение. В этой ситуации можно выделить две стороны: менеджера предприятия, которому необходимо принять решение об объеме производства, действующего сознательно, и спрос на хлебобулочные изделия, который не является сознательно действующим противником. Ситуацию можно назвать конфликтной, так как результаты действий одной стороны зависят от действий другой стороны, не всегда благоприятных для первой.

В нашем примере один игрок – менеджер предприятия. Его возможные действия (стратегии): запланировать выпечку хлебобулочных изделий в объеме либо 500 кг, либо 600 кг, либо 700 кг. Второй игрок – спрос на хлебобулочные изделия (природа). Его возможные действия: установить спрос на хлебобулочные изделия в объеме либо 500 кг, либо 600 кг, либо 700 кг.

Рассчитаем платежную матрицу. Платежная матрица будет иметь размерность 3х3, так как игрок, принимающий решение, имеет три стратегии (А1 – объем выпечки 500 кг, А2 – объем выпечки 600 кг, А3 – объем выпечки 700 кг), и второй игрок, природа, имеет три стратегии (П1 – спрос составит 500 кг, П2 – спрос составит 600 кг, П3 – спрос составит 700 кг). Элементу платежной матрицы а11 соответствуют стратегии А1 и П1, это значит, что предприятие выпечет 500 кг хлебобулочных изделий, и спрос на них определится в объеме 500 кг, т.е. все изделия будут реализованы в тот же день. Тогда прибыль предприятия составит (3, 5 — 2) тыс. руб. х 500 = 750 тыс. руб., т.е. а11 = 750 тыс. руб. Рассчитаем теперь элемент платежной матрицы а12. Ему соответствуют стратегии А1, П2, т.е. предприятие выпечет 500 кг хлебобулочных изделий, а спрос на них определится в объеме 600 кг. Таким образом, все изделия проданы, и прибыль предприятия составит

(3, 5 — 2) х 500=750 тыс. руб., т.е. а12=750 тыс. руб. Аналогично а13=750ден.ед. Рассчитаем элемент платежной матрицы а21. Предприятие выпечет 600 кг хлебобулочных изделий, а спрос на них определится в объеме 500 кг, 100 кг хлебобулочных изделий будет возвращено на переработку. Тогда прибыль предприятия рассчитывается следующим образом: (3, 5-2)х500+(-2-1)х100=750-300=450 тыс. руб., т.е. а21=450 тыс. руб. Точно так же рассчитываются все остальные элементы платежной матрицы. В результате платежная матрица в примере 6.4.1 будет иметь вид:

 
 

 


А2 450 900 900
А=
.

 

 
 
А3 150 600 1050

 


Так как в примере 6.4.1 отсутствует информация о вероятностях, с которыми реализуются стратегии природы, то имеем ситуацию неопределенности. Для выбора наилучших стратегий воспользуемся приведенными выше критериями.

1. Критерий Вальда. Для каждой из стратегий выберем наименьший выигрыш. Для стратегии А1 все состояния природы равнозначны, поэтому условно будем считать, что наименьшим выигрышем принимающего решение будет прибыль 750 тыс. руб., т.е., а1=750 тыс. руб. Для стратегии А2 наихудшим будет состояние природы П1, а наименьшим выигрышем а2= 450 тыс. руб. Для стратегии А3 наименьшим выигрышем будет а3=150 тыс.руб. Запишем наименьшие выигрыши принимающего решение в дополнительный столбец платежной матрицы:

 
 

 

 


.

 

 

Далее из наименьших выигрышей принимающий решение выбирает наибольший, т.е. а1=750= Наибольший из наименьших выигрышей соответствует стратегии А1. Это будет наилучшая стратегия по критерию Вальда. Таким образом, если руководствоваться принципом крайнего пессимизма (критерием Вальда), то следует выпекать 500 кг хлебобулочных изделий диетических сортов в сутки. При этом прибыль предприятия будет не меньше 750 тыс. руб. при любом спросе.

2. Критерий Сэвиджа.

Рассчитаем риск для каждой пары стратегий природы и принимающего решение. Если бы менеджер предприятия точно знал, что природа реализует свое состояние П1, т.е. спрос составит 500 кг, то он бы выбрал стратегию А1; при этом предприятие получило бы прибыль 750 тыс. руб. – наибольшую для состояния природы П1, β 1=750. Для состояния природы П2 наибольшая прибыль равна β 2=900, а для состояния природы П3- β 3=1050. По определению, для стратегии А1 и состояния природы П1 риск, r11, составит β 111=750-750=0, для стратегии А2 и состояния природы П1 риск r21 составит r21= β 121=750-450=300, и так далее.

Получаем матрицу рисков:

 

 

           
     
 
R=
 

 


А2 300 0 150
А2 r21 r22 r23
.

 

       
 
А3 r31 r32 r33
 
А3 600 300 0

 


 

 

Далее принимающий решение для каждой стратегии выбирает максимальный риск. Для стратегии А1 максимальным будет риск, равный 300, т.е. r1=300. Аналогично r2=300; r3=600. В матрицу рисков добавляем столбец, содержащий максимальный риск для каждой стратегии:

 

       
   
 
R=
 

 


А2 300 0 150 300
.

       
 
 
   
А3 600 300 0 600

 

 


Из максимальных рисков принимающий решение выбирает минимальный: r1 = r2 = То есть минимальному из максимальных рисков соответствует и первая и вторая стратегия. Наилучшими по критерию Сэвиджа стратегиями будут А1 и А2.

3. Критерий Гурвица.

Пусть в примере 6.4.1 принимающий решение в равной мере оптимист и пессимист, и он использует критерий Гурвица, в котором γ =1/5.

Для каждой стратегии Аi рассчитаем число аi; :

а1=1/5*750+4/5*750=750,

а2=1/5*450+4/5*900=810,

а3=1/5*150+4/5*1050=870.

.

Числу а3=870 соответствует стратегия А3, т.е. при таком выборе параметра γ наилучшим по Гурвицу вариантом является выпечка 700 кг хлебобулочных изделий.

Таким образом, в примере 6.4.1 лучшей по всем критериям будет первая стратегия. Однако, в некоторых задачах разные критерии могут рекомендовать различные стратегии. Это объясняется неопределенностью ситуации, и тогда можно провести дополнительные исследования. И хотя использование игры с природой при принятии решений в условиях неопределенности не всегда дает однозначный результат, принимающий решение упорядочивает данные, определяет состояния природы и свои возможные решения, оценивает потери и выигрыши для различных вариантов, что способствует повышению качества принимаемых решений.

6.4.3 Критерий выбора наилучших решений в условиях риска

 

Как уже было сказано ранее, в этой ситуации известны вероятности, с которыми реализуются состояния природы. Эти вероятности либо рассчитываются на основе статистических данных, либо определяются экспертным путем. Для принятия решений в условиях риска используется критерий Байеса. Пусть принимающий решение имеет m стратегий, а природа n, причем состояние природы Пj реализуется с вероятностью рj, для каждой стратегии Ai рассчитывается ожидаемый выигрыш ,

Наилучший по Байесу будет стратегия Аi, соответствующая наибольшему ожидаемому выигрышу

, (6.4.4)

 

Пример 6.4.2. Пусть, в примере 6.4.1, спрос на диетические хлебобулочные изделия в объеме 500 кг устанавливаются с вероятностью р1=1/5, в объеме 600 кг с вероятностью р2=3/5 и в объеме 700 кг с вероятностью р3=1/5. Определить ежедневный объем выпечки хлеба.

Решение. Так как в этом примере известны вероятности стратегий природы, то для выбора наилучшей стратегии воспользуемся критерием Байеса.

Для каждой стратегии Аi рассчитаем ожидаемую прибыль

,

,

.

Согласно критерию Байеса наилучшей будет стратегия, соответствующая наибольшему ожидаемому выигрышу: . Т.е. при таких вероятностях спроса на диетические хлебобулочные изделия наилучшей по Байесу стратегией будет вторая: предприятию следует выпекать 600 кг хлебобулочных изделий в день, и тогда ожидаемая прибыль предприятия составит 810 тыс. руб. В платежную матрицу добавим столбец :

 
 

 


 

       
 
 
   
А3 150 600 1050 600

 


В платежной матрице подчеркнем строку, соответствующую наибольшей ожидаемой прибыли и наилучшей по Байесу стратегии.

Кроме ожидаемого выигрыша принимающий решение может рассчитать его вариацию для каждой стратегии. Обозначим вариацию выигрыша для стратегии Аi через Vi, .

Тогда V1=1/5(750-750)2+3/5(750-750)2+1/5(750-750)2=0;

V2=1/5(810-450)2+3/5(810-900)2+1/5(810-900)2=36400;

V3=1/5(600-150)2+3/5(600-600)2+1/5(600-1050)2=81000.

Самую большую вариацию имеет третья стратегия, следовательно она самая рискованная. Наименее рискованной является первая стратегия. Ее риск равен 0. Но и ожидаемый средний выигрыш несколько меньше, чем у второй стратегии. Принимающему решение придется выбирать: либо стратегию А1 с нулевым риском и несколько меньшим ожидаемым выигрышем, либо стратегию А2 с несколько большим ожидаемым выигрышем и значительно большим риском. Выбор будет зависеть от склонности принимающего решение к риску.

 

ВОПРОСЫ ДЛЯ ПОВТОРЕНИЯ

 

1. Что называют природой в теории статистических игр? Как иначе называют статистические игры?

2. Приведите конкретный практический пример конфликтной ситуации, в которой участвовали бы две стороны: принимающий решение и природа?

3. Что Вы понимаете под стратегиями природы и стратегиями лица принимающего решение?

4. Что такое платежная матрица?

5. Чем отличается ситуация неопределенности от ситуации риска?

6. Какие критерии используются для принятия решений в условиях неопределенности и на каких принципах они основаны? Какой из этих принципов выбрали бы Вы?

7. Какие понятия из теории вероятности используются при принятии решений в условиях риска? Что они характеризуют?

8. Что Вы предпочтете, больший ожидаемый доход и больший риск или наоборот?

 

ТЕСТЫ

 

1. Что такое игра?

а) конфликтная ситуация;

б) ситуация, подчиненная определенным правилам;

в) математическая модель конфликтной ситуации.

 

2. Выберите правильный вариант условий неопределенности:

а) неизвестны стратегии природы;

б) неизвестны вероятности стратегий природы;

в) известны вероятности стратегий природы.

 

3. Критерий Вальда основан на принципе крайнего пессимизма. В связи с этим выберите правильный вариант критерия Вальда:

а) ;

б) ;

в) .

 

4. Критерий Сэвиджа основан на принципе минимаксного риска. Риск это:

а) максимальный выигрыш игрока;

б) минимальный выигрыш игрока;

в) разность между максимальным выигрышем игрока для каждого состояния природы и его реальным выигрышем.

 

5. Значение параметра в критерии Гурвица является:

а) стандартной величиной;

б) рассчитывается по определенным правилам;

в) задается принимающим решение на основании опыта.

 

6. Выберите правильный вариант записи критерия Байеса:

а) ;

б) ;

в) .

 






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.