Разделы сайта

Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Математическая модель задачи принятия решений в условиях неопределенности состояний среды

⇐ ПредыдущаяСтр 35 из 60Следующая ⇒

Пусть субъект риска имеет в своем распоряжении n стратегий – х ₁, х ₂,... х_n. Каждая стратегия может осуществиться в стохастически неопределенной обстановке, относительно которой можно лишь сделать m предположений. Эти предположения s ₁, s ₂,..., s_m будет рассматривать как состояние среды или стратегии природы. Каждой стратегии субъекта риска и каждому возможному состоянию среды соответствует результат (исход) aij, определяющий выигрыш (или потери) субъекта риска.

Таким образом, имеет матрицу исходов:

	s ₁	s ₂		s_m
х ₁	а ₁₁	а ₁₂	...	а _{1 m}
х ₂	a ₂₁	a ₂₂	...	a _{2 m}
	...	...	...	...
х_n	a_n ₁	a_n ₂	...	a_nm

Задача заключается в определении такой стратегии, которая обеспечила бы субъекту риска наибольшую полезность.

Пример. Фермер может засеять поле тремя видами семян, (стратегии Х_i, i = 1, 2, 3). Урожайность и, соответственно, прибыль а_ij зависят от климатических условий. Год может быть засушливым (состояние среды S ₁); нормальным (S ₂) или дождливым (S ₃). В зависимости от ситуации (Х_i, S_j), і =1, 2, 3; ј = 1, 2, 3, платежная матрица (матрица прибыли фермера) имеет вид

где a_ij измеряются, например, в тыс. грн.

Фермеру могут быть известны вероятности (или их оценки) q ₁,..., q_m, с которыми природа реализует свои состояния, но он может их и не знать.

В отличие от теории игр, в данной игровой модели субъекту риска никто не противодействует, но элемент неопределенности состояния среды налицо. Игрок В в данной игровой модели – природа, " поведение" которой неизвестно, но во всяком случае не злонамеренно, как в модели матричных игр.

Казалось бы, отсутствие противостоящего разумного противника упрощает задачу выбора решения. Оказывается, нет: не упрощает, а усложняет. Правда, принимающему решение в " игре с природой" в самом деле, легче добиться большего успеха (ведь ему никто сознательно не мешает.), чем в игре с сознательным противником, но ему труднее обосновать свой выбор стратегии. В игре против сознательного противника элемент неопределенности снимается тем, что мы думаем за противника, " принимаем" за него решение, самое неблагоприятное для нас самих. В игре же с природой такая концепция не подходит: кто её знает, как она, природа, себя поведет.

Из сказанного вытекает следующие особенности рассматриваемой модели:

1) как и в теории стратегических игр ЛПР (игрок А) может отбросить все свои чистые стратегии (решения), которые являются дублирующими и доминируемыми, но исключать из рассмотрения состояния (стратегии) среды, которые соответствуют дублирующим и доминирующим стратегиям Sј (назовем условно стратегии игрока В) нельзя, поскольку эти состояния реализовываются независимо от того, выгодны они игроку В или нет;

2) решение ищется только для ЛПР (игрока А), поскольку среда (природа) наши рекомендации не воспринимает и ведет себя совершенно независимо от решений игрока А;

3) при принятии решений в условиях неопределенности состояний среды смешанные стратегии или не улучшают выигрыш игрока А или не всегда их можно реализовать для реальных ситуаций. Во всяком случае, смешанные стратегии имеют смысл только при многократном повторении решения, а в стратегических играх теория строилась из предпосылки, что игра (решение) может осуществляться и один раз;

4) поскольку природа (игрок В) не противостоит ЛПР, то, казалось бы, в этом случае решение найти проще, чем в случае стратегических игр. В действительности принятие решений в условиях неопределенности состояний среды сложнее из-за трудностей выбора критерия оптимальности решения, большой неопределенности в поведение среды (игрока В).

Как будет показано ниже, различные критерии оптимальности при этом часто дают различные решения. Все это обуславливает субъективный риск для принимающего решение, так как ЛПР субъективно выбирает различные критерии оптимальности.

При нахождении оптимального решения может быть использована не только оценочная матрица выигрышей |a_ij|, но и получаемая из нее матрица рисков |r_ji|:

r_ij = max a_ij – a_ij = b _j – a_ij, (4.1)

где – максимальный выигрыш в столбце j.

В соответствии с соотношением (4.1) каждый элемент матрицы решений | a_ij | вычитается из наибольшего элемента max a_ij соответствующего столбца. Таким образом, величина риска интерпретируется как " плата (потери) за незнания состояния среды": если бы ЛПР знало истинное состояние среды S_ј, оно бы выбрало стратегию, соответствующую максимальному выигрышу. Разница между наилучшим результатом для каждого S_ј, и получаемых при других решениях и есть мера риска.

Пример. Построить матрицу рисков для матрицы выигрышей вида:

	S ₁	S ₂	S ₃
Х ₁
Х ₂
Х ₃
Х ₄
Х ₅

Решение. В начале упростим данную матрицу выигрышей. Напомним, что стратегия (решение) Х_i является доминирующей над стратегией (решением) Х_j, если все элементы матрицы выигрышей, соответствующие этой стратегии, не меньше элементов матрицы выигрышей, соответствующих стратегии Х_j, а хотя бы один больше. В этом случае стратегия Х_j называется доминируемой стратегией. Если все элементы, соответствующие стратегии Х_i, равны всем соответствующим элементам матрицы выигрышей для стратегии Х_j, то стратегии Х_i и Х_j называются дублирующими.

Так как решения (чистые стратегии) Х ₁и Х ₄являются дублирующими, а стратегия Х ₅доминируется стратегией Х ₁, то исключим из дальнейшего рассмотрения стратегии Х ₄и Х ₅. Получаем следующую матрицу выигрышей:

	S ₁	S ₂	S ₃
Х ₁
Х ₂
Х ₃

Произведем пересчет этой матрицы выигрышей в матрицу рисков.

Находим b _j, :

Рассчитаем элементы матрицы рисков:

Таким образом, матрица рисков имеет вид:

	S ₁	S ₂	S ₃
Х ₁
Х ₂
Х ₃

Элементы матрицы рисков, соответствующие различным стратегиям, характеризуют общую неблагоприятность для субъекта риска отдельных состояний природы.

В рассмотренном выше примере состояние природы S ₁ особенно неблагоприятно для стратегии Х ₃ (r ₃₁ = 150). Чем меньше величина риска r_ij, тем удачнее выбрано решение Х_i при данном состоянии среды S_j. Очевидно, что если бы субъект риска знал, какое будет состояние среды S_j, то выбрал бы решение, при которой его выигрыш максимален, а при этом решении соответствующий риск r_ij равен нулю.

Если исходная оценочная матрица | b_ij | является матрицей проигрышей (убытков, негативных результатов для ЛПР), то элементы матрицы рисков определяются по формуле:

r_ij = b_ij – min a_ij _. (4.2)

В этом случае количественной мерой риска выступает разница между результатом, который получает ЛПР при различных стратегиях и наилучшим результатом для данного состояния среды.

Пример. Построить матрицу риска для случая, когда оценочная матрица является для ЛПР матрицей проигрышей:

	s ₁	s ₂
х ₁
х ₂

Решение. Используя выражение (4.2), получаем матрицу рисков:

	s ₁	s ₂
Х ₁
х ₂

Принятие решения представляет собой выбор одного решения Х _optиз конечного множества возможных решений Х ₁,..., Х_n. Выбор оптимального решения производиться по некоторому критерию оптимальности

Х _opt = { Х_k Î Х Ç a_k = max }. (4.3)

Выражение (4.3) читается следующим образом: в качестве оптимального выбирается то решение Х_k, принадлежащее множеству возможных решений Х, для которого оценка a является лучшей из всех оценок решений . Знак Ç означает совместное выполнение условий Х_k Î Х и a_k = max . Получение оценок a_k и выбор оптимального решения в соответствии с выражением (4.3) в общем случае может быть неоднозначным. Но в экономических задачах выбор одного из нескольких хороших решений уже не создает трудностей.

Для принятия решений в условиях неопределенности состояния среды могут применяться следующие критерии:

1) критерий недостаточного обоснования Лапласа;

2) максиминный критерий Вальда (критерий пессимизма);

3) минимаксный критерий Сэвиджа (критерий пессимизма, но с использованием матрицы рисков);

4) критерий пессимизма-оптимизма Гурвица;

5) производный критерий Ходжа-Лемона;

6) критерий Гермейера и др.

⇐ Предыдущая 30 31 32 33 343536 37 38 39 Следующая ⇒

© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.