Принятие решений в условиях риска, неопределенности и конфликты.

⇐ ПредыдущаяСтр 2 из 43Следующая ⇒

Конфликт имеет место, если в операции участвуют две и более оперирующих сторон, преследующих несовпадающие цели. Неопределенность у одной из сторон возникает в связи с неизвестностью линии поведения других сторон, в то время как результат зависит от поведения всех участников операции.

Во многих случаях ситуацию неопределенности можно представить (или аппроксимировать) матрицей вида

Альтернативы	Состояние среды
Q1	Q2	...	Qn
А1	U 11	U 12	...	U 1n
А2	U 21	U 22	...	U 2n
...	...	...	U ij	...
Аm	U m1	U m2	...	U mn

(где U ij - результат (исход) выбора альтернативы A i при условии, что среда окажется в состоянии Q j; U ij может иметь смысл прибыли, дохода, выигрыша или затрат, проигрыша, убытков и т.п.).

Прежде чем выбирать решение на этой модели, нужно определиться с принципом оптимальности, на основе которого будут сравниваться альтернативы, так как только одно желание ЛПР получить наилучший результат не дает такой основы. Принцип оптимальности зависит от точки зрения на ситуацию ЛПР, его отношения к риску, от предположений относительно поведения среды. Наиболее характерной гипотезой поведения среды является представление, что среда ведет себя наихудшим образом («как назло»). Это самый пессимистический взгляд на ситуацию, свойственный ЛПР, не склонному к риску. В этом случае выбор решения основывается на принципе гарантированного результата (иногда его называют критерием Вальда). Он состоит в том, что эффективность каждой альтернативы оценивается наихудшим из исходов, возможных при выборе данной альтернативы. Такой результат гарантируется, то есть будет не хуже, при любом фактическом состоянии среды. Теперь очевидно, что наилучшим решением в смысле принятого принципа оптимальности будет выбор той альтернативы, которая имеет наилучший гарантированный результат. Так, если U ij имеет смысл прибыли, то оценкой i-й альтернативы является , а оптимальной будет альтернатива, максимизирующая эту величину, то есть A i, на которой достигается . Применительно к этой ситуации принцип гарантированного результата называют принципом максимина, а оптимальную альтернативу - максиминной. В условиях неопределенности только этот принцип имеет объективное обоснование и дает абсолютно надежную оценку.

Другой подход, называемый также критерием Сэвиджа, использует аналогичный прием, но по отношению к преобразованной матрице - матрице риска (сожалений) [r ij], где , то есть риск - это разность между максимально возможным выигрышем при j-м состоянии среды и выигрышем при выборе i-й альтернативы в условиях незнания о фактическом состоянии среды. Так как цель состоит в уменьшении риска, то, используя принцип минимакса (гарантированного риска), определим как оптимальную ту альтернативу, на которой достигается , и тогда риск не превысит этой величины ни при каком состоянии среды (U ij – min U ij).

Гибкий учет отношения ЛПР к риску возможен с помощью критерия Гурвица. Если исходы имеют смысл дохода, то оптимальная альтернатива определяется из условия

где =[0, 1] - коэффициент риска. При ориентации на самое худшее =0, что соответствует критерию Вальда, а для крайнего оптимиста =1. Промежуточные значения отражают разный уровень риска ЛПР. Возможны и другие подходы к выбору оптимальных решений в условиях неопределенности, но все они, как и последние два, не гарантируют достижение расчетных результатов.

Игра(модель конфликта) характеризуется известным количеством участников, называемых игроками, правилами игры, множеством возможных ситуаций и соответствующими им выигрышами или проигрышами. По методу ведения игры различают дискретные игры, в которых игроки совершают поочередные ходы, и непрерывные, когда игроки действуют непрерывно. Последние также называют играми преследования или дифференциальными играми, так как поведение игроков описывается дифференциальными уравнениями. По количеству ходов выделяют игры с конечным и бесконечным числом шагов. Аналогичное деление производится по числу стратегий игроков. По форме платы различают игры с нулевой суммой, когда выигрыши одних равны проигрышам других, и поэтому их также называют антагонистическими, и игры с ненулевой суммой, в которых выигрыши и проигрыши не совпадают. В зависимости от числа игроков говорят об играх 2, 3 …, N лиц. Дискретную игру двух лиц с ненулевой суммой называют биматричной игрой, в ней каждой ситуации соответствует два платежа (по одному для каждого игрока).

Простейшей является дискретная игра двух лиц с нулевой суммой. Такая игра полностью представляется своей платежной матрицей, в которой отражены стратегии игроков и платежи, имеющие противоположный смысл для игроков:

Стратегии игрока А	стратегии игрока B
B1	B2		Bn
A1	U 11	U 12		U 1n
A2	U 21	U 22		U 2n
			U ij
Am	U m1	U m2		U mn

Здесь U ij - платеж, соответствующий ситуации Ai-Bj. В конкретной игре указывается, что понимается под U ij _. Например, будем дальше считать, чтоU ij имеет смысл выигрыша игрока A и, следовательно, для игрока B это проигрыш.

Найти решение такой игры – значит, определить оптимальное поведение каждого из игроков и соответствующий результат, называемый ценой игры. Метод решения основан на уже рассматриваемом принципе гарантированного результата, но он применяется обоими игроками. В данном случае этот принцип означает, что каждый из игроков при выборе своего поведения предполагает наилучшее поведение другого игрока, то есть рассчитывает на наихудший для себя вариант. Таким образом, игрок A будет определять свое поведение на основе максимина , а игрокB - на основе минимакса. Величина называется верхней ценой игры, так как игрок B проиграет не более этой величины, если будет вести себя оптимально, следовательно, - гарантированный проигрыш игрока B, а для игрока A это максимально возможный выигрыш. Нижняя цена игры есть гарантированный выигрыш игрока A, то есть при оптимальном поведении он выиграет не меньше, в то время как для игрока B это минимально возможный проигрыш. Нетрудно доказать, что , и поэтому в общем случае цена игры лежит в диапазоне . Если , то игра имеет решение в области чистых стратегий. Это значит, что каждый из игроков будет придерживаться только одной своей стратегии, иначе говоря, одна (оптимальная) стратегия будет применяться с вероятностью единица, а все остальные - с вероятностью нуль. Такое решение соответствует седловой точке платежной матрицы. Когда U ij - выигрыш игрока A, в седловой точке значение u_ij^* = иявляется наибольшим в столбце и наименьшим в строке. Таким образом, при наличии седловой точки решение всегда находится в области чистых стратегий, а оптимальные стратегии - это стратегии, на пересечении которых лежит седловая точка.

Оптимальное решение в области смешанных стратегий может быть реализовано только при многократном (теоретически бесконечном) повторении игры, а цена игры есть соответствующее оптимальному поведению математическое ожидание результата (средний выигрыш или проигрыш на один розыгрыш). Иногда можно сократить число стратегий одного из игроков или даже обоих за счет отбрасывания доминируемых стратегий, то есть стратегий, которые заведомо не будут активными в оптимальном решении. Для выявления таких стратегий проводят попарные сравнения стратегий одного из игроков. Та стратегия, на которой платежи не лучше, чем на другой, для всех стратегий противника и хотя бы для одной хуже, является доминируемой и может быть отброшена. После сокращения числа стратегий у одного игрока возможно появление доминируемых стратегий у второго. Поэтому анализ можно повторять, поочередно меняя игрока, пока не удалятся все доминируемые стратегии. Если число стратегий у одного из игроков сократится до двух, игра решается графически. В общем случае решение в области смешанных стратегий находится методами линейного программирования.

Помимо рассмотренных применяются также модели коалиционных и кооперативных игр. Так, в игре лиц ( 2) с нулевой суммой в процессе игры могут образовываться объединения части игроков против остальных, если такая коалиция улучшает результаты всех объединившихся игроков, что обеспечивается побочными платежами со стороны инициатора объединения. В отличие от этого кооперативная игра может улучшать результаты всех игроков за счет предварительных договоренностей с заключением обязывающих соглашений (в играх с ненулевой суммой). Очевидно, что кооперация возможна и в игре двух лиц.

Игровые модели находят применение в основном при исследовании военных операций и в экономике. Если вторая оперирующая сторона представляет собой некую среду с неизвестными вероятностями состояний, то такая ситуация также может моделироваться игрой, которая называется игрой против природы.

⇐ Предыдущая 123 4 5 6 7 8 9 10 Следующая ⇒

© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.