Студопедия

Главная страница Случайная страница

КАТЕГОРИИ:

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Алгоритм прямой прогонки




Обозначим через gj(xj) максимальную прибыль, получаемую на этапах 1,2,...,j при заданном xj, (где xj— размер стада к началу этапа J+1). Рекуррентное соотношение записывается в следующем виде:

- целое.

Сравнение двух формулировок показывает, что представление xj-1 через xj создает более существенные препятствия для вычислений, чем представление zj+1 через zj.

В замене xj-1=(xj+yj)/2 подразумевается целочисленность правой части, тогда как на равенство zj+1=2(zj-yj) такое требование не накладывается. Таким образом в случае процедуры прямой прогонки значения yj и xj, связанные неравенством

Yj <=2jk -Xj,

должны дополнительно удовлетворять условию целочисленности их полусуммы, связанному с видом зависимости хj-1 от xj,. Рассмотренный пример иллюстрирует трудности вычислительного характера, которые обычно возникают при использовании алгоритма прямой прогонки.

Решение задачи о загрузке

Сначала рассмотрим задачу в общей постановке. Если обозначить количество вопросов типа і через ki, то задача принимает следующий вид:

при ограничениях

ki-неотрицательные числа.

Если отбросить требования целочисленности ki, то решение задачи нетрудно найти с помощью симплекс-метода. В самом деле, так как остается лишь одно ограничение, базисной будет только одна переменная, и задача сводится к выбору типа і, для которого величина viW/wi принимает максимальное значение. Исходная задача не является задачей линейного программирования, и для ее решения необходимо использовать метод динамического программирования. Следует отметить, что рассматриваемая задача может быть также решена с помощью методов целочисленного программирования.

Каждый из трех основных элементов модели ДП определяется следующим образом.

1. Этап j ставится в соответствии типу j, j=1,2,…,N.

2. Состояние yj на этапе j выражает суммарный вес вопросов, количество ответов на которые приняты на этапах j,j+1,…,N; при этом y1=W и yj=0,1,…,W при j=2,3,…,N.

3. Варианты решения kj на этапе j описываются количеством вопросов типа j. Значение kj заключено в пределах от нуля до [W/wj], где [W/wj]-целая часть числа (W/wj).

Пусть fi(yi)-максимальный суммарный вес вопросов, ответы на которые приняты на этапах j,j+1,…,N при заданном состоянии yj.

Рекуррентное соотношение (для процедуры обратной прогонки) имеет следующий вид:

Заметим, что максимальное допустимое значение kj ограничено величиной [yj/wj]. Это позволяет автоматически исключать все не являющиеся допустимыми варианты при заданном значении переменной состояния yj.

Решение исходной задачи:

Этап 8.

Этап 7.

Этап 6.



Этап 5.

Этап 4.

Этап 3.

Этап 2.

Этап 1.

Оптимальное решение определяется теперь следующим образом. Из условия W=30 следует, что первый этап решения задачи при y1=30 дает оптимальное решение k1=0, которое означает, что на 0 (нуль) вопросов 1-го типа будут даны ответы. Далее находим:

y1=30 k1=0
y2=y1-2*k1=30 k2=0
y3=y2-4*k2=30 k3=4
y4=y3-k3=26 k4=1
y5=y4-4*k4=22 k5=0
y6=y5-7*k5=22 k6=0
y7=y6-5*k6=22 k7=5
y8=y7-3*k7=7 k8=7

Соответственно оптимальным решением задачи является (0,0,4,1,0,0,5,7), соответственно максимально количество баллов, которое студент может набрать за отведенное время равно 46.

Анализ чувствительности решения

В таблице для первого этапа нам, по существу, необходимо получить оптимальное решение лишь для y1=30, так как это последний этап, подлежащий рассмотрению. Однако в таблицу включены вычисления для y1=0,1,…,30, которые позволяют провести анализ чувствительности решения.

Например, что произойдет, если время отводимое на контрольную работу будет 20, вместо 30?

Y1=20 k1=0
Y2=y1-2*k1=20 k2=0
Y3=y2-4*k2=20 k3=4
Y4=y3-k3=16 k4=0
Y5=y4-4*k4=16 k5=0
Y6=y5-7*k5=16 k6=0
Y7=y6-5*k6=16 k7=3
Y8=y7-3*k7=7 k8=7

соответственно максимально количество баллов, которое студент может набрать за отведенное время равно 34. Что произойдет, если время отводимое на контрольную работу будет 5, вместо 30?

y1=5 k1=0
y2=y1-2*k1=5 k2=0
y3=y2-4*k2=5 k3=0
y4=y3-k3=5 k4=0
y5=y4-4*k4=5 k5=0
y6=y5-7*k5=5 k6=0
y7=y6-5*k6=5 k7=0
Y8=y7-3*k7=5 k8=5

соответственно максимально количество баллов, которое студент может набрать за отведенное время равно 10. Что произойдет, если типов вопросов будет 4, вместо 8?



Этап 4.

Этап 3.

Этап 2.

Этап 1.

y1=30 k1=5
y2=y1-2*k1=20 k2=3
y3=y2-4*k2=8 k3=4
y4=y3-k3=4 k4=3

соответственно максимально количество баллов, которое студент может набрать за отведенное время равно 39.

Оптимальность по Парето

В экономических исследованиях иногда приходится оптимизировать задачи по нескольким критериям. Например, одновременно учитывать минимум затрат и максимум прибыли, максимум прибыли и минимум риска, максимум выпуска продукции и максимум прибыли, минимальные затраты и минимальный риск и т.д. Рассмотрим многокритериальный метод оптимизации, предложенный итальянским экономистом Парето.

Оптимальность по Парето – такое состояние системы, при котором значение каждого частного критерия, описывающего состояние системы, не может быть улучшено без ухудшения положения других элементов. Таким образом, по словам самого Парето: «Всякое изменение, которое никому не приносит убытков, а некоторым людям приносит пользу (по их собственной оценке), является улучшением». Значит, признаётся право на все изменения, которые не приносят никому дополнительного вреда.

Множество состояний системы, оптимальных по Парето, называют «множеством Парето», «множеством альтернатив, оптимальных в смысле Парето», либо «множеством парето-оптимальных альтернатив». Ситуация, когда достигнута эффективность по Парето – это ситуация, когда все выгоды от обмена исчерпаны.

Приведенное выше определение можно формализовать следующим утверждением: состояние экономики S* считается лучшим по Парето, чем другое состояние S1, если хотя бы один экономический субъект предпочитает S*, а все остальные по меньшей мере не делают различий между этими состояниями, но в то же время нет таких, кто предпочитает S1 состоянию S*. Последнее безразлично по Паретоотносительно состояния S1, если все экономические субъекты не делают между ними различий; наконец, оно оптимально по Парето, если не существует такого допустимого состояния экономики, которое было бы лучше, чем это.

Критерий Парето неприменим к весьма распространенным ситуациям, при которых экономическое мероприятие, приносящее пользу одним, в то же время наносит ущерб другим. На рис. a) точкой А показано исходное состояние экономической системы, состоящей из двух подсистем (группы X и Y). Улучшают его лишь те решения, которые приводят систему в любую точку, лежащую в заштрихованной области и на ее границах (напр., точки B, C, D). Решение, обозначенное точкой E, не удовлетворяет требованию Парето, несмотря на значительный рост удовлетворения потребностей членов группировки Y: он достигается за счет снижения уровня благосостояния группировки X.

Если x1 и y1 (см. рис. б)) соответственно отображают максимальные значения целевых функций подсистем X и Y при их независимом друг от друга функционировании, то участок FF1 множества Парето (недостижимый для каждой из них в отдельности) заинтересовывает их в совместной деятельности. Этот участок называетсяядром экономической системы. Чем теснее взаимозависимы подсистемы, тем меньше различия между множеством Парето (“оптимумом по Парето”) и ядром системы. Выбор при планировании единственного наилучшего плана (напр., точки g) — вопрос согласования или, как говорят, “устройства” экономического механизма. Напр., такой точкой может быть точка равновесия по Нэшу.

Таким образом, оптимумов по Парето может быть много, но существенно меньше, чем вообще вариантов развития системы; оптимумов по Парето, входящих в ядро, еще меньше, и все это, в частности, позволяет сужать выбор вариантов, подлежащих рассмотрению в процессе оптимального композиционного планирования. (Те же рассуждения применимы и к анализу некооперативных игр.)

Рис. Оптимальность по Парето.

Эффективность по Парето является одним из центральных понятий для современной экономической науки. На основе этого понятия строятся первая и вторая фундаментальные теоремы благосостояния. Одним из приложений Парето-оптимальности является т.н. Парето-распределение ресурсов (трудовых ресурсов и капитала) при международной экономической интеграции, то есть экономическом объединении двух и более государств. Интересно, что Парето-распределение до и после международной экономической интеграции было адекватно математически описано (Далимов Р. Т., 2008). Анализ показал, что добавленная стоимость секторов и доходы трудовых ресурсов движутся противонаправленно в соответствии с хорошо известным уравнением теплопроводности аналогично газу или жидкости в пространстве, что дает возможность применить методику анализа, используемую в физике, в отношении экономических задач по миграции экономических параметров.

Рис. Геометрическая интерпретация паретовых решений для задачи с двумя критериями.

 

Множество F называется множеством достижения или граничных возможностей. Множество Парето представляет собой часть границы множества достижимости, то есть к нему принадлежат те значения критериев, над которыми не доминируют другие варианты. В данном случае множеством Парето будет дуга АСВ. Существенным моментом здесь есть то, что решение полученное таким методом, не является однозначным. Лицо, принимающее решение, на свое усмотрение выбирает оптимальное решение из множества Парето (точку на дуге ABC). Но имеет место чрезвычайно важное утверждение.

Утверждение. На множестве Парето каждая из характеристик f1 f2 - однозначная функция другой. Другими словами, если две характеристики принадлежат множеству Парето, то по одной характеристике можно однозначно определить другую.

 

Тема 9. Оптимальное управление.

План лекции:

Постановка задачи оптимального управления.

Формулировка принципа максимума.

Теорема (принцип максимума Понтрягина).

Примеры применения принципа максимума.

 

Краткое содержание лекции

Постановка задачи оптимального управления

Состояние объекта управления характеризуется n-мерной вектор функцией, например, функцией времени x = [x1(t), x2(t), …, xn(t)].

От управляющего органа к объекту управления поступает вектор-функция u = [u1(t), u2(t), …, ur(t)].

Векторы x и u , обычно связаны между собой каким-либо соотношением.

Наиболее развитым в настоящее время является уравнение, в котором векторы связаны системой обыкновенных дифференциальных уравнений.

Итак, пусть движение управляемого объекта описывается системой дифференциальных уравнений:

x¢ = f(x,u,t), (1)

где x = (x1, …, xn) - вектор координат объекта или фазовых координат, f = (f1, …, fn) - заданная вектор-функция, u = (u1, …, ur) - вектор управлений или просто управление.

В уравнении (1) векторы x, u являются функциями переменной t, обозначающей время, причем

t Î [t0, T], где [t0, T] - отрезок времени, на котором происходит управление системой.

На управление обычно накладывается условие:

u(t) Î U(t), t Î [t0, T], (2)

где U(t) - заданное множество в Rn при каждом tÎ[t0, T].

Будем называть далее управлением кусочно-непрерывную на отрезке [t0, T] (т. е. имеющую конечное число разрывов первого рода) r-мерную вектор-функцию u, непрерывную справа в точках разрыва и непрерывную в точке T.

Управление u называется допустимым, если оно удовлетворяет ограничению (2). Заметим, что ограничиться рассмотрением непрерывных управлений оказывается невозможным, так как с их помощью трудно моделировать моменты переключения управления такие, как, например, включение и отключение двигателей, отделение ступеней ракеты, поворот рулей и т. д. Иногда рассматривают и более широкие классы допустимых управлений, например, класс всех ограниченных измеримых управлений, удовлетворяющих условию (2).

Покажем, как при произвольном начальном положении x0 Î Rn и допустимом управлении u определяется траектория управляемого объекта.

Рассмотрим задачу Коши:

x¢(t) = f(x(t), u(t), t), t0 £ t £ T (3)

Поскольку при разрывных правых частях классическое понятие решения системы дифференциальных уравнений неприменимо, поясним, что понимается в данном случае под решением задачи (3).

Пусть функция u имеет скачки в точках r1, r2, …, rk причем t0 < r1 < r2 < … < rk < T.

Предположим, что задача (3) имеет решение х, определенное на всем отрезке [t0, r1], причем x(r1) = x1.

Далее рассмотрим задачу Коши:

x¢(t) = f(x(t), u(t), t), x(r1) = x1.

Предполагая, что она имеет решение на отрезке [r1, r2] и x(r2) = x2, приходим к задаче:

x¢(t) = f(x(t), u(t), t), x(r2) = x2 и т. д.

Если функцию x удалось определить указанным способом на всем отрезке [t0, Т], то будем называть ее решением задачи (3) или фазовой траекторией (иногда просто траекторией), соответствующей управлению u.

Отметим, что x - непрерывная по построению функция, удовлетворяющая на отрезке [t0, T] равенству:

При выполнении определенных условий на f решение задачи (3), соответствующее управлению u, существует и единственно при произвольном начальном положении x0 и произвольном допустимом управлении u.

Помимо ограничения на управление могут существовать ограничения и на фазовые координаты:

x(t) Î X(T), t Î [t0, T] (4)

Ограничения на концах траектории целесообразно рассматривать отдельно:

x(t0) Î S0(t0), t0 Î q0, x(T) Î S(T), T Î q (5)

здесь S0(t0), S(T) - заданные множества из R; q0, q - заданные множества из R,причем infq0 < supq, t0<T.

Таким образом, начальный и конечный моменты времени не обязательно фиксированы.

Случаю фиксированных t0, Т соответствуют множества q0, q, состоящие из одной точки; при этом говорят, что рассматривается задача с закрепленным временем.

Если S0(t0) = {x0} при любом t0 Î q00, то левый конец траектории называют закрепленным.

Если же S0(t0) = R при всех t0 Î q00, то левый конец траектории называют свободным.

Во всех остальных случаях левый конец называют подвижным.

В аналогичных ситуациях говорят о закрепленном, свободном или подвижном правом конце траектории.

Цель управления в задаче оптимального управления состоит в минимизации некоторого функционала на множестве допустимых наборов.

Если каждой функции y = f(x) определенного класса ставится в соответствии по некоторому закону определенное числовое значение переменной I, то эту переменную называют функционалом от одной функциональной переменной I = I[y] = I[y(x)] = I[f(x)].

Наиболее часто под задачами управления понимаются задачи, в которых роль функционала выполняет интегральный функционал:

Мы будем рассматривать задачу с целевым функционалом:

(6)

представляющим собой сумму интегрального функционала

и терминального функционала f(х(Т), Т).

Эта задача называется задачей Больца.

Ее частными случаями являются задача с интегральным функционалом, называемая задачей Лагранжа, и задача с терминальным функционалом, называемая задачей Майера.

Задача с интегральным функционалом при f0 º 1называется задачей оптимального быстродействия.

Набор (t0, Т, х0, u, х), минимизирующий функционал (6), называется решением задачи оптимального управления, управление u - оптимальным управлением, а траектория х - оптимальной траекторией.

Часто решением задачи оптимального управления называют пару (u, х).

Принцип максимума Понтрягина - необходимое условие оптимальности в таких задачах.

Формулировка принципа максимума.

Рассмотрим задачу оптимального управления, являющуюся частным случаем задачи, сформулированной выше:

(7)

x¢(t) = f(x(t), u(t), t), x(t0) Î S0, x(T) Î ST, u(t) Î U, t0£ t £ T, где

S0 = {x Î Rn | gi(x) = 0, i= 1, …, m0},

ST = {x Î Rn | gi(x) = 0, i = m0 + 1, …, m} (8)

При этом предполагается, что моменты t0, Т фиксированы, т. е. рассматривается задача с закрепленным временем; множество U не зависит от времени, фазовые ограничения отсутствуют. Положим: H(x, u, t, Y0, Y) = , где Y0 - константа, Y(t) = (j1(t), …, jn(t))

Функция Н называется функцией Гамильтона.

Система линейных дифференциальных уравнений Y¢ = -Нx¢ относительно переменных (j1(t), …, jn(t)) называется сопряженной системой, соответствующей управлению uи траектории x.

Здесь: или .

В более подробной покоординатной записи сопряженная система принимает вид:

(9)

Система (3) имеет при любых начальных условиях единственное решение Y, определенное и непрерывное на всем отрезке [t0,T].

Следующая теорема выражает необходимые условия оптимальности в задаче (7).

Теорема (принцип максимума Понтрягина).

Пусть функции f0, …, fn, u, f, g1, ..., gm имеют частные производные по переменным х1, ..., xn и непрерывны вместе с этими производными по совокупности аргументов х Î Rn, u Î U, t Î [t0, Т]. Предположим, что (u, х) - решение задачи (7). Тогда существует решение Y сопряженной системы (9), соответствующей управлению u и траектории х, и константа Y0£0 такие, что |Y0| + ||Y(t)|| при t Î [t0, Т], и выполняются следующие условия:

а) (условие максимума) при каждом t Î [t0, Т] функция Гамильтона H(x, u, t, Y0, Y), достигает максимума по v Î U при v = u(t), т.е.

H(x(t), u(t), t, Y0, Y) = maxV H(x(t), v(t), t, Y0, Y) (10)

б) (условие трансверсальности на левом конце траектории) существуют числа l1,…,lm0, такие, что

(11)

в) (условие трансверсальности на правом конце траектории) существуют числа lm0+1,…,lm такие, что:

(12)

Центральным в теореме является условие максимума (10).

Если отказаться от предположения о том, что конечный момент времени Т фиксирован, то теорема останется справедливой за исключением условия трансверсальности на правом конце траектории. Условие (12) заменим условием:

и добавить еще одно условие трансверсальности на правом конце траектории:

Примеры применения принципа максимума.

1.Простейшая задача оптимального быстродействия.

Пусть точка движется по прямой в соответствии с законом:

x² = u

где х - координата. Требуется найти управление u, переводящее точку из начального положения в начало координат за минимальное время Т (задача оптимального быстродействия). При этом скорость точки в конце траектории должна быть нулевой, а управление - удовлетворять условию:

|u(t)| £ 1, tÎ[0,T].

Применим к сформулированной задаче принцип максимума Понтрягина. Введем фазовые переменные x1 = x, x2 = x¢. Тогда движение управляемого объекта описывается системой двух дифференциальных уравнений первого порядка:

1 = x2,

2 = u

Начальное положение:

x0 = (x01,x02)

при t0=0 и конечное положение (0, 0) фиксированы, а конечный момент времени Т не фиксирован.

В обозначениях приведенных выше в данной задаче U = [-1, 1], f0=1, Ф=0, а функция Гамильтона имеет вид:

H = Y0 + Yx2 + Y2u

Общее решение сопряженной системы:

1 = -H¢x1 = 0, Y¢2 = -H¢x2 = -Y1

легко выписывается в явном виде

Y1(t) = C,

Y2(t) = -Ct + D,

где С, D - постоянные.

Очевидно, что максимум функции Н по uÎU достигается при:

Таким образом, оптимальное управление uможет принимать лишь два значения +1.

2. Определить управление u(t), которое дает минимум интегралу:

,

в процессе, описываемом уравнением

.

Решение.

Введем дополнительную переменную:

Для этой переменной имеем дифференциальное уравнение:

с начальными условиями, получаемыми из (2), т.е. х2(0)=0. Минимизирующий функционал, используя (2), можно записать в виде I[T]=x2(T).

Построим функцию Гамильтона:

H = Y1f1 + Y2f2 =

Y1(-ax1 + u) + Y2 1/2(x12 + u2) =

-aY1x1 + 1/2Y2x12 + Y1u + 1/2Y2u2

Запишем сопряженную систему

Запишем Yi(T) = -Ci, Y1(Т)=0 (т.к. C1=0), Y2(Т)=-1

Из , Y2 = const, Y2(T) = -1 поэтому Y2(t)=-1.

Теперь функция Гамильтона запишется в виде

H = -aY1x1 + Y1u - 0,5x12 - 0,5u2.

По принципу максимума функция Н при фиксированных х1 и Y1 достигает максимума по u: , откуда Y1(t) = u(t).

Осталось решить систему уравнений (2) и (3) при условии Y1(t) = u(t), Y2(Т)=-1,

,

с граничными условиями x1(0) = x10, u(T) = 0.

Сведем данную систему к одному уравнению относительно u.

Добавим к этому уравнению граничные условия u(T)=0, u(T) = u0 и решим его. Составим характеристическое уравнение k2- (а2+1)=0, k1,2 = ±l, u = C1elt + C2e-lt

Найдем С1 и С2. C1elt + C2e-lt = 0, С2=-C1е2lt. Тогда u(t) = C1(elt - el(2T-t))

Используя граничные условия найдем

Таким образом, определено оптимальное решение

 

Тема 10. Особенности решения задач динамического программирования. Примеры.

План лекции:

Задача о замощении домино.

Задача о симпатичных узорах.

Связь динамического программирования и регулярных выражений.

Задача триангуляции.

Краткое содержание лекции

Задача о замощении домино

Чтобы понять, что такое динамика по профилю, будем рассматривать разные задачи и разбирать их решения с помощью этого приема. Для начала рассмотрим известную задачу: дана таблица n×m, нужно найти количество способов полностью замостить ее неперекрывающимися костяшками домино (прямоугольниками 2×1 и 1×2). Считаем n, m £ 10.

Заметим, что в процессе замощения каждая клетка таблицы будет иметь одно из двух состояний: покрыта какой-нибудь домино или нет. Чтобы запомнить состояние клеток одного столбца, достаточно одной переменной P типа integer. Положим i-й бит P равным 1, если i-я сверху клетка данного столбца занята, 0 – если свободна. Будем говорить в таком случае, что P – битовая карта нашего столбца. Теперь дадим определение базовой линии и профиля.

Базовой линией будем называть вертикальную прямую, проходящую через узлы таблицы. Можно занумеровать все базовые линии, по порядку слева направо, начиная с нуля. Таким образом, базовая линия с номером i – это прямая, отсекающая первые i столбцов от всех остальных (если такие имеются). Отныне через bi будем обозначать базовую линию с номером i. Столбцы занумеруем так: слева от bi будет столбец с номером i. Другими словами, столбец с номером i находится между bi - 1 и bi.

1. Профиль будет таким: 1001012 = 1 + 4 + 32 = 37 (заняты первая + третья + шестая клетки).

Профилем для базовой линии с номером i (bi) будем называть битовую карту для столбца с номером i при следующих дополнительных условиях:

1)все клетки слева от bi - 1 уже покрыты;

2)в i-м столбце нет вертикальных домин;

3)считается, что справа от bi нет покрытых клеток.

Первое условие возникает от желания считать количество способов постепенно, сначала рассматривая первый столбец, потом второй при условии, что первый уже заполнили и т.д. Второе и третье вводятся для того, чтобы один и тот же способ покрытия не был посчитан более одного раза. Точный смысл этих условий будет раскрыт ниже.

2. p1 = 37, p2 = 2; нетрудно заметить по рисунку, что из p1 можно получить p2. Таким образом, d[37, 2] = 1.

Для каждого профиля p1 базовой линии bi определим множество профилей p2 базовой линии bi + 1, которые могут быть из него получены. На таблицу, соответствующую p1 (то есть все клетки слева от bi - 1 полностью покрыты, в i-м столбце клетки отмечены согласно p1), можно класть домино только двух типов:

1)горизонтальные домино, которые пересекают bi (то есть делятся ей пополам);

2)вертикальные домино, которые лежат слева от bi.

Также должны быть выполнены естественные дополнительные условия:

1)новые домино не должны перекрываться друг с другом;

2)они должны покрывать только незанятые клетки;

3)каждая клетка i-го столбца должна быть покрыта.

Битовая карта столбца i + 1 и будет возможным профилем p2.

Очевидно, что полученный таким образом профиль p2 действительно удовлетворяет всем условиям, накладываемым на профиль.

Пусть d[p1, p2] - количество способов из профиля p1 (для bi) получить p2 (для bi + 1). Очевидно, для данной задачи про домино это число может быть только единицей или нулем. Различные задачи будут отличаться в основном только значениями d[p1, p2].

Заметим, что всего профилей 2n: от 00...02 = 0 до 11...12 = 2n - 1. Поэтому в данном случае матрица D будет иметь размер 2n×2n. Пусть теперь a[i, p] – количество способов таким образом расположить домино, что p – профиль для bi (таким образом, все клетки левее bi - 1 покрыты). Напишем рекуррентное соотношение.

· Начальные значения (i = 1):
a[1, 0] = 1;
a[1, p2] = 0, p2 = 1, ..., 2n - 1

· Общая формула (i > 1):

a[i, p1] = a[i - 1, p2] d[p2 p1]

Заметим, что для базовой линии номер 1 существует единственный профиль (то есть битовая карта, удовлетворяющая условиям профиля) – карта незаполненного столбца.

Ответ на вопрос задачи будет записан в a[m + 1, 0]. Ошибкой бы было считать правильным ответом число a[m, 2n - 1], так как в этом случае не учитывается возможность класть вертикальные домино в последнем столбце (см. второй пример).

Обсудим "странные" условия на домино при получении одного профиля из другого. Казалось бы, забыт еще один тип домино, которые могут участвовать при формировании нового профиля, а именно полностью лежащие в столбце i + 1. Дело в том, что если разрешить их, то некоторые способы замощения будут считаться более одного раза. Например, пусть n = 2, m = 2. Тогда d'[0][3] = 2, так как можно положить либо две вертикальные домино, либо две горизонтальные. Аналогично, d'[3][3] = 1 (можно положить одну вертикальную). В итоге

D' = , A' =

Имеем неправильный ответ 3 (можно посчитать вручную, что на самом деле ответ 2).

Напротив, если следовать данному правилу получения из одного профиля другого, то можно убедиться в верности вычислений.

Упражнение. Доказать, что a[i, p] вычисляется правильно.

Вот какими будут D и A если n = 2, m = 4:

D = , A =

Таким образом, замостить домино таблицу 2×4 можно 5 способами, а таблицу 2×2 – двумя. Если смотреть a[m, 2n - 1], то получим 2 и 1. Очевидно, что таблицу 2×2 можно замостить двумя, а не одним способом: пропущен вариант, когда кладутся две вертикальные домино. В случае 2×4 пропущены три замощения – все случаи, когда последний столбец покрыт вертикальной домино.

Существует два способа для вычисления D. Первый заключается в том, чтобы для каждой пары профилей p1 и p2 проверять, можно ли из p1 получить p2 описанным способом.

При втором способе для каждого профиля p1 пытаемся его замостить, кладя при этом только домино разрешенных двух типов. Для всех профилей p2 (и только для них), которые при этом получались в следующем столбце, положим d[p1, p2]=1. В большинстве случаев этот способ более экономичный, так что логично использовать именно его.

Ниже приведен код рекурсивной процедуры, которая заполняет строку d[p], то есть находит все профили, которые можно получить из p:

procedure go(n, profile, len : integer);

begin

// n - из условия задачи

// profile - текущий профиль

// len - длина profile

if (len = n) then begin // как только profile получился длины n, выходим

d[p][profile] := 1;

exit;

end;

if (bit(p, len) = 0) then begin // текущая ячейка в p (с номером len + 1) не занята

go(p, profile + (1 shl len), len + 1); // положили горизонтальную домино

if (len < n - 1) then

if (bit(p, len + 1) = 0) then begin // не занята еще и следующая ячейка

go(p, profile, len + 2); // положили вертикальную домино

end;

end else begin

go(p, profile, len + 1); // текущая ячейка занята, ничего положить не можем

end;

end;

procedure determine_D;

var p : integer;

begin

for p := 0 to (1 shl n) - 1 do

go(p, 0, 0); // запускать надо именно с такими параметрами

end;

 

Алгоритм вычисления D и A работает за O(22n) (вычисление D) + O(22nm) (вычисление A) = O(22nm).

Задача о симпатичных узорах

Рассмотрим еще одну задачу с прямоугольной таблицей. Дана таблица n×m, каждая клетка которой может быть окрашена в один из двух цветов: белый или черный. Симпатичным узором называется такая раскраска, при которой не существует квадрата 2×2, в котором все клетки одного цвета. Даны n и m. Требуется найти количество симпатичных узоров для соответствующей таблицы.

Рис. Первые два узора симпатичные; у третьего и четвертого есть полностью черный и, соответственно, белый квадратик 2×2.  

Будем считать профилем для bi битовую карту i-го столбца (единицей будет кодировать черную клетку, а нулем -- белую). При этом узор, заключенный между нулевой и i-й базовыми линиями, является симпатичным. Из профиля p1 для bi можно получить p2 для bi + 1, если и только если можно так закрасить (i + 1)-й столбец, что его битовая карта будет соответствовать p2, и между bi - 1 и bi + 1 не будет полностью черных либо белых квадратиков 2×2.

Рис. На левом рисунке p1 = 1 + 4 + 32 = 37, p2 = 2 + 8 + 16 = 26; так как между bi - 1 и bi + 1 не встречаются одноцветные квадратики 2×2, то p2 может быть получен из p1. На рисунке справа p1 также равно 37, а p2 = 1 + 2 + 4 = 7.  

Сколькими же способами из одного профиля можно получить другой? Понятно, что закрасить нужным образом либо можно, либо нельзя (так как раскрашивать можно единственным образом -- так, как закодировано в p2). Таким образом, d[p1, p2] Î {0, 1}.

Вычислять D можно либо проверяя на "совместимость" (то есть наличие одноцветных квадратов 2×2) все пары профилей, либо генерируя все допустимые профили для данного. Ниже приведен код, реализующий первую идею:

// можно ли из p1 получить p2function can(p1, p2 : integer) : boolean;var i : integer; b : arrray[1..4] of byte;begin for i := 0 to n - 2 do begin b[1] := bit(p1, i); b[2] := bit(p1, i + 1); b[3] := bit(p2, i); b[4] := bit(p2, i + 1); if (b[1] = 1) and (b[2] = 1) and (b[3] = 1) and (b[4] = 1) then begin // квадрат в строках i и i + 1 черный can := false; exit; end; if (b[1] = 0) and (b[2] = 0) and (b[3] = 0) and (b[4] = 0) then begin // квадрат в строках i и i + 1 белый can := false; exit; end; end; can := true; end;procedure determine_D;var p1, p2 : integer;begin for p1 := 0 to (1 shl n) - 1 do for p2 := 0 to (1 shl n) - 1 do if can(p1, p2) then d[p1, p2] :=1 else d[p1, p2] := 0;end;

 

После того, как вычислена матрица D, остается просто применить формулу (так как рассуждения на этом этапе не изменяются). Связь ДП по профилю и линейной алгебры. Рекуррентное соотношениебудет встречаться нам не только в задаче о замощении или симпатичном узоре, но и во многих других задачах, решаемых динамикой по профилю. Поэтому логично, что существует несколько способов вычисления A, используя уже вычисленную D. В этом пункте мы рассмотрим способ, основанный на возведении в степень матрицы:

a[i] можно считать матрицей 1×2n;

D -- матрица 2n×2n;

a[i] = a[i - 1]D. Если расписать эту формулу по определению произведения, то получится в точности. Следуя определению степени матрицы, получаем

a[m] = a[0]Dm

Вспомним, как возвести действительное число a в натуральную степень b за O(log b). Представим b в двоичной системе счисления: b = 2i1 + 2i2 +...+ 2ik, где i1 < i2 <...< ik. Тогда k = O(log b). Заметим, что a2i получается из a2(i - 1) возведением последнего в квадрат. Таким образом, за O(k) можно вычислить все apt, pt = 2it, t = 1, ..., k. Перемножить их за линейное время тоже не представляет труда.

Логично предположить, что аналогичный алгоритм сгодится и для квадратных матриц. Единственное нетривиальное утверждение – A2i = (A2i - 1)2, ведь по определению , а мы хотим приравнять его к (At)(At). Его истинность следует из ассоциативности умножения матриц (AB)C = A(BC). Само свойство можно доказать непосредственно, раскрыв скобки в обеих частях равенства. Приведем код процедуры возведения в степень (функция mul перемножает две квадратные матрицы размера w × w):

 

function mul(a, b : tmatr) : tmatr;var res : tmatr; i, j, t : integer;begin for i := 1 to w do begin for j := 1 to w do begin res[i][j] := 0; for t := 1 to w do begin res[i][j] := res[i][j] + a[i][t]*b[t][j]; end; end; end; mul := res;end;function power(a : tmatr; b : integer) : tmatr;var i, j : integer; res, tmp : tmatr;begin res := E; // единичная матрица tmp := a; while (b > 0) do begin if (b mod 2 = 1) then res := mul(res, tmp); b := b div 2; tmp := mul(tmp, tmp); end; power := res;end;

 

Как уже говорилось, будет сделано O(log b) перемножений. В данном случае, на каждое перемножение тратится n3 операций (где n – размерность матрицы). Так что этот алгоритм будет работать за O(n3log b).Матрицу D мы умеем вычислять за O((2n)2n) = O(4nn) (как в рассмотренных задачах). Вектор a[m] сумеем найти за O((2n)3log b) = O(8nlog m). В итоге получаем асимптотику O(8nlog m). При больших m (например, 10100) этот способ вычисления A несравнимо лучше наивного.

Связь динамического программирования и регулярных выражений

Шаблоном называется строка состоящая из букв латинского алфавита (a, …, z, A, …, Z) и символов ? и *. Каждый из символов ? разрешается заменить на одну произвольную букву, а каждый из символов * на произвольную (возможно пустую) последовательность букв. Про любую строку из букв, которую можно получить из шаблонов такими заменами, будем говорить, что она удовлетворяет данному шаблону. Тогда задачу состоит в том, чтобы для двух заданных шаблонов найти строку минимальной длины, которая удовлетворяет обоим шаблонам, либо выяснить, что такой строки не существует.

Нельзя не отметить, что подобного рода задачи, находят большое применение на практике, обычно они возникают при анализе и разборе регулярных выражений. Итак, пусть заданы два шаблона, S[1…M] и T[1…N]. Введем обозначение F(i, j) для строки минимальной длины, которая удовлетворяет шаблонам S[1…i] и T[1…j]. Если такой строки нет, то в F(i, j), будет стоять специальная пометка, говорящая об этом.

Вычисляем значение F(i, j) в порядке возрастания i, а при равных i, в порядке возрастания j. Возможны следующие содержательные ситуации (считаем, что i, j > 0, а разбор граничных случаев, не представляет особого интереса, и может быть оставлен как упражнение).

1. S[i] и T[j] – буквы. Если они совпадают, то в качестве значения F(i, j) берем F(i−1, j−1) с добавленной в конце этой буквой. Если в F(i−1, j−1) стоит пометка, говорящая о том, что строки не существует, то аналогичную пометку можно поставить и в F(i, j). В случае несовпадения букв S[i] и T[j], в F(i, j) необходимая строка также не существует.

2. S[i] и T[j] – буква и символ «?» или два символа «?». Поступаем точно так же, как и в предыдущей ситуации, однако случае несовпадения букв из-за наличия «?» здесь быть не может.

3. S[i] – символ «*», а T[j] – буква или символ «?». В данной ситуации выбираем наиболее короткое среди значений F(i, j−1) и F(i−1, j) с дописанной к нему буквой T[j] (или любой буквой, если T[j] есть символ «?» ).

4. S[i] – буква или символ «?», а T[j] – символ «*». Поступаем аналогично разобранному выше пункту.

5. S[i] и T[j] – два символа «*». В этом случае в качестве F(i, j), берем наиболее короткое из значений F(i, j−1) и F(i−1, j).

Задача триангуляции

В качестве еще одного примера динамического программирования рассмотрим задачу триангуляции многоугольника. Заданы вершины многоугольника и расстояния между каждой парой вершин. Это расстояние может быть геометрическим расстоянием на плоскости или произвольной функцией стоимости, заданной в виде таблицы. Задача заключается в том, чтобы выбрать такую совокупность хорд (линий между несмежными вершинами), что никакие две хорды не будут пересекаться, а весь многоугольник будет поделен на треугольники. Общая длин всех хорд должна быть минимальной. Такая совокупность хорд называется минимальной триангуляцией. Зафиксируем несколько фактов, которые помогут разработать необходимый алгоритм. Предполагаем, что наш многоугольник имеет n вершин v0, v1, …, vn−1, перечисленных по часовой стрелке.

1. В случае триангуляции любого многоугольника, содержащего более трех вершин, с каждой парой смежных вершин связана, по крайней мере одна хорда. Чтобы убедиться в этом, предположим, что ни vi, ни vi+1 не связаны ни с одной из хорд. В таком случае область, ограничиваемая стороной (vi, vi+1), должна бы включать стороны (vi−1, vi), (vi+1, vi+2) и по крайней мере еще одну дополнительную сторону или хорду. Но в таком случае это область не была бы треугольником.

2. Если (vi, vj) является хордой в триангуляции, значит должна найтись, такая вершина vk что каждая из линий (vi, vk) и (vk, vi) либо стороной многоугольника либо хордой . В противном случае хорда (vi, vj), ограничивала бы область, не являющуюся треугольником.

Чтобы приступить к поиску минимальной триангуляции, выберем две смежные вершины, например v0 и v1. Из указанных выше фактов следует, что в любой триангуляции (а значит и в минимальной) должна найтись такая вершина vk, что (v1, vk) и (vk, v0) являются хордами или сторонами многоугольника. Необходимо рассмотреть, насколько приемлемую триангуляцию можно построить после выбора каждого значения k. Если в многоугольнике n вершин, то в нашем распоряжении имеется (n−2) возможных вариантов. Каждый вариант выбора k приводит к не более чем двум подзадачам, где мы имеем многоугольники образованные, одной хордой и сторонами исходного многоугольника. Например, могут возникнуть такие подзадачи при случае выбора вершины v3.

Далее нужно найти минимальную триангуляцию для многоугольников, полученных в результате появления новых подзадач. Правда, если мы будем решать все подзадачи, которые будут появляться, то мы получим алгоритм с экспоненциальной трудоемкостью. Но, имея треугольник, включающий хорду (v0, vk), нам никогда не придется рассматривать многоугольники, у которых более одной стороны являются хордами исходного многоугольника. «Факт 2» говорит о том, что при минимальной триангуляции хорда в подзадаче (например, хорда (v0, v3) на рис. 1) должна составлять треугольник с одной из остальных вершин многоугольника.

Определим подзадачу размера s, начинающуюся с вершины vi и обозначаемую Sis, как задачу минимальной триангуляции для многоугольника, образованного s вершинами, начинающегося с вершины vi и содержащего вершины vi, vi+1, …, vi+s−1, перечисляемые в порядке обхода вершин по часовой стрелке. В v0 хордой является замыкающая сторона (vi, vi+s−1). Чтобы решить подзадачу Sis необходимо рассмотреть три варианта:

1. Можно выбрать вершину vi+s−2, чтобы составить треугольник с хордами (vi, vi+s−1), (vi, vi+s−2) и третьей стороной (vi+s−2, vi+s−1), а затем решить подзадачу Si,s−1.

2. Мы можем выбрать вершину vi+1, чтобы составить треугольник с хордами (vi, vi+s−1), (vi+1, vi+s−1) и третьей стороной (vi, vi+1), а затем решить подзадачу Si+1,s−1.

3. Для некоторого k из диапазона от 2 до s−3 можно выбрать вершину vi+k и образовать треугольник со сторонами (vi, vi+k), (vi+k, vi+s−1), (vi, vi+s−1), а затем решить подзадачи Si,k+1 и Si+k,sk.

Если учесть, что решение подзадачи размером не более трех не требует вообще никаких действий, то рассматривая описанные варианты 1–3, следует предпочесть вариант 3, где нужно выбрать некоторое k из диапазона от 1 до s−2 и решить подзадачи Si,k+1 Si+k,sk. Если для решения задачи размером более четыре и более воспользоваться очевидным рекурсивным алгоритмом, непосредственно вытекающим из перечисленных выше вариантов, то можно показать что общее число рекурсивных вызовов составляет 3s−4, если подсчитать лишь обращения к подзадачам размером четыре и более. Таким образом количество подзадач, которые необходимо решить, возрастает по экспоненциальному закону в зависимости от s. А следовательно общее количество шагов экспоненциально зависит и от n.

Но известно, что, помимо исходной задачи существует лишь n(n−4) различных подзадач, которые в любом случае необходимо решить. Значит в приведенном анализе что-то явно не совсем верно. Очевидно, что совсем не все подзадачи отличаются между собой, если действовать рекурсивно, как приведено выше, то у нас возникают ситуации, когда одни и те же ситуации приходится решать несколько раз. Именно это подсказывает нам эффективный способ вычисления триангуляции. Прежде всего, вычисления удобно организовать в виде таблицы. Назначим стоимость Cis триангуляции Sis для всех i и s. Поскольку решение любой данной задачи зависит от решения задач меньшего размера, то логичным порядком заполнения такой таблицы является порядок, основанный на размерах подзадач, т. е. для размеров s = 4, 5, …, n−1 мы указываем минимальную стоимость задач Sis для всех вершин i. Удобно включить и задачи размеров 0 ≤ s < 4, но при этом нужно помнить, что Sis имеет стоимость 0, если s < 4.

В соответствии с перечисленными выше вариантами действий 1–3 при определении подзадач формула вычисления Cis при s ≥ 4 должна иметь следующий вид:

Cis = min1≤ks−2 {Ci,k+1 + Ci+k,sk + D(vi, vi+k) + D(vi+k, vi+s−1)},

где D(vp, vq) – это длина хорды между вершинами vp и vq, если vp и vq не являются смежными вершинами многоугольника; D(vp, vq) равняется 0, если являются смежными вершинами.

Отметим, что таким образом, мы вычислим всю таблицу, и определим стоимость минимальной триангуляции, но не саму триангуляцию. Поэтому, как и в задаче про наибольшую общую подпоследовательность для того, чтобы найти саму триангуляцию, мы должны еще также хранить информацию, о том, при каком значении k достигается минимум. И потом уже, по всем сохраненным значениям k мы можем легко восстановить минимальную триангуляцию.

Формальная запись решения задачи оптимизации произведения матриц

Обозначим через m[i, j] минимальную стоимость вычисления матрицы Ai..j. Элементарным случаем тогда будет i=j, т.е. Аi..j=Ai и умножения вообще не нужны, следовательно стоимость равна 0.

Случай:

i £ k < j

Тогда:

m[i, j] = m[i, k] + m[k+1, j] + pi-1pkpj

В этом равенстве подразумевается, что лучшее значение k нам известно. В действительности его еще нужно найти. Тут единственным вариантом является перебор всех значений k в промежутке от i до j-1. Т.е. окончательно получаем:

 

Тема 11. Применение метода динамического программирования к задачам синтеза расписаний обслуживания.

Задачи обслуживания множеств заявок. Однопроцессорные задачи синтеза расписаний обслуживания конечных детерминированных потоков заявок. Задачи синтеза расписаний обслуживания для систем с параллельными и последовательными процессорами. Задачи оптимального обслуживания стационарных объектов, расположенных в одномерной зоне.

 

В данном разделе изучается ряд задач синтеза расписаний обслуживания; обслуживанию подлежат объекты, условно именуемые заявками. Излагаемые алгоритмы основаны, главным образом, на принципе динамического программирования. В каждой задаче предполагается, что выполнение искомого расписания начинается от момента t = 0. Время считается дискретным, все временные характеристики заявок целочисленные. Рассматриваемые задачи делятся на две группы. В задачах первой группы считается, что по состоянию на момент времени t = 0 все заявки готовы к обслуживанию. В задачах второй группы считается, что по состоянию на момент t = 0 в систему обслуживания поступила лишь часть заявок, для каждой из остальных заявок известен момент ее прибытия (любая заявка, начиная с момента прибытия, полагается готовой к обслуживанию). Задачи первой группы будем называть задачами обслуживания множеств заявок, задачи второй группы – задачами обслуживания потоков заявок.


mylektsii.ru - Мои Лекции - 2015-2018 год. (0.601 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал