Разделы сайта

Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Метод Ньютона. В методе Ньютона последовательность точек спуска определяется формулой (4)

⇐ ПредыдущаяСтр 10 из 11Следующая ⇒

В методе Ньютона последовательность точек спуска определяется формулой (4). Для текущей точки x_k направление и величина спуска определяется вектором p_k = – (f ''(x_k))^–1·f '(x_k). Хотя в определении вектора p_k фигурирует обратная к f ''(x_k) матрица (f ''(x_k))^–1, на практике нет необходимости вычислять последнюю, так как направление спуска p_k можно найти как решение системы линейных уравнений

f ''(x_k)·p_k = – f '(x_k) (5) каким-нибудь из методов.

Схема алгоритма.

шаг 1:

На первой итерации, при k = 0, вводятся начальное приближение x₀ и условие останова ε ₃. Вычисляются градиент f '(x₀) и матрица f ''(x₀).

шаг 2:

Определяется направление спуска p_k, как решение системы линейных уравнений f ''(x_k)·p_k = – f '(x_k) ( например, методом исключений Гаусса).

шаг 3:

Определяется следующая точка спуска: x_k₊₁ = x_k + p_k.

шаг 4:

Вычисляются в этой точке x_k+1 градиент f '(x_k+1) и матрица f ''(x_k+1).

шаг 5:

Если ||f '(x_k+1)|| £ ε ₃, то поиск на этом заканчивается и полагается x = x_k+1 и y = f(x_k+1). Иначе k = k + 1 и переход к шагу 2.

Особенностью метода Ньютона является то, что для квадратичной целевой функции он находит минимум за один шаг, независимо от начального приближения x₀ и степени овражности.

В общем случае, когда минимизируемая функция не квадратична, вектор p_k = – (f ''(x_k))^–1·f '(x_k) не указывает в точку её минимума, однако имеет большую составляющую вдоль оси оврага и значительно ближе к направлению на минимум, чем антиградиент. Этим и объясняется более высокая сходимость метода Ньютона по сравнению с градиентными методами при минимизации овражных целевых функций.

Недостатками метода Ньютона является то, что он, во-первых, предполагает вычисление вторых производных и, во-вторых, может расходиться, если начальное приближение находится слишком далеко от минимума.

Методы с регулировкой шага (методы Ньютона – Рафсона)

Удачный выбор начального приближения x₀ гарантирует сходимость метода Ньютона. Однако отыскание подходящего начального приближения – далеко не простая задача. Поэтому необходимо как-то изменить формулу (4), чтобы добиться сходимости независимо от начального приближения. Доказано, что в некоторых предположениях для этого достаточно в методе Ньютона кроме направления движения (f ''(x))^–1·f '(x) выбирать и длину шага вдоль него. Такие алгоритмы называются методами Ньютона с регулировкой шага (методами Ньютона – Рафсона) и выглядят так:

x_k+1 = x_k – a_k(f ''(x_k))^–1·f '(x_k). (6)

Как и в градиентных методах величина a_k выбирается так, чтобы обеспечить убывание целевой функции на каждой итерации. Мы рассмотрим два способа выбора шага a_k. Первый из них связан с проверкой неравенства

f(x_k + a_kp_k) – f(x_k) £ d·a_k(f '(x_k), p_k), (7)

где p_k = – (f ''(x_k))^–1·f '(x_k) – направление спуска, а 0 < d < ½ – некоторое заданное число, общее для всех итераций. Если это неравенство выполнено при a_k = 1, то шаг принимается равным единице и осуществляется следующая итерация. Если нет – дробится до тех пор, пока оно не выполнится.

Схема метода Ньютона – Рафсона с дроблением шага.

шаг 1:

На первой итерации, при k = 0, вводятся исходные данные x_0, d, ε ₃. Вычисляются значения градиента f '(x₀) и матрица f ''(x₀).

шаг 2:

Присваивается a = 1. Определяется направление спуска p_k, как решение системы линейных уравнений f ''(x_k)·p_k = – f '(x_k).

шаг 3:

Проверяется условие f(x_k + a_kp_k) – f(x_k) £ d·a_k(f '(x_k), p_k). Если выполняется, то переход к шагу 4.Иначе дробим значение шага a (например, a = a/2) и повторяем шаг 3.

шаг 4:

Определяется следующая точка: x_k₊₁ = x_k + a·p_k.

шаг 5:

Вычисляются значение градиента f '(x_k+1) в точке x_k+1.

шаг 6:

Если ||f '(x_k+1)|| £ ε ₃, то поиск на этом заканчивается и полагается x = x_k+1 и y = f(x_k+1). Иначе k = k + 1 и переход к шагу 2.

Второй метод определения шага a_k в схеме (6), как и в методе наискорейшего спуска состоит в минимизации функции

f(x_k + a_kp_k) = min f(x_k + a_kp_k).

Схема метода Ньютона – Рафсона с выбором оптимального шага. α ≥ 0

шаг 1:

При k = 0, вводятся x₀, ε ₃. Вычисляются f '(x₀) и f ''(x₀).

шаг 2:

Определение направления спуска p_k, как решение системы линейных уравнений f ''(x_k)·p_k = – f '(x_k).

шаг 3:

Определяется следующая точка спуска: x_k₊₁ = x_k + ap_k, где a - решение задачи одномерной оптимизации: min f(x_k + ap_k).

шаг 4:

Вычисляются в точке x_k+1: f '(x_k+1) и f ''(x_k+1).

шаг 5:

Если ||f '(x_k+1)|| £ ε ₃, то поиск заканчивается и полагается x = x_k+1 и y = f(x_k+1). α ≥ 0 Иначе k = k + 1 и переход к шагу 2.

Модификации метода Ньютона

Значительные трудности, возникающие при практической реализации метода Ньютона, связаны с необходимостью вычислить матрицу f ''(x). Мы рассмотрим две модификации метода Ньютона, которые используют не точные значения, а некоторые приближённые аналоги матрицы вторых производных. В результате уменьшается трудоёмкость методов, но, конечно, ухудшается их сходимость.

В качестве первой модификации метода Ньютона рассмотрим следующий алгоритм:

x_k+1 = x_k – a_k(f ''(x_k))^–1·f '(x_k), a_k ≥ 0. (8)

здесь для построения направления спуска используется один раз вычисленная и обращённая матрица вторых производных f ''(x₀).

Схема модификации I метода Ньютона.

шаг 1:

При k = 0, вводятся x₀, ε ₃. Вычисляются f '(x₀) и f ''(x₀).

шаг 2:

Определение обратной матрицы (f ''(x₀))^–1.

шаг 3:

Определение направления спуска p_k: p_k = – f '(x_k)·(f ''(x₀))^–1.

шаг 4:

Определение следующей точки: x_k₊₁ = x_k + a·p_k, где a – решение задачи одномерной минимизации функции φ (a) = f(x_k + a·p_k), при a ≥ 0.

шаг 5:

Вычисление в точке x_k+1.градиента f '(x_k+1)

шаг 6:

Если ||f '(x_k+1)|| £ ε ₃, то поиск заканчивается и полагается x = x_k+1 и y = f(x_k+1). Иначе k = k + 1 и переход к шагу 3.

В рассмотренной схеме для выбора шага a_k используется способ аналогичный исп–му в методе наискорейшего спуска. Но можно было бы воспользоваться и способом аналогичным используемому в градиентном методе с дроблением шага.

Если матрица f ''(x) положительно определена, то итерационный процесс (d) является одной одной из модификаций градиентного спуска, независимо от начального приближения x₀.

⇐ Предыдущая 2 3 4 5 6 7 8 91011 Следующая ⇒

© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.