Добавил:

mureliv Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный исследовательский университет «МЭИ»

Предмет:

Нейро-нечеткие технологии в задачах управления

Файл:

лекции ННТЗУ / Лекция_4_ИНС_4

.pdf

Скачиваний:

Добавлен:

30.11.2022

Размер:

499.09 Кб

Скачать

☆

<<< < Предыдущая 12 / 42 3 4 > Следующая >>>

Анализ метода Ньютона

Область квадратичной сходимости метода Ньютона, гарантируемая теоремой, практически совпадает с областью линейной сходимости для метода наискорейшего спуска. Поэтому с практической точки зрения разумно всегда использовать метод Ньютона вместо градиентного спуска на последнем этапе процесса обучения.

Для корректного применения метода Ньютона необходимо выполнение двух условий:

•В текущей точке wk Hk 0. В противном случае квадратичная аппроксимация перестает быть параболоидом с единственным минимумом. Требование Hk 0 также важно для того, чтобы направление коррекции было направлением уменьшения значения функции Е.

•Квадратичная аппроксимация должна быть адекватным приближением функции E.

Во многих случаях выполнение этих двух условий не гарантируется. В результате метод Ньютона начинает работать неустойчиво и, в ряде случаев, расходится.

Алгоритм Левенберга-Марквардта

Учитывая вид функции ошибки, градиент и гессиан можно представить в следующем виде:

E		yn)
		yn)
	E	- yn)
		- yn)

Алгоритм Левенберга-Марквардта

Ключевое предположение методов из семейства Левенберга-Марквардта состоит в том, что второе слагаемое в гессиане функции E можно отбросить. Это

соответствует аппроксимации функций f(xn, w) линейными функциями в окрестности текущей точки w.

Другой аргумент в пользу отбрасывания слагаемого в гессиане состоит в том, что в окрестности оптимального решения f(xn, w) yn.

Тогда, с учетом отбрасывания слагаемого в гессиане, можно записать:

	y)
E	y)	E

Алгоритм Левенберга-Марквардта

 Матрица является неотрицательно-определенной. Поэтому для обеспечения строгой положительной определённости достаточно рассмотреть матрицу вида для любого положительного значения .

 Метод с шагом вида

yk)

 получил название метода Левенберга.

Алгоритм Левенберга-Марквардта

Скорость сходимости метода наискорейшего спуска существенно зависит от выбранной шкалы измерения компонентов оптимизируемого вектора. В частности, метод Ньютона можно интерпретировать как метод наискорейшего спуска, в котором используется невырожденное преобразование координат B−1, где матрица B есть корень из гессиана.

На основе этого соображения Марквардт предложил следующую модификацию метода Левенберга:

yk)

Алгоритм Левенберга-Марквардта

Элементы вектора w обычно упорядочиваются сначала по слою, затем по нейронам, и, наконец, по весу каждого нейрона и его смещению.

Значение на каждой итерации может выбираться с помощью стратегии адаптивной коррекции

Параметр λ задаётся изначально и определяет поведение алгоритма, делая его более похожим на градиентный метод или метод Гаусса-Ньютона. В самом начале обучения, когда функция f(x, w)подобрана грубо, удобно использовать метод наискорейшего спуска, поэтому λ выбирается относительно большим. По мере уточнения коэффициентов w более эффективным становится метод Гаусса-Ньютона (при этом λ становится малой величиной; при λ = 0 метод вырождается в метод Гаусса-Ньютона). Так ЛМ-метод реализует адаптивную модель перехода между классами.

Алгоритм Левенберга-Марквардта

После того, как при заданном λ вектор δ будет вычислен, необходимо принять решение о принятии модификации весов или её отклонения. Для этого необходимо рассчитать E(w + δ) и сравнить полученное значение с Е(w). Если E(w+δ) ≤ E(w), то необходимо уменьшить λ и изменить веса w:= w + δ , иначе λ увеличивается и метод применяется заново для нового λ.

Алгоритм Левенберга-Марквардта

Для настройки величины λ часто используется вспомогательная величина , v(обычно v = 10 ). Если λ необходимо увеличить, то λ умножается на v , иначе – делится.

Умножение повторяется до тех пор, пока E(w+δ) > E(w). Как только выполняется неравенство E(w+δ) ≤ E(w), считается, что один обучающий цикл (эпоха) нейросети завершился.

Таким образом, описанный метод относятся к методам первого порядка, т.к. за счет отбрасывания второго слагаемого в гессиане удалось избавиться от необходимости вычисления второй производной функции регрессии f. При этом данные методы обладают практически квадратичной скоростью сходимости в окрестности оптимального решения.

Алгоритм Левенберга-Марквардта

В результате процедура, реализующая обучающий цикл, имеет вид:

1) Весам сети присваиваются небольшие начальные значения. Рассчитывается отклик сети

2) Рассчитывается матрица Якоби J;

3) Рассчитывается градиент ошибки g = JT (f – y)

4) Рассчитывается приближенная матрица Гессе с помощью матрицы Якоби ;

H* = JTJ

5) Из выражения (H*+ λI)δ=g рассчитывается величина коррекции δ весовых коэффициентов w ;

6) Вычисляется новое значение функции ошибки E(w+δ);

7) Если E(w + δ) > E(w), то λ := v λ и перейти на шаг 5, иначе : λ = λ/v, w := w + δ, E(w):= E(w + δ) и закончить цикл обучения

Переобучение и обобщение

Одна из наиболее серьезных трудностей изложенного подхода заключается в том, что таким образом мы минимизируем не ту ошибку, которую на самом деле нужно минимизировать, — ошибку, которую можно ожидать от сети, когда ей будут подаваться совершенно новые наблюдения.

Иначе говоря, мы хотели бы, чтобы нейронная сеть обладала способностью обобщать результат на новые наблюдения. В действительности сеть обучается минимизировать ошибку на обучающем множестве, и в отсутствие идеального и бесконечно большого обучающего множества это совсем не то же самое, что минимизировать «настоящую» ошибку на поверхности ошибок в заранее неизвестной модели явления.

<<< < Предыдущая 12 / 42 3 4 > Следующая >>>

Соседние файлы в папке лекции ННТЗУ

#
30.11.2022479.09 Кб4Лекция_11_НчС_2.pdf
#
30.11.2022388.15 Кб7Лекция_1_Введение.pdf
#
30.11.2022553.25 Кб11Лекция_2_ИНС_1.pdf
#
30.11.2022259 Кб4Лекция_2_ИНС_2.pdf
#
30.11.2022385.28 Кб3Лекция_3_ИНС_3.pdf
#
30.11.2022499.09 Кб6Лекция_4_ИНС_4.pdf
#
30.11.2022310.76 Кб4Лекция_5_ИНС_5.pdf
#
30.11.20221.37 Mб5Лекция_5_ИНС_6.pdf
#
30.11.2022433.81 Кб5Лекция_6_ГА_1.pdf
#
30.11.2022538.38 Кб4Лекция_7_ГА_2.pdf
#
30.11.2022940.88 Кб4Лекция_8_ГА_3.pdf