Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

МО-Лекции

.pdf
Скачиваний:
20
Добавлен:
03.05.2015
Размер:
4.33 Mб
Скачать

2.4.СИМПЛЕКСНЫЙ МЕТОД НЕЛДЕРА–МИДА ИЛИ ПОИСК ПО ДЕФОРМИРУЕМОМУ

МНОГОГРАННИКУ

Вданном методе [2] в процессе поиска осуществляется работа с регулярными симплексами. Регулярные многогранники в пространстве

En называются симплексами. Для n

2 регулярный симплекс пред-

ставляет собой равносторонний треугольник, при

n

3

тетраэдр

и т. д.

 

 

 

 

Координаты вершин регулярного

симплекса

в

n -мерном про-

странстве могут быть определены следующей матрицей D , в которой столбцы представляют собой вершины симплекса, пронумерованные

от 1 до ( n 1 ), а строки – координаты вершин, i

 

 

 

 

 

1, n . Матрица имеет

размерность n (n

1) :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

d1

d2 ....

d2

 

 

 

 

 

 

 

 

 

 

 

 

0

d2

d1 ....

d2

 

 

 

 

 

 

 

 

 

 

D

0

d2

d2 ....

d2

 

 

 

,

 

 

 

 

 

 

 

.... .... .... .... ....

 

 

 

 

 

 

 

 

 

 

 

 

0

d2

d2 ....

d1

n (n 1)

 

 

 

 

 

где

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

 

d1

 

 

( n 1 n 1) ; d2

 

 

 

 

 

 

;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

2

 

 

n

2( n

1 1)

 

 

 

 

 

 

 

 

 

t – расстояние между вершинами.

В самом простом виде симплексный алгоритм заключается в сле-

дующем. Строится

регулярный симплекс. Из вершины, в которой

f (x ) максимальна

(точка 1, рис. 2.4), проводится проектирующая

прямая через центр тяжести симплекса. Затем точка 1 исключается и строится новый отраженный симплекс из оставшихся старых точек и одной новой, расположенной на проектирующей прямой на надлежащем расстоянии от центра тяжести.

Продолжение этой процедуры, в которой каждый раз исключается вершина, где целевая функция максимальна, а также использование правил уменьшения размера симплекса и предотвращения циклическо-

20

го движения в окрестности экстремума, позволяют достаточно эффективно определять минимум для «хороших» функций. Но для овражных функций такой поиск неэффективен.

Представление об идее алгоритма дает рис. 2.4.

Рис. 2.4. Траектория спуска в простейшем симплексном алгоритме

 

В симплексном алгоритме Нелдера и Мида минимизация функций

n

переменных

осуществляется

с использованием деформируемого

многогранника.

 

 

 

 

 

 

 

 

 

 

 

Будем

рассматривать

k

итерацию

 

алгоритма.

Пусть

x k

xk

, xk

,..., xk

,

i 1,..., (n

1) , является i -й вершиной в

En на

i

i1

i2

 

in

 

 

 

 

 

 

 

 

 

k -м этапе поиска, k

 

0,1, 2,... , и пусть значения целевой функции в

этой вершине

f x k

.

Отметим вершины с минимальным и макси-

 

 

 

 

i

 

 

 

 

 

 

 

 

 

мальным значениями. И обозначим их следующим образом:

 

 

 

 

 

f (x k )

max

f (x k ),..., f (x k

1

)

;

 

 

 

 

 

 

 

h

 

1

n

 

 

 

 

 

 

 

f (x k )

min

f (x k ),..., f (x k

1

) .

 

 

 

 

 

 

 

l

 

1

n

 

 

 

21

Многогранник в En состоит из

n 1 вершин x k ,

x k

,..., x k

1

. Обо-

 

 

 

1

2

n

 

значим через x k

2

центр тяжести вершин без точки

x k

с максималь-

n

 

 

h

 

 

 

ным значением функции. Координаты этого центра вычисляются по формуле

 

 

1

n 1

 

 

 

xk

2, j

 

xk

xk

, j 1,..., n .

(2)

 

n

n

i, j

h, j

 

 

 

 

i 1

 

 

 

Начальный многогранник обычно выбирается в виде регулярного симплекса (с вершиной в начале координат). Можно начало координат

поместить в центр тяжести. Процедура отыскания вершин в En , в которых f (x ) имеет лучшее значение, состоит из следующих операций:

1)отражения; 2) растяжения; 3) сжатия; 4) редукции.

1.Отражение. Отражение представляет собой проектирование точ-

ки x k

через центр тяжести

x k

2

в соответствии со следующим соот-

h

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

ношением

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x k

x k

2

 

(x k

2

x k ) ,

 

 

 

(3)

 

 

 

 

 

n 3

n

 

n

h

 

 

 

 

 

 

где

0 – коэффициент отражения.

 

 

 

 

 

 

 

 

 

Вычисляем значение функции в найденной точке

f x k

3

. Если

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

значение функции в данной точке

f (x k

)

 

f (x k ) , то переходим к

 

 

 

 

 

 

 

 

 

 

 

n 3

 

 

h

 

 

 

 

четвертому пункту алгоритма – операции редукции.

 

 

 

 

Если f

x k

3

 

f x k

f

x k

3

f

 

x k

,

то выполняем операцию

 

 

n

 

h

 

n

 

 

l

 

 

 

 

 

 

 

растяжения.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В противном случае, если

f

x k

3

 

f

x k

 

f x k

3

f

 

x k , то

 

 

 

 

 

 

 

 

n

 

 

h

 

n

 

 

l

выполняется операция сжатия.

 

 

 

 

 

 

 

 

 

 

 

2. Растяжение. Эта операция

заключается в следующем. Если

f x k

 

f x k

(меньше минимального значения на

k -м этапе), то

n 3

 

 

l

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

вектор

x k

3

x k

2

растягивается в соответствии с соотношением

 

n

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x k

x k

2

 

x k

3

x k

 

,

 

 

 

(4)

 

 

 

 

 

n 4

n

 

n

 

n 2

 

 

 

 

 

где

0 – коэффициент растяжения.

 

 

 

 

 

 

 

 

 

22

 

Если

f (x k

4

)

f (x k ) ,

то

x k

заменяется на

x k

4

и процедура про-

 

 

 

 

 

 

n

 

 

 

l

 

l

 

 

 

 

 

n

 

 

 

 

должается с операции отражения при

k

k

1 . В противном случае

x k

 

заменяется на x k

 

, и также переходим к операции отражения.

l

 

 

 

 

 

 

 

 

n 3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3.

Сжатие.

 

Если

 

f

x k

3

f

x k

 

для

i

 

 

i

 

h ,

то вектор

 

 

 

 

 

 

 

 

 

 

 

 

n

 

i

 

 

 

 

 

 

 

 

 

 

x k

x k

2

сжимается в соответствии с формулой

 

 

 

 

 

 

h

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x k

x k

 

x k

 

x k

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n 5

 

n 2

 

h

 

n 2

 

 

 

 

 

 

 

где 0

 

 

 

1 – коэффициент сжатия. После этого точка x k

заменяется

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

h

 

на x k

5

, и переходим к операции отражения с

k

k

 

1 . Заново ищет-

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ся x k

1 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

h

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4. Редукция. Если

 

f (x k

)

f (x k ) ,

то все векторы

x k

x k , где

 

 

 

 

 

 

 

 

 

 

 

 

n 3

 

 

h

 

 

 

 

 

 

 

 

i

l

 

 

 

 

 

 

 

 

i

1, (n

 

1)

, уменьшаются в два раза с отсчетом от точки x k по фор-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

l

муле

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x k

 

x k

0.5 x k

x k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

, i

1, (n 1)

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

l

 

 

i

l

 

 

 

 

 

 

 

 

 

 

и осуществляется переход к операции отражения (на начало алгоритма с k k 1 ).

Вкачестве критерия останова могут быть взяты те же правила, что

ив остальных алгоритмах. Можно также использовать критерий останова следующего вида:

1

n 1

 

 

 

 

1/2

f (x k )

f (x k

 

 

2

 

 

)

 

 

 

2

.

 

 

 

 

n 1 i 1

i

n

 

 

 

 

 

 

 

 

Выбор коэффициентов , ,

обычно осуществляется эмпириче-

ски. После того как многогранник подходящим образом промасштабирован, его размеры должны поддерживаться неизменными до тех пор, пока изменения в топологии задачи не потребуют многогранника

другой формы. Чаще всего рекомендуют

1 , 0.4

0.6 , 2

3 .

23

2.5. МЕТОД ПАУЭЛЛА И СОПРЯЖЕННЫЕ НАПРАВЛЕНИЯ

2.5.1. ОБОСНОВАНИЕ ПРИМЕНЕНИЯ СОПРЯЖЕННЫХ НАПРАВЛЕНИЙ В АЛГОРИТМАХ ОПТИМИЗАЦИИ

Метод Пауэлла [2] относится к прямым методам (методам нулевого порядка). Этим методом наиболее эффективно осуществляется минимизация функций, близких к квадратичным. На каждой итерации алгоритма поиск осуществляется вдоль системы сопряженных направлений.

Два направления поиска S i , S j называются сопряженными, если

SiT H S j 0, i j ,

S iT H S i 0 , i j ,

где H – положительно определенная квадратная матрица.

В методе Пауэлла H 2 f (x k ) – матрица вторых частных произ-

водных. Идеи метода Пауэлла относятся к квадратичной функции f (x ) .

Основная идея заключается в следующем. Если на каждом этапе поиска определяется минимум квадратичной функции f (x ) вдоль ка-

ждого из p ( p n) -сопряженных направлений и если затем в каждом

из направлений делается шаг до минимальной точки, то полное перемещение от начала до шага с номером p сопряжено ко всем подна-

правлениям поиска.

Применение сопряженных направлений лежит в основе ряда алгоритмов.

Пусть f (x ) – квадратичная функция и процесс минимизации начи-

нается в точке x 0

с начальным направлением

 

 

1 . Для удобства возь-

S

 

 

 

1 T

 

 

1

 

мем этот вектор

единичным, т. е. S

S

1. Тогда вектор

 

 

 

24

x1 x 0

1

 

 

1

и длина шага

 

1

 

определяется из условия минималь-

S

 

ности функции в данном направлении т. е.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

x 0

 

 

 

 

 

1 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

arg min f

 

 

 

S

 

 

 

 

 

 

 

 

 

 

Для квадратичной функции

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

df (x 0

 

 

1)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

T f (x 0 ) S

 

 

 

(S

)T

 

 

2 f (x 0 ) S

0 ,

(5)

 

 

 

 

 

d

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и, таким образом, оптимальное значение

 

 

 

на первом шаге определя-

ется в соответствии с соотношением

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

T f (x 0 )

 

1

 

 

 

 

 

 

 

T f (x 0 )

 

 

1

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

S

 

 

 

 

 

S

,

 

 

(6)

 

 

 

 

 

 

 

 

 

 

 

 

1

 

T 2

 

 

 

0

 

 

 

 

 

1

 

 

 

 

 

 

1

 

T

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

(S

)

f (x

)S

 

 

(S

)

H S

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где H

2 f (x k ) .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Из точки

 

1

процесс минимизации должен осуществляться в дру-

x

гом сопряженном направлении

 

2 , при этом в силу сопряженности

 

S

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

T

 

 

 

 

 

 

1

 

0 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

H S

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Отметим, что квадратичная функция может быть представлена в виде

 

 

 

T

 

1

 

T

Hx ,

f (x) a b

x

x

 

2

 

 

 

 

 

 

 

 

 

где положительно определенная матрица H

2 f (x ) .

В общем случае система n линейно независимых направлений по-

иска S1, S 2 ,..., S n называется сопряженной по отношению к некоторой положительно определенной матрице H , если

 

 

i

 

T

 

 

j

 

, 1 i j n .

(S

)

H S

0

 

 

 

25

Так как сопряженные направления линейно независимы, то любой

вектор в пространстве En можно выразить через систему S1, S 2 ,..., S n следующим образом:

 

 

 

 

 

n

 

v j

 

j

 

 

 

 

 

V

 

 

S

,

 

 

 

 

 

 

 

 

j 1

 

 

 

 

 

 

 

 

 

 

где

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j

T

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

v j

 

 

 

S

 

 

 

HV

.

(7)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j

 

T

 

 

 

j

 

 

 

 

 

S

 

 

 

 

 

 

 

 

 

 

 

H S

 

 

 

Известная формула, примем ее на веру.

 

 

 

 

 

Для некоторой матрицы

H всегда существует,

по крайней мере,

одна система из n взаимно сопряженных направлений, так как сами собственные векторы матрицы H представляют собой такую систему.

Отметим, что для квадратичной функции справедливо следующее соотношение, которое потребуется в дальнейшем:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

j

 

 

 

 

j T

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

H 1

 

S

S

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

(8)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

T

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j 1

 

j

H

 

 

 

 

j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S

S

 

 

 

Чтобы убедиться

 

в

его справедливости, рассмотрим

матрицу

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j

S

j (

S

j ) . Умножение ее справа на H

S

k дает

 

 

 

j 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

j (

 

 

j ) H

 

k

 

 

 

 

 

 

 

 

k (

 

 

 

k ) H

 

k

 

k ,

 

 

 

 

 

 

j

S

S

S

 

 

 

 

k

S

S

S

S

 

 

 

 

 

j 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

если положить

 

 

 

 

k

H

 

k .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

S

S

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Вообще говоря, справедливо общее правило, заключающееся в том,

что если используются сопряженные направления для поиска минимума квадратичной функции f (x ) , то эта функция может быть мини-

26

мизирована за n шагов, по одному в каждом из сопряженных направ-

лений. Более того, порядок использования сопряженных направлений несуществен.

Покажем, что это действительно так. Пусть

f x – квадратичная

функция и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

T

 

 

 

 

 

 

1

 

 

 

T

Hx ,

 

 

 

 

 

 

 

 

 

f

x

a

 

b

x

x

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

при этом

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f x

 

 

 

 

 

b

 

Hx .

 

 

 

 

 

 

 

 

В точке минимума

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f

 

x

 

 

 

 

 

 

 

0 ,

 

 

 

 

 

 

 

 

 

 

 

 

и эта точка

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

H 1

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

b

 

 

 

 

 

 

 

 

 

 

Заметим, что

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

T f x k

 

k

 

 

 

 

 

 

 

 

 

k T

 

 

f x k .

S

 

 

 

 

 

 

S

 

 

Так как

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x1

x 0

 

 

 

 

 

1

 

1 ,

 

 

 

 

(9)

 

 

 

 

 

 

 

 

 

 

S

 

 

 

 

где 1 определяется в соответствии с соотношением (6):

 

 

 

 

T f x 0

 

1

 

 

 

 

 

 

 

 

 

 

 

 

T f x 0

 

 

1

 

1

 

 

 

S

 

 

 

 

 

 

 

 

 

 

 

 

S

,

 

 

 

1 T

2 f x 0

 

 

 

1

 

 

 

 

 

 

 

 

 

 

1 T

 

 

 

 

 

 

 

 

 

 

 

 

 

 

H

 

1

 

 

 

S

S

 

 

 

 

 

 

 

S

S

а затем минимум находится в следующем сопряженном направлении по аналогичным формулам

x 2

x1

2

 

 

2

 

 

S

 

и так далее, то на n -м шаге имеем

 

 

 

 

 

 

 

 

n

 

x n

x 0

 

i

S

i .

(10)

 

 

i 1

 

27

На

каждом шаге минимизируем

 

одномерную

функцию

f x i 1

i

 

i

в направлении

 

 

i ,

чтобы получить i . На основании

S

S

(6) это приводит к следующему выражению

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

T

f x i

1

 

 

 

 

 

 

 

 

 

n

 

 

 

S

 

 

i .

 

 

 

 

 

x n

x 0

 

 

 

 

 

 

 

 

 

 

 

 

S

(11)

 

 

 

 

 

 

 

 

 

 

i T

 

 

i

 

 

 

 

 

 

i 1

 

 

 

 

 

S

H S

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Кроме того,

 

 

 

 

i T

f xi 1

 

 

 

 

i T

 

Hxi 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i T

 

 

 

H x 0

 

 

i 1 k

 

k

 

 

 

 

 

 

 

 

 

 

S

S

 

 

b

 

 

 

 

 

 

 

S

 

 

 

S

 

 

b

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k 1

 

 

 

 

 

 

 

 

 

 

и получаем

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i T

 

 

f x i 1

 

 

 

 

 

 

 

 

 

 

 

i T

Hx 0

 

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S

 

 

 

 

 

 

 

 

 

 

S

b

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

T

 

 

k

 

 

 

 

 

i

 

k , вследствие сопряженности

 

i

 

 

 

k

 

так как все

S

 

H S

 

 

 

 

 

 

0 ,

 

 

 

S

 

и S

 

.

 

 

Таким образом,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

i

 

 

T

 

Hx 0

 

 

 

 

 

 

 

 

 

 

i

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x n

 

x 0

 

 

S

 

 

 

 

 

 

b

S

 

 

 

 

 

 

 

 

 

 

 

(12)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

T

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S

 

 

H S

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Выразим векторы x 0

 

и H 1

 

через систему сопряженных векторов

 

b

 

 

i следующим образом (по аналогии с (7)):

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

i T Hx 0

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x 0

 

 

S

S

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

1

 

 

 

 

 

 

 

 

 

i T

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S

H S

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

T

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i T

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

S

 

 

H H

b S

 

 

 

n

 

 

 

 

 

S

bS

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

H 1b

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

i T H

 

 

 

i

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

i T

H

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S

S

 

 

 

 

 

 

 

 

 

S

S

 

 

 

 

 

 

 

 

 

 

28

С учетом этого из (12) получим

 

 

 

 

x n x 0 x 0 H 1

b

H 1

b

.

(13)

Таким образом, точка x n , полученная в результате минимизации квадратичной функции на n -м шаге, совпадает с точкой минимума

квадратичной функции f x .

Покажем теперь, что для сопряженных направлений, если f x

каждый раз минимизируется в сопряженном направлении S j в соответствии с формулой (6), то при этом выполняется следующее равенство:

 

 

 

 

j T

f x l

 

 

 

 

 

 

 

 

 

 

 

 

 

S

0 ,

 

 

1 j l

1 ,

 

 

 

при использовании не более чем n направлений, т. е.

f xl ортого-

нален использованным сопряженным направлениям.

 

 

 

 

 

 

f x l

 

 

Hx l . Следовательно,

Для квадратичной функции

b

 

 

 

 

 

 

l

1

 

j

 

 

 

 

l

1

 

j ,

f x l

b

H x k

j

S

 

b

Hx k

H

j

S

 

 

 

 

 

j

k

 

 

 

 

j

k

где x k – произвольная точка, из которой начинается поиск по сопряженным направлениям.

Так как

 

 

 

 

f x k

 

 

 

Hx k ,

 

 

 

 

b

 

то

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f xl

 

f x k

 

 

l

1

j H

 

j .

 

 

 

 

 

 

 

 

S

 

 

 

 

 

 

 

 

 

 

j

k

 

 

 

 

 

 

 

Умножение этого равенства слева на

 

 

k

1

T

S

 

 

дает

 

 

k 1 T

f x l

 

k 1 T

f x k

 

 

l 1 j

 

k 1 T H

 

j .

 

S

S

 

 

S

S

 

 

 

 

 

 

 

 

 

 

 

 

j k

29