Добавил:

fench Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный исследовательский ядерный университет (МИФИ)

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Загребаев Методы обработки статистической информации в задачах контроля 2008

.pdf

Скачиваний:

Добавлен:

16.08.2013

Размер:

7.77 Mб

Скачать

☆

<<< < Предыдущая 14 15 16 17 18 19 20 21 22 23 24 2526 / 3926 27 28 29 30 31 32 33 34 35 36 37 38 > Следующая >>>

ση2	k	j)2 ,
	= 2 ∑ f j (		(3.5.45)

j=0

где – интервал разбиения.

Рис. 3.9. Преобразование непрерывной плотности распределения к кусочно-постоянной плотности распределения

Ограничения, накладываемые на f0 , ..., fk , определяются клас-

сом Φ, причем одним из ограничений обязательно является условие:

k
2 ∑ f j	=1,	(3.5.46)

j=0

которое представляет собой дискретный аналог условия (3.5.2).

В настоящее время разработано большое число методов поиска экстремума функций многих переменных при наличии ограничений.

Характерной особенностью задачи минимизации функции

(3.5.44) является необходимость определения c ( f0 , ..., fk ) на каждом шаге итерационного процесса минимизации.

Для нахождения c ( f0 , ..., fk ) могут быть использованы абсо-

лютно оптимальные рекуррентные алгоритмы (2.1.72), рассмотренные в предыдущей главе; с учетом кусочно-постоянного характера

функции f д(η) эти алгоритмы можно записать в виде:

251

ˆ	ˆ		−
c	(i) = c (i −1)	+ Γ(i)	−

fl − fl−1
fl − fl−1	∂ψ(i,c )		, (3.5.47а)
fl	∂c		, (3.5.47а)
fl	∂c		ˆ
		c	=c (i−1)

Γ(i) = Γ(i −1) −

∂

Γ(i −1)

∂ψ(i,c )

ψ(i,c )

Γ(i −1)

∂c

−

=c (i−1)

, (3.5.47б)

IF−1( f0 ,..., fk ) +

∂тψ(i,c )

Γ(i −1) ∂ψ(i,c )

∂c

(i−1)

k −1

( f

− f

IF ( f0 ,..., fk ) 2 ∑

(3.5.47в)

f j

j=0

Γ(0) = λI ,

λ >>1.

c (0)

= c0

Число l в формуле (3.5.47а) определяется номером интервала, в

который попадает невязка процесса идентификации:

l = int

	ˆ	на i-м шаге рекуррентного
ε(i, c(i −1))
	ˆ
	ε(i,c (i −1))		+1.	(3.5.47г)

Параметр i изменяется от 1 до N, где N – число измерений входов и выхода объекта, используемых при определении оптимальной плотности распределения.

Общая схема процесса нахождения оптимальной функции плотности распределения (функции потерь) может быть представлена последовательностью действий.

1. Задаем начальные приближения:

ˆ		ˆ		Γ(0) = λI ,			λ >>1;
c (0) = c0 ;				Γ(0) = λI ,			λ >>1;
			f00		, 0 ≤ η <		;
				0	,	≤ η < 2 ;
f д	0	(η) =	f	0	,	≤ η < 2 ;
f д		(η) =	L
			...
				0	, (k −1)		≤ η < k ,
			fk		, (k −1)		≤ η < k ,

где f д0 (η) удовлетворяет условию (3.5.46), f д0 (η) Φ ; l = 0 , l – номер итерации в процессе минимизация функции (3.5.44).

252

2. Используя рекуррентные формулы (3.5.47), находим оценку

ˆ l

при допущении, что

f (η) = f

дl

(η) .

параметра c

3. Вычисляем значение минимизируемой функции по формуле

(3.5.44):

( f jl+1 − f jl )2

k−1

J l = ∑

;

f jl

−1

ˆ l

j=0

,(ση )

)

(ση2 ) l = 2 ∑ f jl ( j)2 .

j=0

4. Рассчитываем

новое

значение

плотности

распределения

( f д)l+1 :

f0l

+ 0 ; 0 ≤ η ≤ ;

( f д)l+1(η) = ...

−1) ≤ η ≤ k ,

fkl + k ; (k

Тогда 0 , ...,

k определяются выбранным методом поиска экстре-

мума функции многих переменных (3.5.44) при ограничениях:

( f д)l+1(η) Φ ,

2 ∑ f jl+1 =1 .

j=0

5. Рассчитываем новое значение критерия:

k −1

f jl++11 − f jl+1

J l+1 = ∑

f jl+1

−1

ˆ l

l+1

j=0

(ση )

(ση2 )l+1 =

2 ∑ f jl+1(

j)2 .

j=0

6.Проверяем условие окончания итерационного процесса:

J l+1 − J l
J l+1	≤ δ , δ <<1.

Если условие выполняется, то процесс поиска оптимальной плотности распределения заканчивается; в противном случае переходим к п. 2 итерационного процесса, присвоив l = l +1 .

253

Необходимо отметить, что минимизируемая функция (3.5.44) является чаще всего многоэкстремальной, что приводит к опасности нахождения локального минимума. Это необходимо иметь в виду при решении задач подобного типа.

3.5.5. Определение функции потерь для регрессионных объектов. Алгоритм Хубера

Как уже отмечалось выше, задача определения функции потерь в общем случае не может быть решена в явном виде. Однако для некоторых классов при идентификации линейного регрессионного объекта вида

y(i) = b1u1(i) +... + bnun (i) + η(i)

(3.5.48)

эта задача может быть получена в явном виде. Это связано с тем, что нормированная информационная матрица для линейных регрессионных объектов не зависит ни от оцениваемых параметров, ни от дисперсии помехи.

Учитывая это, минимизируемый функционал (3.5.43), а именно:

∞	f ′	2	(η)				1
J ( f (η)) = V( f (η)) = ∫	f ′		(η)	dη			1		,
J ( f (η)) = V( f (η)) = ∫				dη	tr (A				,
−∞	f (η)					−1		2
							(c ,ση ))

f (η) Φ

может быть заменен более простым функционалом

∞	f ′	2	(η)
J ( f (η)) = ∫				dη , f (η) Φ ,	(3.5.49)

−∞	f (η)

который представляет собой информацию Фишера.

В том случае, когда помеха η имеет распределение, принадлежащее классу α-загрязненных распределений (см. классы Φ3 , Φ4 ,

Φ5 в разд. 3.2.1), для нахождения оптимальной плотности распре-

деления может быть использован минимаксный подход Хубера. Как уже отмечали, оптимальной на классе плотностью распре-

деления для Р-объектов является плотность распределения, которой соответствует минимальная фишеровская информация.

Интересно отметить, что работы Хубера в истории развития робастных оценок были пионерскими. Ему удалось обосновать принцип минимакса, опираясь только на выводы теории вероятностей и

254

математической статистики (в основном на центральную предельную теорему и ее следствия).

Итак, рассмотрим задачу идентификации коэффициентов линейного регрессионного объекта (3.5.48) в предположении, что распределение f (η) помех принадлежит классу α-загрязненных

распределений:

Φ ={ f (η) : f (η) = (1− α)h(η) + αg(μ)} ,	(3.5.50)
где h(α) – известная плотность распределения; g(η)	– произволь-

ная неизвестная плотность распределения; α – вероятность появления «выброса» с распределением g(η) , α удовлетворяет условию

0 ≤ α ≤1 .

Результат, полученный Хубером, получил название «Теорема Хубера».

Теорема Хубера. Пусть h(η) – дважды непрерывно дифференцируемая плотность распределения, такая, что (−ln h(η)) – выпуклая вниз функция. Тогда АМКО линейных регрессионных объек-

тов – V(F, f )	имеет седловую точку, т.е. существует плотность
распределения	f (η) = (1− α)h(η) + αg (η) и функция	F *(η) =
= −ln f *(η) , такие, что
	V(F, f ) ≤ V(F, f ) ≤ V(F, f ) .	(3.5.51)

Далее, пусть η0 и η1 ( η0 < η1 ) – концы интервала (один или оба конца могут быть бесконечными), где


		′
		′
	h (η)		≤ k ,	η [η0 , η] ,				(3.5.52)
			≤ k ,	η [η0 , η] ,				(3.5.52)
		h(η)
и k , α, η0 и η1 связаны соотношением:
		η			h(η0 ) + h(η1)
(1− α)−1 = ∫1 h(η)dη+					h(η0 ) + h(η1)		.	(3.5.53)
(1− α)−1 = ∫1 h(η)dη+							.	(3.5.53)
		η0			k
Тогда плотность f		η0
Тогда плотность f		* (η) имеет вид:
(1− α)h(η0 )exp(k(η− η0 )),						η ≤ η0 ;
		− α)h(η),		η0 ≤ η ≤ η1;				(3.5.54)
f *(η) = (1		− α)h(η),		η0 ≤ η ≤ η1;				(3.5.54)
(1		− α)h(η )exp(−k(η− η )),				η ≥ η .
		1		1		1

255

Вначале покажем, что f * (η) , определяемая формулой (3.5.54),

удовлетворяет всем требованиям, предъявляемым к плотности распределения, и принадлежит классу (3.5.50). Затем докажем, что эта плотность f * (η) действительноявляетсяоптимальнойнаклассе(3.5.50).

Итак, рассмотрим условия второй части теоремы. Прежде пока-

жем, что	f * (η) удовлетворяет условию полноты интеграла:
∞	η				η
∫	f * (η)dη = ∫0	(1−α)h(η0 )ek(η−η0 ) + ∫1				(1−α)h(η)dη+
−∞	−∞				η0
	∞
	+ ∫ (1− α)h(η1)e−k (η−η1)dη =
	η1
		1		η				1
	= (1− α)h(η0 )	1	+ (1− α) ∫1 h(η)dη+ (1− α)h(η1)					1	=
	= (1− α)h(η0 )		+ (1− α) ∫1 h(η)dη+ (1− α)h(η1)					k	=
		k		η0				k
				η0
				η1	h(η ) + h(η )
	= (1−α)			∫ h(η)dη+	0	1	.
	= (1−α)			∫ h(η)dη+	k		.
					k
			η0

По условию теоремы (3.5.53) выражение, стоящее в квадратных

скобках, равно	(1− α)−1 , и, следовательно, получаем
∞
∫ f * (η)dη =1, т.е.	f * (η) удовлетворяет условию полноты инте-
−∞

грала.

Покажем теперь, что и g * (η) , соответствующая f * (η) , также удовлетворяет условию полноты интеграла, а именно:

∞
∫ g * (η)dη =1.	(3.5.55)

−∞

Используя формулы (3.5.50) и (3.5.54), найдем выражения для g * (η) :

	(1− α)		h(η )ek(η−η0 ) − h(η)					,	η ≤ η ;
	α		h(η )ek(η−η0 ) − h(η)					,	η ≤ η ;
	α			0					0
				0					0
									η0 ≤ η ≤ η1; (3.5.56)
g * (η) = 0,									η0 ≤ η ≤ η1; (3.5.56)
	1− α				−k(η−η1)
	1− α				−k(η−η1)
	α	h(η1)e				− h(η)	,		η ≥ η1.

256

Интегрируя (3.5.56) на бесконечных пределах, нетрудно убедиться в справедливости выражения (3.5.55). Покажем, в заключение, что g * (η) неотрицательная функция. Докажем это для η< η0

(при η > η1 доказательство аналогичное).

Рис. 3.10. График функции –ln(f(η))

По условию теоремы − ln(h(η)) – выпуклая вниз функция. Следовательно, график этой функции лежит выше касательной, проведенной в любой точке, в том числе и в точке η0 (рис. 3.10).

Как известно, наклон касательной определяется производной функции в данной точке. Таким образом, учитывая условие выпуклости вниз функции −ln h(η) , можно записать:

−ln h(η) ≥ −ln h(η0 ) + (−ln h(η))′ η=η0 (η− η0 ) =

= −ln h(η			) −	h′(η0 )	(η− η	) ,	(3.5.57)
= −ln h(η			) −		(η− η	) ,	(3.5.57)
0				h(η0 )	0
				h(η0 )
			η≤ η0 .
По условию теоремы (3.5.52)
	′
	′
	h (η)	≤ k , η [η0 , η] .
	h(η)	≤ k , η [η0 , η] .
	h(η)

Учитывая, что h(η) – дважды непрерывно дифференцируемая

плотность распределения, можно заключить: h′(η0 ) = k h(η0 )

257

Тогда, подставляя последнее равенство в формулу (3.5.57), получим:

−ln h(η) ≥ −ln h(η0 ) − k(η− η0 ) ,

или

		′	≥ 0 .
	ln h(η0 ) + k(η− η0 ) − ln h (η)
Последнее неравенство эквивалентно выражению
	h(η0 )ek(η−η0 ) − h(η) > 0 .		(3.5.58)
Согласно формуле (3.5.56)
	1−α	(h(η0 )eh(η−η0 ) − h(η))= g * (η) .

	α

Сравнивая это выражение с неравенством (3.5.58), и так как 0 ≤ α ≤1 , то нетрудно заключить, что g * (η) ≥ 0 при η ≤ η0 , что и

требовалось показать.

Таким образом, g * (η) определена «вполне корректно» соот-

ношениями (3.5.56) в смысле требований, которым должна удовлетворять плотность распределения.

Покажем теперь, что f * (η) и соответствующая ей функция потерь F * (η) = −ln f * (η) действительно определяют седловую точку, т.е. удовлетворяют неравенству

	V(F * (η), f (η)) ≤ V( f * (η)) ≤ V(F(η), f * (η)) (3.5.59)
для	f (η) ,	~	~	~
		f (η) Φ , F(η) = −ln f (η) .

Правое неравенство выражения (3.5.59), очевидно, вытекает из свойств АМКО. Таким образом, необходимо доказать, что

V(F * (η), f (η)) ≤ V( f * (η))

(3.5.60)

для f (η) Φ .

Учитывая, что нормированная информационная матрица не зависит от ση2 и c , последнее неравенство можно переписать следующим образом:

∞

′

∫

f * (η)

′

(η)dη

∞

′2

(η)

f * (η)

∫

f *

dη ≤

−∞

(3.5.61)

f * (η)

∞

′

−∞

∫

f * (η)

f (η)dη

−∞

f * (η)

258

Подробное доказательство этого неравенства приведено в рабо-

те [4].

Таким образом, показали, что оптимальная на классе (3.5.50) плотность распределения существует и определяется по правилу

(3.5.54).

Запишем соответствующую ей оптимальную функцию потерь:

−ln[(1− α)h(η0 )] − k(ε − η0 ),			ε ≤ η0 ;
	− α)h(η0 )],	η0 ≤ ε ≤ η1;		(3.5.62)
F * (ε) = −ln[(1	− α)h(η0 )],	η0 ≤ ε ≤ η1;		(3.5.62)
−ln[(1	− α)h(η )] + k(ε − η ),		ε ≥ η .
	0	1	1

3.5.6. .Идентификация параметров регрессионного объекта при α-загрязненном нормальном распределении помехи

Пусть известно, что помеха принадлежит классу Φ3 – приближенно нормальных распределений:

f (η) = (1− α) fN (η) + αg(η) ,							(3.5.63)
где f N – нормальное распределение;
	1			1	2
fN =					2	,	(3.5.64)
	2	exp	−	2	η
	2	exp	−	2	η
	2πση			2ση

α– вероятность появления «выброса» с распределением g(η) . Примерный вид α-загрязненных шумов изображен на рис. 3.11.

Рис. 3.11. Примерный вид α-загрязненных шумов

259

Учитывая результат, полученный в предыдущем разделе, запишем оптимальную на классе плотность распределения:

				1								1
				1								1			η2
(1−α)								exp −									exp[k(η−η )], η<η ;
(1−α)				2 1/2				exp −				2σ2					exp[k(η−η )], η<η ;
				2 1/2								2σ2				0						0		0
			(2πση)										η

				1								1
				1								1		η2 ,
f *(η) = 1	−α)						exp			−									η0 ≤η≤η1;					(3.5.65)
f *(η) = 1	−α)			2	1/2		exp			−									η0 ≤η≤η1;					(3.5.65)
				2	1/2					2σ2
		(2πση)										η

				1								1
(1−α)				1				exp −				1			η2		exp[−k(η−η )], η>η .
(1−α)				2 1/2				exp −				2σ2			η2		exp[−k(η−η )], η>η .
				2 1/2								2σ2				1						1		1
			(2πση)										η

Соответствующая функция потерь будет иметь вид
												1							1
			−ln		(1	− α)						1				+			1	η2		− k(ε − η	),	ε ≤ η ;
			−ln		(1	− α)							2			+			2	η2		− k(ε − η	),	ε ≤ η ;
													2						2		0	0		0
											2πση							2ση

			−ln									1						1
F *(ε) =					(1	− α)						1				+		1	σ2	ε2 ,		η ≤ ε ≤ η		;
F *(ε) =					(1	− α)										+		2	σ2	ε2 ,		η ≤ ε ≤ η		;
													2					2	η			0	1
											2πση

												1						1
			−ln		(1	− α)						1				+		1	σ2	η2		+ k(ε − η ),		ε ≥ η .
			−ln		(1	− α)							2			+			σ2	η2		+ k(ε − η ),		ε ≥ η .
													2					2	η		1	1		1
											2πση							2

Очевидно, записанная функция потерь будет эквивалентна бо-
лее простой функции потерь:
										1		η2		− k(ε − η
										1											),	ε ≤ η ;
																					),	ε ≤ η ;
								2ση2				0							0			0
										1
			F *(ε) =							1		ε2 ,			η			≤ ε ≤ η ;						(3.5.66)
			F *(ε) =									ε2 ,			η			≤ ε ≤ η ;						(3.5.66)
									2ση2							0					1
									2ση2
										1		2
										1		2		+ k(ε − η1), ε ≥ η1.
									2σ2			η1		+ k(ε − η1), ε ≥ η1.
											η

На рис. 3.12 приведен примерный вид функции потерь (3.5.66). Видно, что на отрезке [η0 ,η1] функция потерь квадратичная (метод

260

<<< < Предыдущая 14 15 16 17 18 19 20 21 22 23 24 2526 / 3926 27 28 29 30 31 32 33 34 35 36 37 38 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
16.08.20132.42 Mб294Жолобов Ввведение в Математическое 2008.pdf
#
16.08.20131.61 Mб74Жукова Обсчая химия 2008.pdf
#
16.08.20131.33 Mб160Забродин УНИХ основы командного интерфейса 2010.pdf
#
16.08.20133.93 Mб150Завадцев Комплексы для инспекции елементного состава грузов 2011.pdf
#
16.08.201310.97 Mб124Загребаев Методы матпрограммирования 2007.pdf
#
16.08.20137.77 Mб92Загребаев Методы обработки статистической информации в задачах контроля 2008.pdf
#
16.08.20132.57 Mб43Задорожный Методы ядерно-физического мониторинга 2008.pdf
#
16.08.2013621.57 Кб19Захарова Праздники и традиции в Германии 2010.pdf
#
16.08.20135.66 Mб161Зебрев Физические основы кремниевой 2008.pdf
#
16.08.201312.57 Mб41Зелдович Физика ударных волн и высокотемпературных гидродинамических явлений 1966.pdf
#
16.08.2013674.08 Кб106Земсков Лабораторная работа Изучение интерферометра ФАБРИ-ПЕРО 2011.pdf