Добавил:

Studfiles2 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный электротехнический университет "ЛЭТИ"

Предмет:

Анализ и интерпретация данных

Файл:

Анализ и интерпретация данных / Глава_3.doc

Скачиваний:

114

Добавлен:

01.05.2014

Размер:

2.53 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 67 / 127 8 9 10 11 12 > Следующая >>>

3.7. Достаточные статистики и семейство экспоненциальных функций

Рассмотрим применение теоремы факторизации для получения достаточных статистик на примере хорошо знакомого случая нормального распределения при p(x|)~N(,). Имеем

В этом разложении первый множитель выделяет зависимость p(|) от , а согласно теореме факторизации, видно, что статистика достаточна для . Конечно, любая взаимно однозначная функция этой статистики также достаточна для , в частности и выборочное среднее

также достаточно для . Исходя из этой статистики, можно написать

g(m_n, )=.

Воспользовавшись формулой (38) или непосредственной подстановкой, можно получить ядро плотности

Из этого выражения сразу же выясняется, что m_n и есть оценка по максимуму правдоподобия для . Байесовскую апостериорную плотность можно получить из (m_n, ), выполняя интегрирование согласно (39). Если априорная плотность близка к равномерной, то р (|) = (m_n, ).

Такой же общий подход возможен и при определении достаточных статистик для других функций плотности. В частности, он применим к любому из членов экспоненциального семейства, группы функций распределения и плотностей, имеющих простые достаточные статистики. В число членов экспоненциального семейства входят нормальное, экспоненциальное, релеевское, пуассоновское и многие другие известные распределения. Все они могут быть записаны в виде

р(х|) =(x)exp[a()+b()^tc(x)] (40)

Таким образом, получаем

(41)

где можно принять

(42)

g(s, )=exp[n{a()+b()^ts}] (43)

. (44)

Выражения функций распределения, достаточных статистик и ненормированных ядер для некоторых обычно встречающихся членов экспоненциального семейства приведены в табл. 3.1.Вывод из этих выражений оценок по максимуму правдоподобия и байесовских апостериорных распределений вполне обычная вещь. Выражения, за исключением двух, приведены для случая одной переменной, хотя и могут быть использованы для случаев с многими переменными, если можно допустить статистическую независимость^¹¹.

Общий вид распределений из экспоненциального семейства
Наименование	Распределение	Область определения	s	[g (S, )]^1/n
Нормальное, с одной переменной		>0
Нормальное, с многими переменны-ми		положи-тельно опреде-лена
Экспоненциальное		>0
Релея		>0
Максвелла		>0
Гамма		>-1 >0
Бета		>-1 >-1
Пуассона		>0
Бернулли		0<<1
Биномиальное	, x=0,1,. . .,m	0<<1
Полино-миальное		0<<1

Было бы приятно отметить в заключение, что полученные результаты составляют набор средств, достаточный для решения большинства задач из области классификации образов. К сожалению, все обстоит иначе. В применении ко многим случаям указанные члены экспоненциального семейства с их плавным изменением и однообразием формы не представляют хорошего приближения реально встречающихся плотностей. Часто применяемое упрощающее предположение о статистической независимости далеко не всегда оказывается справедливым. В случае, когда применение функции из экспоненциального семейства и дает хорошее приближение неизвестной плотности, обычно бывает необходимо оценивать множество неизвестных параметров, а в распоряжении имеется только ограниченное число выборок. Как мы увидим, это может привести к тому, что оптимальные оценки дадут малоудовлетворительные результаты, и даже к тому, что «оптимальные» системы будут выполнять свои функции хуже, нежели «почти оптимальные».

<<< < Предыдущая 1 2 3 4 5 67 / 127 8 9 10 11 12 > Следующая >>>

Соседние файлы в папке Анализ и интерпретация данных

#
01.05.20142.53 Mб114Глава_3.doc
#
01.05.20144.12 Mб108Глава_4.doc
#
01.05.20142.76 Mб106Глава_5.DOC
#
01.05.201410.78 Mб110Глава_6.DOC