Добавил:

Studfiles2 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный электротехнический университет "ЛЭТИ"

Предмет:

Анализ и интерпретация данных

Файл:

Анализ и интерпретация данных / Глава_3.doc

Скачиваний:

114

Добавлен:

01.05.2014

Размер:

2.53 Mб

Скачать

☆

<<< < Предыдущая 12 / 122 3 4 5 6 7 8 9 10 11 12 > Следующая >>>

3.2. Оценка по максимуму правдоподобия

3.2.1. Общая идея метода

Предположим, что мы разбили множество выборок на классы, так что получено с классов выборок χ₁,…, χ_c, причем выборки в каждом классе χ_j получены независимо в соответствии с вероятностным законом p(x|ω_j). Предполагается, что плотность p(x|ω_j) задана в известной параметрической форме и, следовательно, однозначно определяется вектором параметров θ_j. Мы могли, например, получить распределение p(x|ω_j)~N (μ_j, ∑_j), в котором компоненты θ_j составлены из компонент μ_j и ∑_j. Чтобы явно выразить зависимость p(x|ω_j) от θ_j, запишем p(x|ω_j) в виде ^² p(x|ω_j, θ_j). Задача состоит в использовании информации, получаемой из выборок, для удовлетворительной оценки векторов параметров θ₁,…, θ_c.

Для облегчения задачи предположим, что выборки, принадлежащие χ_i, не содержат информации о θ_j, если i≠j, т. е. предполагается функциональная независимость параметров, принадлежащих разным классам ^³. Это дает возможность иметь дело с каждым классом в отдельности и упростить обозначения, исключив индексы принадлежности классу. В результате получается с отдельных задач, формулируемых следующим образом: на основании множества χ независимо от полученных выборок в соответствии с вероятностным законом p(x|θ) оценить неизвестный параметрический вектор θ.

Предположим, что χ содержит п выборок: χ ={x₁, ..., х_n}. Так как выборки получены независимо, имеем

p(χ |θ)=p(x_k|θ). (1)

Рис. 3.1. Оценка по максимуму правдоподобия для параметра θ.

Рассматриваемая как функция от θ, плотность p(χ|θ) называется правдоподобием величины θ относительно данного множества выборок. Оценка по максимуму правдоподобия величины θ есть по определению такая величина , при которой плотность p(χ|θ) максимальна (рис. 3.1).

Интуитивно это означает, что в некотором смысле такое значение величины θ наилучшим образом соответствует реально наблюдаемым выборкам.

Для целей анализа обычно удобнее иметь дело с логарифмом правдоподобия, нежели с самой его величиной. Так как логарифм есть монотонно возрастающая функция, то максимуму логарифма правдоподобия и максимуму правдоподобия соответствует одна и та же величина . Если p(χ|θ) есть гладкая дифференцируемая функция θ, то определяется посредством обычных методов дифференциального исчисления. Пусть θ есть p-компонентный вектор θ=(θ₁,..., θ_p)^t, пусть также—оператор градиента,

= (2)

и пусть - функция логарифма правдоподобия

= log p () (3)

Тогда

= (4)

= (5)

Совокупность условий, необходимых для определения оценки по максимуму правдоподобия величины , может быть получена, таким образом, из решения системы р уравнений =0.

3.2.2. Случай многомерного нормального распределения: неизвестно среднее значение

Для иллюстрации применения полученных результатов к конкретному случаю предположим, что выборки производятся из нормально распределенной совокупности со средним значением и ковариационной матрицей. Для простоты сначала рассмотрим случай, когда неизвестно только среднее значение. Тогда

log p ()=

Если отождествить и , то из уравнения (5) увидим, что оценка по максимуму правдоподобия для должна удовлетворять уравнению

После умножения на и преобразования получим

(6)

Этот результат весьма убедителен. Он свидетельствует о том, что оценка по максимуму правдоподобия при неизвестном среднем по совокупности в точности равна среднему арифметическому выборок — выборочному среднему. Если представить п выборок геометрически в виде облака точек, то выборочное среднее будет центром этого облака. Помимо всего, выборочное среднее имеет ряд достоинств с точки зрения статистических свойств, в связи с чем эта весьма наглядная оценка часто оказывается предпочтительнее, не говоря уже о том, что она представляет максимально правдоподобное решение.

<<< < Предыдущая 12 / 122 3 4 5 6 7 8 9 10 11 12 > Следующая >>>

Соседние файлы в папке Анализ и интерпретация данных

#
01.05.20142.53 Mб114Глава_3.doc
#
01.05.20144.12 Mб108Глава_4.doc
#
01.05.20142.76 Mб106Глава_5.DOC
#
01.05.201410.78 Mб110Глава_6.DOC