Добавил:

Studfiles2 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный электротехнический университет "ЛЭТИ"

Предмет:

Анализ и интерпретация данных

Файл:

Введение в многомерный статистический анализ / page175-212 / part1 / part1.doc

Скачиваний:

Добавлен:

01.05.2014

Размер:

1.06 Mб

Скачать

☆

<<< < Предыдущая 1 2 34 / 44

6.4. Классификация наблюдений в случае двух генеральных совокупностей, имеющих известные многомерные нормальные распределения

Теперь мы используем общий метод, описанный выше, для случая двух многомерных нормальных генеральных совокупностей с равными ковариационными матрицами, а именно для совокупностей с законами распределения N() и N(), где— вектор среднего значенияi-ой генеральной совокупности (i=1,2), a — ковариационная матрица каждой совокупности. [Этот метод впервые был использован Валь дом [1]. Тогдаi-я плотность распределения вероятностей будет равна

(1)

Отношение плотностей равно

(2)

Область , при попадании в которую наблюдение классифицируется как наблюдение над, является множеством векторов x, для которых величина (2) больше k (k выбирается подходящим образом). Так как логарифмическая функция монотонно возрастает, то неравенство (2) эквивалентно неравенству (получающемуся из (2) переходом к логарифмам)

(3)

Левую часть (3) можно представить в виде

(4)

Группируя соответствующие члены, получаем

. (5)

Первый член является хорошо известной дискриминантной функцией. Это линейная функция компонент вектора результатов наблюдений.

Следующая теорема является прямым следствием теоремы 6.3.1.

Теорема 6.4.1. Если имеет плотность распределения вероятностей (1) (i=1,2), то области наилучшей классификации определяются следующим образом:

(6)

Если априорные вероятности q₁ и q известны, то k равно

⁽⁷⁾

В частном случае двух равновероятных генеральных совокупностей, которым соответствуют одинаковые цены С(1|2) и C(2|l), k=1 и lnk = 0. Поэтому область, при попадании в которую выборка рассматривается как выборка из , определяется следующим образом:

(8)

Если нам неизвестны априорные вероятности, то мы можем выбрать In k = с, например, из условия, чтобы математические ожидания потерь, связанных с ошибками классификации, были равны. Пусть X—случайное наблюдение. Нам нужно найти распределение случайной величины

(9) считая сначала, что X распределен N(,), а затем что X распределен N(, ). ЕслиX распределен N(,), то величина U распределена нормально с математическим ожиданием

(10)

и дисперсией

(11)

Будем называть «расстоянием» между N(,) и N(⁽²⁾, ) величину

. (12)

Тогда, если X распределен N(, ), то U будет распределена N(). Если же X распределен N(⁽²⁾, ), то

(13)

Дисперсия U будет такой же, как и в случае, когда X распределен , поскольку она зависит лишь отмоментов второго порядка случайного вектора X. Таким образом, U будет распределен .

Вероятность ошибочной классификации при условии, что наблюдение производилось над равна

(14)

а вероятность ошибочной классификации при условии, что наблюдение производилось над ₂, равна

(15)

На рис. 9 эти две вероятности изображены в виде заштрихованных площадей, ограниченных «хвостами» плотностей. Для минимального решения с выбирается так, чтобы

(16)

Теорема 6.4.2. Если (i=1,2) имеют плотности распределения вероятностей (1), то минимаксные области классификации определяются по (6), где с = 1nk выбирается из условия (16), a C(i|j) — цены ошибочных классификаций.

В случае, когда цены ошибочных классификаций не равны

Следует отметить, что если цены ошибочных классификаций равны между собой, то c=0 и вероятность ошибочной классификации равна

между собой, с может быть определено достаточно точно по таблицам нормального распределения методом проб и ошибок.

Оба слагаемых в (5) содержат вектор

. (18) который получается как решение уравнения

. (19)

полученное эффективным численным методом, как, например, метод сокращения Дулиттла.

Интересно отметить, что х'является линейной функцией, которая дает максимум

(20)

при любом выборе d. Числитель (20) равен

(21)

а знаменатель

d'M(X — MХ)(Х — MX)'d = d’d, (22)

Нам нужно найти максимум (21) no d, сохраняя (22) постоянным. Если — множитель Лагранжа, то задача сводится к нахождению максимума выражения

. (23) -

Приравнивая нулю производные (23) по компонентам вектора d, получим

. (24)

Так как (-)’d — скаляр, скажем v, то (24) можно записать в виде

-=. (25)

Поэтому вектор d, являющийся решением уравнения (24), пропорционален вектору .

В заключение отметим, что если мы имеем выборку объема N либо из , либо из₂ , то можно использовать выборочное среднее значение и классифицировать выборку как выборку изили из.

1означает, что р₂(х) = 0,

<<< < Предыдущая 1 2 34 / 44