- •«АНАЛИЗ И ИНТЕРПРЕТАЦИЯ ДАННЫХ»
- •Оценка качества классификации
- ••Так как решение принимается на основе одномерной величины U, то можно считать, что
- ••В редуцированном пространстве переходим к одномерным условным нормальным распределения величины U
- ••Прямое вычисление ошибок в многомерном пространстве приводит к техническим трудностям, поэтому и применяется
- •• Условные математические ожидании и дисперсии U по классам
- •Нахождении дисперсий данной величины
- ••U может принадлежать двум нормальным распределениям: U1 N( (½) , ); U2 N(-
- •- обобщенное расстояние между классами в N- мерном пространстве.
- •хорошо описывает статистическую природу данных.
- •• Построим вероятности ошибок классификации
- •Полная ошибка
- •• Рассмотрим α
- •Подбирая размерность пространства всегда можно добиться уменьшения ошибок (с ростом размерности ошибка падает).
• Построим вероятности ошибок классификации
U C C = ln K K = (q2C(1|2) )/(q1C(2|1) ) N((1/2)αα) N(-(1/2)αα)
P = q1 P(2|1) + q2 P(1|2) - вероятность полной
|
ошибки |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
||
P 2 | 1 |
|
|
1 |
|
exp ( |
U 2 |
) 2 dU |
f U | 1 1 |
|
U |
|
||||||||||
C |
|
|
exp ( |
2 |
)2 |
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
2 |
|
|
2 |
|
|
|
2 |
|
|
2 |
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
P(2 | 1)
P(1 | 2)
1 C exp
2
1 exp
2 C
|
|
|
U |
1 |
|
|
|
|
|
|
|
|
|
||||
1 |
|
|
2 |
|
|
2 |
|
1 |
|
|
|||||||
|
( |
|
|
|
|
|
|
) |
|
dU |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
2 |
|
|
|
|
|
|
|
|
|||||||||
|
|
|
2 |
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
U |
1 |
|
|
|
|
|
|
|
|
|
||||
1 |
|
|
2 |
|
|
2 |
|
1 |
|
|
|||||||
|
( |
|
|
|
|
|
|
|
) |
|
dU |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
2 |
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
2 |
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
c 2 |
|
|
t 2 |
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
C α 2 |
||||
|
|
|
|||||||
|
|
|
|
|
|
|
|||
|
|
|
e |
|
2 dt |
|
|
|
|
|
|
|
|
|
α |
||||
|
|
|
|
|
|
|
|
|
t 2 |
C 2 |
||
|
|
||||
|
|
|
|
|
|
e |
|
2 dt 1- |
|
|
|
|
|
||||
c 2 |
|
|
|
|
Ф(x) – интеграл ошибок Гаусса.
Полная ошибка
|
|
|
C 2 |
|
|
|
C 2 |
||||
P |
q |
( |
|
|
|
) q |
2 |
1 |
|
|
|
|
|
|
|
||||||||
ош |
1 |
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
Cвойства полной ошибки: |
|
|
|
|
||||||||||||
C = ln K = ln((q2C(1|2))/(q1C(2|1))) = 0 |
|
|
|
|
|||||||||||||||
q1 = q2 = 0.5 |
|
|
|
|
|
C(1|2) = C(2|1) |
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
)] = |
|
|
|
|
||
P = 0.5 Ф( |
|
|
) + 0.5 [1 - Ф( |
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|||||||||||||
ош |
2 |
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
= 0.5 [1 - Ф( |
|
|
|
|
)] + 0.5 [1 - Ф( |
|
)] = 1 - Ф( |
|
) |
||||||||||
|
2 |
|
|
||||||||||||||||
|
|
|
2 |
2 |
Т.к. Ф(-х) = 1 – Ф(х)
• Рассмотрим α
|
|
|
2 |
0 |
|
|
|
1 |
|
|
|
Пусть |
... |
|
|
|
|
|
|
|
|
||
|
|
0 |
|
2 |
|
|
|
|
n |
|
|
|
|
n |
|
i |
i |
|
|
|
|
|
|
|
|
|
M1 |
M 2 |
|
|
|
|
|
|
|
|
|
M |
|
, |
|||
|
|
|
|
|
2 |
|
|
|||
= (M - M )T -1(M -M ) =i 1 |
|
|
i |
|
|
1 |
|
|||
1 |
2 |
1 |
2 |
|
|
|
|
M ..., |
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
M n |
Если i2 = 1, тогда = Σ(M1i - M2i)2 = d2
Ошибка зависит от обобщенного расстояния d2, чем больше d2, тем меньше ошибка (так как расстояние между распределениями увеличивается).
((M1i - M2i)/ i)= - это взвешенное нормальное распределение
Если = const, тогда будет представлять собой следующее:
= Σ 2 = n 2 |
d |
|
|
Pош 1 ( |
|
n |
|
) |
|
n |
|||||||||
2 |
|
||||||||
|
|
|
|
|
|
|
Пусть вероятность ошибки 0,005 = 0,5%.
Pош = 1 – Ф(x), где х = nγ
2
По таблице можно найти данную величину:
2nγ 2,6 n [(5γ.2)2 ]
= 0.1 – это означает,
|
5.2 |
|
|
пересекаются2 |
|
||
( |
0.1) |
|
|
n = [ |
] = 2700 для2 = 0,1 |
||
|
( |
5. |
) |
|
5 |
||
Для = 5 n = [ |
] = 2 |
Подбирая размерность пространства всегда можно добиться уменьшения ошибок (с ростом размерности ошибка падает).
P1пр = |
f(U|1)dU |
Pпр2 = |
C |
f(U|2)dU |
|
|
|
|
|
|
C |
|
|
|
Pпрср = q1 P1пр + q2 P2пр