- •Решение:
- •Итерация 2:
- •Итерация 3:
- •Решение:
- •Найдем третий центр. В качестве с3 выберем тот элемент Zj, который находится на наибольшем расстоянии от ближайшего из центров.
- •Задание 4. Постройте дендрограмму, соответствующую исходным данным Задания 2. Сделайте чертеж.
- •Решение:
- •Список использованной литературы
Задание 4. Постройте дендрограмму, соответствующую исходным данным Задания 2. Сделайте чертеж.
Данную дендрограмму, я строила в программе Statistica:
С данными, указанными выше на рисунке, я получила следующую дендрограмму:
Задание 5. Для заданных значений параметров нормальных законов распределения (m1, σ1) и (m2, σ2), характеризующих два класса объектов наблюдения С1 и С2:
Вариант |
m1 |
σ1 |
m2 |
σ2 |
p1 |
p2 |
5 |
--3 |
1 |
--1 |
0.5 |
0.9 |
0.1 |
1)определите условные по классу плотности вероятности результатов наблюдений
2) постройте решающее правило по критерию максимального правдоподобия;
3) рассчитайте теоретические величины вероятностей ошибок распознавания первого и второго рода по этому критерию;
4) для заданных значений априорных вероятностей p1 и p2 появления классов С1 и С2 определите условные плотности полной вероятности результатов наблюдений и апостериорные вероятности классов С1 и С2;
5) постройте решающее правило по критерию максимальной апостериорной вероятности;
6) рассчитайте теоретические величины вероятностей ошибок распознавания первого и второго рода;
7) сравните эффективности решающих правил, построенных по критериям максимального правдоподобия и максимальной апостериорной вероятности.
Решение:
-
Исходные данные: число классов объектов – 2, закон распределения признаков объектов – нормальный. Параметры распределения (математическое ожидание m и среднеквадратическое отклонение σ):
m1=-3; σ1=1 (класс 1); m2=--1; σ2=0.5 (класс 2);
-
Для построения графиков условных по классу ак(к=1,2) плотностей вероятности признаков х:
Определим пользовательскую функцию трех аргументов:
Сформируем массив N точек N=200, по оси Ох, располагающихся с равным шагом в диапазоне [xmin,xmax]. Верхнюю xmax и верхнюю xmin границы диапазона определим по правилу «трех сигм», согласно которому случайная величина х, распределенная по нормальному закону, находится на интервале значений m3 σ с вероятностью более 0,997. Считаем, что случайные значения параметра х будут лежать в диапазоне [x1min, x1max], если наблюдается класс 1 , и в диапазоне [x2min, x2max], если наблюдается класс 2 , где
x1min=m1-3*σ1=3-3=0, x1max=m1+3*σ1=3+3=6
x2min=m2-3*σ2=1-1.5=-0.5, x2max=m2+3*σ2=1+1.5=2.5
Определим нижнюю и верхнюю границы значений параметра х:
xmin:=min(x1min,x2min);
xmax:=max(x1max,x2max).
Для заданных данных xmin=-0.5, xmax=6.
Разделим интервал [xmin,xmax] на (N-1) часть и определим координаты точек разделения:
Сформируем массивы значений условных по классу плотностей вероятности , соответствующие точкам xi:
fx1i:=f(xi,m1,σ1), fx2i:=f(xi,m2,σ2).
Построим графики условных плотностей вероятности
-
Для определения порогов принятия решения по критерию максимального правдоподобия, нужно решить уравнение:
Отсюда
.
Обозначим:
d1=1, d2=0.25, a=0.75, b=-0.5, c=2.35
Вычислим пороги принятия решения xg1 и xg2, xg1< xg2^
Получим: xg1=2.07 xg2=1.41
-
Изобразим на графике полученные границы раздела между классами xg1 и xg2. Если какой-либо из порогов лежит в областях маловероятных значений параметра х для всего множества классов , то следует переопределить нижнюю и (или) верхнюю границы х.
-
Для оценки эффективности решающего правила, рассчитаем теоретические величины вероятностей ошибок распознавания.
Вероятность отнести наблюдаемый признак к классу а1, когда он в действительности принадлежит классу а2:
.
Вероятность принятия решения в пользу класса а2, когда в действительности наблюдается класс а1:
Получим Р21=0,056 и Р12= 0,127
Вероятность правильного распознавания определим как:
P:=1-0.5*(P21+P12)
Получим Р=0,908
-
Для построения решающего правила по критерию максимальной апостериорной вероятности зададим априорные вероятности р1 и р2 появления классов а1 и а2, р1+р2=1:
р1:=0,9. р2:=0,1
-
По алгоритму, построим в интервале [xmin, xmax] график плотностей полных вероятностей появления класса а1 и а2.
fx1i=p1*f(xi,m1,σ1), fx2i=p2*f(xi,m2,σ2), и график апостериорных вероятностей классов а1 и а2.
-
Для определения порогов принятия решения о классе объекта по критерию максимальной апостериорной вероятности, решим квадратное уравнение:
Приведем его к виду:
x2(σ22- σ12)+x(2m2 σ12-2m2 σ12)+m12 σ12- m22 σ22-2 σ12 σ22Ln()=0.
Обозначим:
d1= σ12, d2= σ22, a=d2-d1, b=2*m2*d1-2*m1*d2, c=m12*d2-m22*d1-2*d1*d2*ln()
d1=1, d2=0.25, a=0.75, b=0.5, c=0.5
Вычислим пороги принятия решения xg1 и xg2, xg1<xg2:
Получим xg1=0,41 xg2=-1,08
-
Для визуализации границ раздела между классами, переопределим границы области признака x: xmin, xmax.
-
Рассчитываем теоретические вероятности ошибок распознавания первого и второго рода:
.
Получим: Р21=0,035 и Р12=0,115
Вероятность правильного распознавания для случая, когда априорные вероятности классов известны и р1р20,5:
Р:=1(-р1*Р12+р2*Р21)
Р:=0,893
-
На основании полученных теоретических оценок вероятностей правильного распознавания можно сделать следующие выводы:
-
если сведения об априорных вероятностях классов отсутствуют, то это равносильно предположению о равных вероятностях появления классов:
где -априорная вероятность класса ai; K-количество классов;
-
случай, когда априорные вероятности классов одинаковы, является наихудшим для статистического (при прочих равных условиях).