Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ИДЗ_Дегилевич.docx
Скачиваний:
5
Добавлен:
04.09.2023
Размер:
954.53 Кб
Скачать

МИНОБРНАУКИ РОССИИ

Санкт-Петербургский государственный

электротехнический университет

«ЛЭТИ» им. В.И. Ульянова (Ленина)

Кафедра БТС

отчет

по индивидуальному домашнему заданию

по дисциплине «Технологии и системы принятия решений»

Тема: Классификация особо опасных сердечных аритмий

Студент гр. 7503

Дегилевич А.А.

Преподаватель

Манило Л.А.

Санкт-Петербург

2022

ЗАДАНИЕ

на ИНДИВИДУАЛЬНОЕ ДОМАШНЕЕ ЗАДАНИЕ

Студент: Дегилевич Андрей Алексеевич

Группа: 7503

Тема индивидуального домашнего задания: Классификация особо опасных сердечных аритмий

Исходные данные:

Отсчёты спектральной плотности мощности коротких фрагментов ЭКГ сигнала. Длительность каждого фрагмента 2 с, частота дискретизации 360 Гц. Спектр сигнала ограничен верхней частотой 15 Гц, а отсчёты СПМ задаются с шагом 1.4 Гц. Выборка данных включает несколько классов ЭКГ (ФР, ЖТ, ФЖ).

Требуется для заданных классов сигналов выполнить следующее:

1) провести классификацию данных методом k ближайших соседей; первые 15 объектов использовать как обучающую выборку, вторые 15 объектов использовать для тестирования;

2) построить решающие правила для распознавания трёх классов объектов, используя методы классификации:

а) случай независимых признаков (по минимуму расстояния);

б) случай равных ковариационных матриц;

в) по критерию Фишера (множественный анализ);

3) для методов п. 2, а и 2, б определить направление W (ориентирует положение разделяющей гиперплоскости); для метода п. 2, в – плоскость собственных векторов W1, W2.

4) записать уравнения разделяющих гиперплоскостей;

5) отобразить распределение объектов заданных классов в направлении W;

6) вычислив для каждого класса среднее и дисперсию проекций объектов на направление W, получить функции плотности вероятности (использовать нормальный закон распределения);

7) построить ROC кривые; провести сравнение эффективности алгоритмов классификации;

8) записать решающие правила и оценить ошибки классификации (точность распознавания).

Для объектов трех классов свести задачу к поэтапному решению двухклассовых задач.

Предполагаемый объем индивидуального домашнего задания:

Не менее 10 страниц (обязательны разделы «Содержание», «Метод k ближайших соседей», «Метод главных компонент», «Метод классификации по минимуму расстояний», «Метод классификации по критерию Фишера, «Приложения»).

Дата выдачи задания: 15.09.2022

Дата сдачи реферата:

Дата защиты реферата:

Студент

Дегилевич А.А.

Преподаватель

Манило Л.А.

Содержание

1

Метод k ближайших соседей

5

2

Метод главных компонент

12

3

Метод классификации по минимуму расстояний

13

4

Метод классификации по критерию Фишера

17

5

Метод классификации по критерию Фишера для многоклассовой задачи

21

6

Сравнение методов

24

Заключение

26

Приложение А. Программный код (MATLAB)

27

1 Метод k ближайших соседей

Для классификации методом k ближайших соседей воспользуемся функцией MATLAB – fitcknn. В работе используется два варианта метода k ближайших соседей:

1 вариант – классический способ. Объект присваивается тому классу, который является наиболее распространённым среди k соседей данного элемента, классы которых уже известны (т.е. объект имеет наибольшее число соседей в данном классе).

2 вариант – взвешенный способ, Оценивается не только количество объектов, попавших в область близости каждого класса, но и их удалённость от нового объекта.

Для каждого варианта строится зависимость общей точности от числа ближайших соседей. Количество соседей изменяется от 3 до 9. Обучение модели проходит на обучающей выборке, которая содержит по 15 случайных объектов каждого класса. Расчет параметров и оценка модели проводится на тестовой выборке, в которой содержатся 15 случайных объектов каждого класса не входящих в тестовую выборку. Расчет общей точности производится по формуле (1). В таблице используется следующая нумерация классов: 1 класс – фоновый ритм (ФР), 2 класс – желудочная тахикардия (ЖТ), 3 класс – фибрилляция желудочков (ФЖ).

Оценка качества классификации (общая точность):

(1)

где – число объектов i-го класса, отнесенных к классу j; – число верно распознанных объектов i-го класса; – число объектов класса i.

ОА – это доля правильно распознанных классов. Показывает возможность алгоритма правильно распознавать классы.

Таблица 1 – Матрица результатов классификации

Истинный класс, i

Число объектов

Результат распознавания (класс), j

1

2

3

1

2

3

В таблицах 2-8 представлены результаты классическим методом k ближайших соседей для количества соседей от 3 до 9 соответственно.

а) k = 3

Таблица 2 – Результаты классификации при k = 3

Истинный класс, i

Число объектов

Результат распознавания (класс), j

1

2

3

1

15

12

0

3

2

15

2

12

1

3

15

0

0

15

ОА = 0,8

б) k = 4

Таблица 3 – Результаты классификации при k = 4

Истинный класс, i

Число объектов

Результат распознавания (класс), j

1

2

3

1

15

12

0

3

2

15

5

9

1

3

15

0

0

15

ОА = 0,67

в) k = 5

Таблица 4 – Результаты классификации при k = 5

Истинный класс, i

Число объектов

Результат распознавания (класс), j

1

2

3

1

15

11

0

4

2

15

2

12

1

3

15

0

0

15

ОА = 0,78

г) k = 6

Таблица 5 – Результаты классификации при k = 6

Истинный класс, i

Число объектов

Результат распознавания (класс), j

1

2

3

1

15

11

0

4

2

15

4

10

1

3

15

0

0

15

ОА = 0,69

д) k = 7

Таблица 6 – Результаты классификации при k = 7

Истинный класс, i

Число объектов

Результат распознавания (класс), j

1

2

3

1

15

9

0

4

2

15

3

11

1

3

15

0

0

15

ОА = 0,69

е) k = 8

Таблица 7 – Результаты классификации при k = 8

Истинный класс, i

Число объектов

Результат распознавания (класс), j

1

2

3

1

15

10

1

4

2

15

6

8

1

3

15

0

0

15

ОА = 0,58

ж) k =9

Таблица 8 – Результаты классификации при k = 9

Истинный класс, i

Число объектов

Результат распознавания (класс), j

1

2

3

1

15

10

2

3

2

15

5

9

1

3

15

0

0

15

ОА = 0,62

В таблицах 9-15 представлены результаты взвешенным методом k ближайших соседей для количества соседей от 3 до 9 соответственно.

а) k = 3

Таблица 9 – Результаты классификации при k = 3

Истинный класс, i

Число объектов

Результат распознавания (класс), j

1

2

3

1

15

12

0

3

2

15

2

12

1

3

15

0

0

15

ОА = 0,8

б) k = 4

Таблица 10 – Результаты классификации при k = 4

Истинный класс, i

Число объектов

Результат распознавания (класс), j

1

2

3

1

15

12

0

3

2

15

2

12

1

3

15

0

0

15

ОА = 0,8

в) k = 5

Таблица 11 – Результаты классификации при k = 5

Истинный класс, i

Число объектов

Результат распознавания (класс), j

1

2

3

1

15

12

0

3

2

15

1

13

1

3

15

0

0

15

ОА = 0,84

г) k = 6

Таблица 12 – Результаты классификации при k = 6

Истинный класс, i

Число объектов

Результат распознавания (класс), j

1

2

3

1

15

12

0

3

2

15

1

13

1

3

15

0

0

15

ОА = 0,84

д) k = 7

Таблица 13 – Результаты классификации при k = 7

Истинный класс, i

Число объектов

Результат распознавания (класс), j

1

2

3

1

15

12

0

3

2

15

1

13

1

3

15

0

0

15

ОА = 0,84

е) k = 8

Таблица 14 – Результаты классификации при k = 8

Истинный класс, i

Число объектов

Результат распознавания (класс), j

1

2

3

1

15

12

0

3

2

15

2

12

1

3

15

0

0

15

ОА = 0,8

ж) k =9

Таблица 15 – Результаты классификации при k = 9

Истинный класс, i

Число объектов

Результат распознавания (класс), j

1

2

3

1

15

12

0

3

2

15

2

12

1

3

15

0

0

15

ОА = 0,8

На рисунке 1 представлены графики зависимости общей точности от количества ближайших соседей для обоих вариантов метода.

Рисунок 1 – Графики зависимости ОА от k

При использовании метода k ближайших соседей наибольшая точность достигнута при k = 5-7 во взвешенном варианте метода и равняется 0,84. На рисунке 2 можно заметить, что при разных значения k взвешенный вариант дает большую точность, чем стандартный вариант метода, что свидетельствует о его большей стабильности и предпочтительности.

Код программы для расчета параметров при классификации методом k ближайших соседей представлен в приложении А.

Соседние файлы в предмете Технологии и системы принятия решений