Добавил:

Studfiles2 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный электротехнический университет "ЛЭТИ"

Предмет:

Анализ и интерпретация данных

Файл:

Анализ и интерпретация данных1 / конспект_АИД_полный_New_red22.doc

Скачиваний:

254

Добавлен:

01.05.2014

Размер:

4.33 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 67 / 257 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

2. Классификация данных.

2.1. Постановка задачи

Рассматриваем матрицу данных:

классы

Мы должны каким-то образом разбить ее на классы. Эквивалентом термина классификация является распознавание образов.

Методы классификации используются для распознавания:

изображений;
речи;
букв;

Классификация данных: предполагается, что есть объект, описанный набором признаков:

в конечномерном пространстве R_n(можно решать задачу и в бесконечно-мерном пространстве , например, используя в качестве признаков коэффициенты ряда Фурье)

Множество классов D представляет собой перечень возможных классов

где: определяют совокупность классов.

Возможны следующие варианты:

, то есть все задачи будем рассматривать в. Пусть имеется разбиение на классы:

Можно предполагать, что при, то есть множества классов не пересекаются, такую задачу мы хотим иметь, но чаще всего это не наблюдается.

Часто имеет место , -это относится скорее к детерминированной модели, когда множество классов не покрывает все пространство

Если - такая ситуация тоже может быть, то есть признаки покрывают все пространство.

Для каждого мы должны найти некотороеd_i, которое определяется следующим образом: . Задача состоит в построении такой функции и определенииd_i_.Решение может быть однозначным или неоднозначным. Такая функция называется решающей.

Можно сформулировать следующую задачу: найти обратную функцию, порождающую для каждого номера (названия) соответствующее множество:

Эта функция должна порождать множество , которое соответствует определению

класса d_i_.. Идеальный вариант, когда выполнено следующее:, то есть совпадает с истинным множеством класса, но чаще всего это не наблюдается.

Решающая функцияx₂

x₁

Задача состоит в построении решающих функции.

Термин обучение заключается в следующем: есть обучающие выборки

,…,,…,то есть мы располагаем некоторыми конечными множествами. Предварительно мы знаем, куда относится какой-либо объект, нам нужно построить конкретную решающую функцию из,которая будет удовлетворять определенным критериям и(то есть дает определенное решение).