Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Метод_лаб_2011_ТПР_стац.doc
Скачиваний:
53
Добавлен:
07.06.2015
Размер:
1.4 Mб
Скачать

Визуализатор «Правила»

Данный визуализатор является альтернативой дереву решений – правила отображаются не в иерархичном, а обычном продукционном виде «Если-то».

Визуализатор «Таблица сопряженности»

Для того чтобы оценить качество классификации данных, обычно используют таблицу сопряженности. Для решения задачи классификации используется таблица, в которой уже есть выходной столбец, содержащий класс объекта. После применения алгоритма добавляется еще один столбец с выходным полем, но его значения уже вычисляются, используя построенную модель. При этом значения в столбцах могут отличаться. Чем больше таких отличий, тем хуже построенная модель классификации. Ниже изображен пример таблицы сопряженности.

Классифицировано

Фактически

Класс 1

Класс 2

Класс 3

Итого

Класс 1

239

239

Класс 2

7

10

17

Класс 3

4

1

17

22

Итого

250

11

17

278

В данном примере три класса, поэтому таблица сопряженности имеет размер 3 на 3 ячейки. На главной диагонали показано количество правильно классифицированных примеров (зеленый цвет). Красным цветом выделены неправильно распознанные примеры.

Таблицу сопряженности удобно применять для оценки качества модели, построенной с помощью обработчика «Дерево решений». Если количество неправильно классифицированных примеров довольно велико, это говорит о плохо построенной модели и нужно либо изменить параметры построения модели, либо увеличить обучающую выборку, либо изменить набор входных полей. Если же количество неправильно классифицированных примеров мало, это может быть почвой для дальнейшего анализа и говорит о том, что пример является аномалией. В этом случае можно посмотреть, чем же характеризуются такие примеры и возможно добавить новый класс для отнесения этих примеров.

Визуализатор «Что-если»

Анализ по методу «Что-если» позволяет исследовать как будет вести себя построенная система обработки при подаче на ее вход тех или иных данных. Проще говоря, проводится эксперимент, в котором, изменяя значения входных полей обучающей или рабочей выборки нейронной сети или дерева решений, пользователь наблюдает за изменением значений на выходе (рис. 3.4).

Рис. 3.4. Таблица «Что-если»

С использованием диаграммы «Что-если» можно решать обратную задачу – то есть визуально наблюдать, при каких значениях входных переменных будет достигнуто желаемое выходное значение (рис. 3.5).

Рис. 3.5. Диаграмма «Что-если»

Обработчик «Автокорреляция»

Целью автокорреляционного анализа является выяснение степени статистической зависимости между различными значениями (отсчетами) случайной последовательности, которую образует поле выборки данных. В процессе автокорреляционного анализа рассчитываются коэффициенты корреляции (мера взаимной зависимости) для двух значений выборки, отстоящих друг от друга на определенное количество отсчетов, называемые также лагом.

Применительно к анализу временных рядов автокорреляция позволяет выделить месячную и годовую сезонность в данных (рис. 4.1). Видно, что пик зависимости на данных приходится на 12 месяц, что свидетельствует о годовой сезонности. Поэтому величину продаж годовой давности необходимо обязательно учитывать при построении модели (если используется нейронная сеть – то подавать на вход).

Рис. 4.1. Автокорреляция