Скачиваний:
83
Добавлен:
02.05.2014
Размер:
816.13 Кб
Скачать

Детальная проверка и сохранение результатов

Завершающая стадия работы с See5 обычно заключается в детальном просмотре результатов работы построенного классификатора в окне перекрестных ссылок. После нажатия соответствующей кнопки (Cross-Reference) на экране появляется диалоговое окно, в котором предлагается выбрать файл с данными для классификации (рис. 12). Это может быть исходный файл данных (в нашем случае USR.data), файл с тестовыми данными (USR.test) или файл, содержащий объекты с неизвестной классификацией (USR.cases).

Выбрав требуемый файл, нажимаем ОК. На экране появляется окно перекрестных ссылок, в левой половине которого сначала изображено полное дерево решений, а в правой представлен список объектов, подвергнутых классификации. Некоторые возможности работы с окном перекрестных ссылок обсуждались выше. Здесь остановимся еще на двух в

Рис. 12. Выбор файла данных для классификации

озможностях.

Первая заключается в возможности поэлементного просмотра для выбранного объекта ветви построенного дерева решения. Для этого нужно щелкнуть левой кнопкой мыши в правом поле окна перекрестных ссылок на требуемом объекте—в левом поле автоматически отобразится соответствующая ветка. Так, в случае, показанном на рис. 13, для изучения был выбран объект № 4 (около него появился темный кружок). Как видим, с этим объектом соотносится достаточно короткая ветка решения (Index<=0,69&Age>43&Accel<=85). Аналогичным образом можно разобрать результаты классификации всех других доступных объектов (нажатием кнопки Reset возвращается исходное изображение полного дерева решений).

Вторая возможность заключается в сохранении полученных результатов. Причем здесь существенным является выборочное сохранение. А именно, после нажатия кнопки Save, расположенной в правом нижнем углу окна перекрестных ссылок, сохраняться в текстовом формате будут только результаты, относящиеся к текущему отображению дерева решений (целиком или его части).

Рис. 5.20. Просмотр результатов классификации в окне перекрестных ссылок

3 Задание на лабораторную работу

  1. Изучить процесс построения деревьев решений в системе See5, выполнив приведенный в описании пример (файл URS.data и URS.names).

  2. Самостоятельно провести анализ данных для примера по урожайности сельскохозяйственных участков (файл Example1). Анализ включает в себя этапы:

  • подготовку данных

  • Построение деревьев решений с целью выявления зависимостей типа «Если – То»

  1. Сделать выводы по полученным результатам

  2. Для полученного варианта задания выполнить вручную письменно построение дерева решений и извлечение правил с помощью алгоритма CLS.

  3. Изучить процесс построения деревьев решений в системе Tree Analyzer и выполнить построение дерева для примера.

  4. Сравнить результаты (деревья решений и правила), полученные с помощью системы Tree Analyzer и системы See5/C5. Сделать выводы.

Примечания.

Правила подготовки данных для работы в системе See-5 Вариант 1

  1. Данные файла Example1.xls скопировать в новый файл. Преобразовать эти данные: создать столбец «класс» (класс А-№1, класс В - №2), удалить столбцы «урожайность» и «номер объекта».

  2. Сохранить с расширением .csv (CSV разделители запятые

  3. Открыть файл в Word (кодировка Unicode UTF-8). Произвести замену: «,» - на «.» и «;» - на «,».

  4. Запомнить файл как текстовый (кодированный текст .txt).

  5. Изменить расширение файла .txt на .data (если нет разрешения, то: «Вид», «Свойства папки», «Вид», отменить «не показывать расширения …»).

  6. Создать в Word файл имен переменных в соответствии с требованиями, описанными в методичке.

  7. Задать этому файлу расширение .names. Данные готовы.

Соседние файлы в папке Методичка по лабораторной работе №3