Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Содержание.doc
Скачиваний:
9
Добавлен:
28.05.2015
Размер:
1.28 Mб
Скачать

3.2.2 Форма автоматизация вычислительных экспериментов

Для накапливания экспериментальных данных по применению гибридной метрики при кластеризации в различных условиях был разработан специальный модуль по автоматизации вычислений. Чтобы его активировать, необходимо в меню выбрать пункт «Автоматизация вычислений», затем подпункт «Настройка и запуск» (рисунок 3.6).

Данный модуль обладает следующими возможностями:

  • перебор параметров кластеризации в заданном пользователем диапазоне;

  • выполнение кластеризации k-means с использованием метрик Евклида, Манхэттена, Чебышева и оригинальной гибридной метрики;

  • расчет для каждой из метрик суммы квадратов ошибок;

  • расчет количества итераций для каждой из метрик, понадобившихся для проведения кластеризации;

  • расчет количества различий в принадлежности объектов к кластерам при любых сочетаниях метрик.

  • экспорт полученных данных в формат Excel.

Рисунок 3.6 – Пункт меню для автоматизации вычислительных экспериментов

3.2.3 Планирование и запуск вычислительных экспериментов

Форма автоматизации вычислений состоит из следующих частей (рисунок 3.7):

  • группа элементов управления «настройки автоматизации вычислений», предназначенных для задания условий кластеризации с изменяющимися параметрами (левая верхняя часть формы);

  • группа элементов управления «настройки автоматизации вычислений», предназначенных для задания места хранения результатов вычислительных экспериментов (правая верхняя часть формы);

  • таблица «результаты вычислений» предназначенная для отображения результатов вычислительных экспериментов.

Рисунок 3.7 – Внешний вид формы для автоматизации вычислительных экспериментов

Для запуска вычислительных экспериментов по применению различных метрик сначала необходимо задать диапазон изменения характеристик алгоритма k-means, а также шаг изменения характеристик, а именно:

  • минимальное и максимальное количество записей в исходной выборке данных, а также шаг их изменения;

  • минимальное и максимальное количество атрибутов записей, а также шаг их изменения;

  • минимальное и максимальное количество кластеров, а также шаг их изменения.

Эти параметры задаются с помощью группы элементов управления «настройки автоматизации вычислений». Для их подтверждения необходимо нажать на кнопку «Принять настройки». После этого установленные значения параметров отобразятся в первых четырех столбцах в таблицы «Результаты вычислений».

После планирования экспериментов возможен запуск процесса вычислений. Для этого необходимо нажать на кнопку «Запуск вычислений». В процессе выполнения вычислительных экспериментов будет происходить постепенное заполнение таблицы «Результаты вычислений» полученными значениями (рисунок 3.8).

Рисунок 3.8 – Планирование эксперимента

После выполнения вычислительных экспериментов, полученные данные можно сохранить в формате Excel. Для этого предусмотрена группа элементов управления «Сохранение результатов». В формате Excelпротокол вычислительных экспериментов выглядит следящим образом (рисунок 3.9).

Рисунок 3.9 – Сохранение рассчитанных данных в формате Excel