- •Содержание
- •Введение
- •1 Анализ состояния вопроса
- •2 Разработка методики использования гибридных метрик
- •2.1 Методика применения гибридных метрик
- •2.2 Методы исследования
- •2.3 Результаты экспериментальных исследований
- •3 Практическая реализация
- •3.1 Общая информация о технической реализации
- •3.2 Работа с программой Gibrid k-means
- •3.2.1 Главная форма программы
- •3.2.2 Запуск процесса кластеризации данных
- •3.2.2 Форма автоматизация вычислительных экспериментов
- •3.2.3 Планирование и запуск вычислительных экспериментов
- •Выводы по работе
- •Список литературы
3.2.2 Форма автоматизация вычислительных экспериментов
Для накапливания экспериментальных данных по применению гибридной метрики при кластеризации в различных условиях был разработан специальный модуль по автоматизации вычислений. Чтобы его активировать, необходимо в меню выбрать пункт «Автоматизация вычислений», затем подпункт «Настройка и запуск» (рисунок 3.6).
Данный модуль обладает следующими возможностями:
перебор параметров кластеризации в заданном пользователем диапазоне;
выполнение кластеризации k-means с использованием метрик Евклида, Манхэттена, Чебышева и оригинальной гибридной метрики;
расчет для каждой из метрик суммы квадратов ошибок;
расчет количества итераций для каждой из метрик, понадобившихся для проведения кластеризации;
расчет количества различий в принадлежности объектов к кластерам при любых сочетаниях метрик.
экспорт полученных данных в формат Excel.
Рисунок 3.6 – Пункт меню для автоматизации вычислительных экспериментов
3.2.3 Планирование и запуск вычислительных экспериментов
Форма автоматизации вычислений состоит из следующих частей (рисунок 3.7):
группа элементов управления «настройки автоматизации вычислений», предназначенных для задания условий кластеризации с изменяющимися параметрами (левая верхняя часть формы);
группа элементов управления «настройки автоматизации вычислений», предназначенных для задания места хранения результатов вычислительных экспериментов (правая верхняя часть формы);
таблица «результаты вычислений» предназначенная для отображения результатов вычислительных экспериментов.
Рисунок 3.7 – Внешний вид формы для автоматизации вычислительных экспериментов
Для запуска вычислительных экспериментов по применению различных метрик сначала необходимо задать диапазон изменения характеристик алгоритма k-means, а также шаг изменения характеристик, а именно:
минимальное и максимальное количество записей в исходной выборке данных, а также шаг их изменения;
минимальное и максимальное количество атрибутов записей, а также шаг их изменения;
минимальное и максимальное количество кластеров, а также шаг их изменения.
Эти параметры задаются с помощью группы элементов управления «настройки автоматизации вычислений». Для их подтверждения необходимо нажать на кнопку «Принять настройки». После этого установленные значения параметров отобразятся в первых четырех столбцах в таблицы «Результаты вычислений».
После планирования экспериментов возможен запуск процесса вычислений. Для этого необходимо нажать на кнопку «Запуск вычислений». В процессе выполнения вычислительных экспериментов будет происходить постепенное заполнение таблицы «Результаты вычислений» полученными значениями (рисунок 3.8).
Рисунок 3.8 – Планирование эксперимента
После выполнения вычислительных экспериментов, полученные данные можно сохранить в формате Excel. Для этого предусмотрена группа элементов управления «Сохранение результатов». В формате Excelпротокол вычислительных экспериментов выглядит следящим образом (рисунок 3.9).
Рисунок 3.9 – Сохранение рассчитанных данных в формате Excel