- •Інформаційні системи та технології в управлінні методичні вказівки
- •1 Введення до систем підтримки прийняття рішень 4
- •2 Бізнес - прогнозування 25
- •3 Кластерний аналіз в бізнес-аналітиці 43
- •4 Вирішення задач класифікації
- •5 Література 120
- •1 Введение в Системы Поддержки Принятия Решений (сппр)
- •1.1 Определение сппр
- •1.2 Классификация сппр
- •1.3 Архитектура сппр
- •1.4 Анализ данных – основные принципы
- •1.5 Базовые методы анализа
- •1) Online Analytical Processing
- •2) Knowledge Discovery in Databases
- •3) Data Mining
- •1.6 Примеры задач, где применяются методы Data Mining
- •1.7 Программа Deductor – платформа для создания сппр
- •1.8 Контрольные вопросы
- •2 Корреляционный анализ
- •2.1 Теоретические сведения
- •2.3 Задание для самостоятельной работы
- •2.4. Контрольные вопросы
- •3 Бизнес - Прогнозирование
- •3.1 Теоретические сведения
- •3.2 Компьютерные пакеты для решения задач прогнозирования
- •3.3 Временные ряды
- •3.3.1 "Наивные" модели прогнозирования
- •3.3.2 Средние и скользящие средние
- •3.3.3 Моделирование временного ряда
- •Ar(p) -авторегрессионая модель порядка p. Модель имеет вид:
- •3.3.4 Нейросетевые модели прогнозирования
- •3.3.6 Предобработка данных
- •3.4 Пример прогнозирования с помощью линейной регрессии
- •3.4.1 Импорт данных из файла
- •3.4.2 Настройка параметров столбцов
- •3.4.3 Расчет автокорреляции столбцов
- •3.4.4 Удаление аномалий
- •3.4.5 Сглаживание данных – удаление шумов
- •3.4.6 Преобразование данных к скользящему окну
- •3.4.7 Прогнозирование с помощью линейной регрессии
- •3.5 Прогнозирование с помощью нейронных сетей
- •3.5.1 Исходные данные
- •3.5.2 Удаление аномалий и сглаживание
- •3.5.3 Обучение нейросети (прогноз на 1 месяц вперед)
- •3.5.4 Построение прогноза
- •3.5.5 Результат
- •3.5.6 Выводы
- •3.6 Задание к лабораторной работе
- •3.7 Контрольные вопросы
- •4 Кластерный анализ в бизнес-аналитике
- •4.1. Теоретические основы
- •4.2 Меры близости в алгоритмах кластеризации
- •4.3 Алгоритмы кластеризации
- •4.4 Решение типовой задачи кластеризации в Deductor
- •4.4.1 Кластеризация
- •4.4.2 Выводы
- •4.6 Задания для самостоятельной работы
- •4.7 Контрольные вопросы
- •5 Методы решения задач классификации
- •5.1 Опис процесу класифікації
- •5.2 Оцінка якості моделі класифікації
- •5.3 Скоринговые модели для оценки кредитоспособности заемщиков – пример задачи классификации на основе логистической регрессии
- •5.3.1 Постановка задачи
- •5.3.2 Скоринговая карта на основе логистической регрессии
- •5.3.3 Построение модели в системе Deductor.
- •5.4 Классификация на основе дерева решений
- •5.4.1 Процесс конструирования дерева решений
- •5.4.2 Скоринговая модель на основе дерева решений
- •5.3.4 Интерактивное дерево решений
- •5. Задания к лабораторной работе
- •5.5 Контрольные вопросы
- •5 Литература
3.5 Прогнозирование с помощью нейронных сетей
Прогнозирование результата на определенное время вперед, основываясь на данных за прошедшее время, – задача, встречающаяся довольно часто. К примеру, перед большинством торговых фирм стоит задача оптимизации складских запасов, для решения которой требуется знать, что и сколько должно быть продано через неделю и т.п., задача предсказания стоимости акций какого-нибудь предприятия через день и т.д. и другие подобные вопросы. Deductor Studio предлагает для этого инструмент "Прогнозирование".
Прогнозирование появляется в списке Мастера обработки только после построения какой-либо модели прогноза: нейросети, линейной регрессии и т.д. Прогнозировать на несколько шагов вперед имеет смысл только временной ряд (к примеру, если есть данные по недельным суммам продаж за определенный период, можно спрогнозировать сумму продаж на две недели вперед). Поскольку при построении модели прогноза необходимо учитывать много факторов (зависимость результата от данных день, два, три, четыре назад), то методика имеет свои особенности. Покажем ее на примере.
Рисунок 3.18 – Сценарий прогнозирования нейронными сетями
3.5.1 Исходные данные
У аналитика имеются данные о помесячном количестве проданного товара за несколько лет. Ему необходимо, основываясь на этих данных, определить, какое Количество товара будет продано через месяц и через два.
Исходные данные по продажам находятся в файле "Trade.txt", известному по предыдущему примеру. Выполним импорт данных из файла, не забыв указать в Мастере, чтобы в качестве разделителя дробной и целой частей была точка, а не запятая.
3.5.2 Удаление аномалий и сглаживание
После импорта данных воспользуемся диаграммой для их просмотра. Как и в предыдущем пункте, перед прогнозированием необходимо удалить аномалии и сгладить данные. Сделаем это при помощи парциальной обработки как описано выше. Видно, что данные сгладились, аномалии и шумы исчезли. Также видна тенденция.
Теперь необходимо трансформировать данные к скользящему окну. Выбраем глубину погружения 12. Теперь в качестве входных факторов можно использовать "Количество-12", "Количество-11" - данные по количеству 12 и 11 месяцев назад (относительно прогнозируемого месяца), а также "Количество-2" и "Количество-1" - данные за 2 предыдущих месяца. В качестве выходного поля укажем столбец "Количество".
3.5.3 Обучение нейросети (прогноз на 1 месяц вперед)
Перейдем непосредственно к самому построению модели прогноза. Откроем Мастер обработки и выберем в нем нейронную сеть. На втором шаге Мастера согласно с принятым ранее решением установим в качестве входных поля "Количество - 12", "Количество - 11", "Количество - 2" и "Количество - 1", а в качестве выходного - "Количество". Остальные поля сделаем информационными.
На следующем шаге укажем разбиение тестового и обучающего множеств. Перейдем к следующему шагу, на котором отметим необходимое количество слоев и нейронов в нейросети (рис. 3.19).
Перейдя далее, выберем алгоритм обучения нейросети - RPROP.
После построения модели для просмотра качества обучения представим полученные данные в виде диаграммы и диаграммы рассеяния.
Рисунок 3.19 – Задание структуры нейронной сети
В Мастере настройки диаграммы выберем для отображения поля "Количество" и "Количество_OUT" - реальное и спрогнозированное значение. Результатом будет два графика (рис. 3.20).
Рисунок 3.20 – Исходный и аппроксимированный нейросетью графики объемов продаж