6
.pdfРисунок 59 – Карта для признака Возраст
Каждой ячейке на карте назначается цвет, в соответствии со значениями возраста объектов, входящих в нее. Для ячейки, обозначенной кружочком и буквой "Т", значение возраста равно 49 лет. Для кластера,
обозначенного "1", можно визуально определить, что диапазон значений варьируется от 53 до 70. Для кластера "2" значение возраста находится в диапазоне от 19 до 31.
Для более точного определения значения возраста абонентов,
попавших в ячейку или в кластер, воспользуемся фильтрами. Для этого на панели инструментов визуализатора нажмем кнопку вызова статистики
(значок на панели - ). После чего в нижней зоне откроется окно статистики, в котором отображается статистика полей набора данных. На панели инструментов окна статистики можно выбрать способ фильтрации для любого объекта карты. Это позволяет проанализировать полученные результаты кластеризации с помощью статистических показателей (рис. 60).
41
Рисунок 60 – Анализ результатов кластеризации с помощью статистических показателей
Также на основе раскраски карты можно оценивать результаты кластеризации. Если ячейки с примерно одинаковой расцветкой образуют обособленные области, то результаты кластеризации хорошие, и алгоритму удалось выделить схожие объекты. Если же ячейки с разными цветами разбросаны вперемешку, то карта плохая.
Проанализируем полученный результат кластеризации (возьмем последний вариант Карты). Для начала откроем визуализатор Карта Кохонена. Все абоненты разделились на 7 кластеров. Рассмотрим полученные кластера (сегменты).
Кластер № 0. Характеризуется: возрастным диапазоном от 23 до 48 лет; большой суммой денежных расходов на связь; большим количеством звонков совершаемых 24 часа в сутки; малым количеством смс; большим количеством звонков в другие города и страны. Данный сегмент можно назвать "Бизнес-люди".
42
Кластер № 1. Характеризуется: возрастной диапазон преимущественно от 24 до 43 лет; небольшая сумма денежных расходов на связь; большое количество звонков, совершаемых вечером; большое количество смс. Данный сегмент можно условно назвать "Тусовщики".
Кластер № 2. Характеризуется: возрастной диапазон от 30 до 45 лет; небольшая сумма расходов на связь; нет ярко выраженных предпочтений по услугам связи. В этом кластере вручную можно выделить людей совершаемых звонки в другие города. Данный сегмент можно назвать "Работающие люди, неактивные".
Кластер № 3. Характеризуется: возрастной диапазон от 19 до 33 лет; небольшая сумма расходов на связь; нет ярко выраженных предпочтений по услугам связи. В этом кластере есть подкластер людей, делающих звонки в другие города. Данный сегмент можно назвать "Молодежь, неактивная".
Кластер № 4. Характеризуется: возрастной диапазон от 42 до 69 лет; большая сумма расходов на связь; много звонков и мало смс. Данный сегмент можно назвать "Активная группа зрелого и пенсионного возраста".
Кластер № 5. Характеризуется: возрастной диапазон от 40 до 56 лет; мало смс; нет ярко выраженных предпочтений по звонкам. Данный сегмент можно назвать "Группа пред пенсионного возраста, неактивная".
Кластер № 6. Характеризуется: возрастной диапазон от 51 до 70 лет; мало смс; нет ярко выраженных предпочтений по звонкам. Данный сегмент можно назвать - "Группа пенсионного возраста, неактивная".
43
Рисунок 61 – Карта Кохонена
Рассмотрим общую структуру сформированных кластеров в визуализаторе Профили кластеров (рис.62). Самым большим кластером является "Группа пенсионного возраста, неактивная". В наиболее большие по численности кластеры входят люди пенсионного и предпенсионного возраста. Для данных возрастных групп почти не свойственно деление.
Возможно, данные кластера следует проанализировать более подробно.
44
Рисунок 62 – Профили кластеров Оценим, чем отличаются между собой следующие кластеры:
пенсионеры активно пользующихся услугами связи (кластер № 4) от пенсионеров, малоактивно пользующихся услугами связи (кластер № 6). Воспользуемся визуализатором Связи кластеров. Выделим в открывшейся диаграмме кластер №4 и кластер №6, после этого в левой части окна откроется информация по выбранным кластерам (рис.63).
Рисунок 63 – Связи кластеров
45
Определим кластера приносящие наибольшую выручку, для этого откроем отчет Мощность кластеров. Рассчитаем в кубе вычисляемый факт
Средняя выручка на одного абонента, по формуле: Среднемесячный расход кластера, деленный на количество абонентов в кластере. Для этого перенастроим узел Название кластера (рис.64), с первого по четвертый шаг оставим настройки без изменений (рис.65). Настройка пятого шага представлена на рисунке 66.
Рисунок 64 – Определение кластеры, приносящие наибольшую выручку
Рисунок 64 – Настройка набора данных (шаг 1-4)
46
Рисунок 66 – Настройка набора данных (шаг 5)
Из отчета видно, что максимальную выручку приносит кластер "Тусовщиков",
несмотря на то что в него входит мало абонентов (рис. 67). Наибольшая средняя выручка с человека у кластера "Активная группа зрелого и пенсионного возраста".
Рисунок 67 – Результат настройки набора данных
47
В заключение анализа рассмотрим результаты прогона новой анкеты в отчете "Результаты обработки нового абонента". Новый абонент попал в кластер "Молодежь, неактивная". Необходимо мотивировать данного абонента, что бы он перешел в более активный кластер, приносящей компании больше выручки (рис. 68).
Рисунок 68 – Результат анализ прогона нового абонента
Список литературы:
1. Практикум [P.120] Карты Кохонена в Deductor Studio:
https://docplayer.ru/27573133-Praktikum-p-120-karty-kohonena-v-deductor-studio.html
2.Самоорганизующиеся карты Кохонена — математический аппарат: https://basegroup.ru/community/articles/som
3.Справка по программе ПП «Deductor Studio»
48