Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

6

.pdf
Скачиваний:
12
Добавлен:
19.01.2023
Размер:
2.29 Mб
Скачать

Рисунок 59 – Карта для признака Возраст

Каждой ячейке на карте назначается цвет, в соответствии со значениями возраста объектов, входящих в нее. Для ячейки, обозначенной кружочком и буквой "Т", значение возраста равно 49 лет. Для кластера,

обозначенного "1", можно визуально определить, что диапазон значений варьируется от 53 до 70. Для кластера "2" значение возраста находится в диапазоне от 19 до 31.

Для более точного определения значения возраста абонентов,

попавших в ячейку или в кластер, воспользуемся фильтрами. Для этого на панели инструментов визуализатора нажмем кнопку вызова статистики

(значок на панели - ). После чего в нижней зоне откроется окно статистики, в котором отображается статистика полей набора данных. На панели инструментов окна статистики можно выбрать способ фильтрации для любого объекта карты. Это позволяет проанализировать полученные результаты кластеризации с помощью статистических показателей (рис. 60).

41

Рисунок 60 – Анализ результатов кластеризации с помощью статистических показателей

Также на основе раскраски карты можно оценивать результаты кластеризации. Если ячейки с примерно одинаковой расцветкой образуют обособленные области, то результаты кластеризации хорошие, и алгоритму удалось выделить схожие объекты. Если же ячейки с разными цветами разбросаны вперемешку, то карта плохая.

Проанализируем полученный результат кластеризации (возьмем последний вариант Карты). Для начала откроем визуализатор Карта Кохонена. Все абоненты разделились на 7 кластеров. Рассмотрим полученные кластера (сегменты).

Кластер № 0. Характеризуется: возрастным диапазоном от 23 до 48 лет; большой суммой денежных расходов на связь; большим количеством звонков совершаемых 24 часа в сутки; малым количеством смс; большим количеством звонков в другие города и страны. Данный сегмент можно назвать "Бизнес-люди".

42

Кластер № 1. Характеризуется: возрастной диапазон преимущественно от 24 до 43 лет; небольшая сумма денежных расходов на связь; большое количество звонков, совершаемых вечером; большое количество смс. Данный сегмент можно условно назвать "Тусовщики".

Кластер № 2. Характеризуется: возрастной диапазон от 30 до 45 лет; небольшая сумма расходов на связь; нет ярко выраженных предпочтений по услугам связи. В этом кластере вручную можно выделить людей совершаемых звонки в другие города. Данный сегмент можно назвать "Работающие люди, неактивные".

Кластер № 3. Характеризуется: возрастной диапазон от 19 до 33 лет; небольшая сумма расходов на связь; нет ярко выраженных предпочтений по услугам связи. В этом кластере есть подкластер людей, делающих звонки в другие города. Данный сегмент можно назвать "Молодежь, неактивная".

Кластер № 4. Характеризуется: возрастной диапазон от 42 до 69 лет; большая сумма расходов на связь; много звонков и мало смс. Данный сегмент можно назвать "Активная группа зрелого и пенсионного возраста".

Кластер № 5. Характеризуется: возрастной диапазон от 40 до 56 лет; мало смс; нет ярко выраженных предпочтений по звонкам. Данный сегмент можно назвать "Группа пред пенсионного возраста, неактивная".

Кластер № 6. Характеризуется: возрастной диапазон от 51 до 70 лет; мало смс; нет ярко выраженных предпочтений по звонкам. Данный сегмент можно назвать - "Группа пенсионного возраста, неактивная".

43

Рисунок 61 – Карта Кохонена

Рассмотрим общую структуру сформированных кластеров в визуализаторе Профили кластеров (рис.62). Самым большим кластером является "Группа пенсионного возраста, неактивная". В наиболее большие по численности кластеры входят люди пенсионного и предпенсионного возраста. Для данных возрастных групп почти не свойственно деление.

Возможно, данные кластера следует проанализировать более подробно.

44

Рисунок 62 – Профили кластеров Оценим, чем отличаются между собой следующие кластеры:

пенсионеры активно пользующихся услугами связи (кластер № 4) от пенсионеров, малоактивно пользующихся услугами связи (кластер № 6). Воспользуемся визуализатором Связи кластеров. Выделим в открывшейся диаграмме кластер №4 и кластер №6, после этого в левой части окна откроется информация по выбранным кластерам (рис.63).

Рисунок 63 – Связи кластеров

45

Определим кластера приносящие наибольшую выручку, для этого откроем отчет Мощность кластеров. Рассчитаем в кубе вычисляемый факт

Средняя выручка на одного абонента, по формуле: Среднемесячный расход кластера, деленный на количество абонентов в кластере. Для этого перенастроим узел Название кластера (рис.64), с первого по четвертый шаг оставим настройки без изменений (рис.65). Настройка пятого шага представлена на рисунке 66.

Рисунок 64 – Определение кластеры, приносящие наибольшую выручку

Рисунок 64 – Настройка набора данных (шаг 1-4)

46

Рисунок 66 – Настройка набора данных (шаг 5)

Из отчета видно, что максимальную выручку приносит кластер "Тусовщиков",

несмотря на то что в него входит мало абонентов (рис. 67). Наибольшая средняя выручка с человека у кластера "Активная группа зрелого и пенсионного возраста".

Рисунок 67 – Результат настройки набора данных

47

В заключение анализа рассмотрим результаты прогона новой анкеты в отчете "Результаты обработки нового абонента". Новый абонент попал в кластер "Молодежь, неактивная". Необходимо мотивировать данного абонента, что бы он перешел в более активный кластер, приносящей компании больше выручки (рис. 68).

Рисунок 68 – Результат анализ прогона нового абонента

Список литературы:

1. Практикум [P.120] Карты Кохонена в Deductor Studio:

https://docplayer.ru/27573133-Praktikum-p-120-karty-kohonena-v-deductor-studio.html

2.Самоорганизующиеся карты Кохонена — математический аппарат: https://basegroup.ru/community/articles/som

3.Справка по программе ПП «Deductor Studio»

48

Соседние файлы в предмете Искусственный интеллект и машинное обучение