- •Глава 11. Маркетинговые исследования с использованием статистических методов
- •11.1. Прогнозирование объема продаж с использованием корреляционно-регрессионного анализа в системе statistica
- •11.2. Сегментирование конечного потребителя услуг кинотеатра с использованием кластерного анализа в системе statistica Игрунова о.М., Чекрышова и.И., Манакова е.В.
- •11.3. Исследование вкусовых предпочтений потребителей шоколада с использованием методов шкалирования Игрунова о.М., Виноградова и.Ю., Лаврентьева е.В.
- •Результаты «слепого» тестирования образца №1 по критериям «внешний вид» и «запах» (бренд Alpen Gold молочный)
- •11.4. Прогнозирование тенденций изменения спроса на потребительском рынке с использованием нейросетевого подхода Игрунова о.М.
- •Глава 12. Приложения моделей и методов статистического анализа в социально-экономической среде Платонова и.В., Соловьева ю.В., Иванова а.А.
- •12.1. Выбор зарубежного партнера с использованием многомерного регрессионного анализа
- •Коэффициенты модели
- •95% Доверительные границы
- •12.2. Выбор иностранного контрагента с использованием нелинейных моделей регрессионного анализа
- •95% Доверительные границы
- •95% Доверительные границы
- •95% Доверительные границы
- •95% Доверительные границы
- •12.3. Применение кластерного анализа для классификации потребителей снековой продукции
11.2. Сегментирование конечного потребителя услуг кинотеатра с использованием кластерного анализа в системе statistica Игрунова о.М., Чекрышова и.И., Манакова е.В.
Конкурентоспособность большинства торгово-развлекательных комплексов (далее – ТРК) зависит от рекламной кампании, а успешность кампании, в свою очередь, зависит от концептуальности ТРК и правильно выбранной целевой аудитории. Особое внимание к сфере услуг и развлечений обусловлено динамичным развитием данной сферы и недостаточной представленностью на рынке Зеленограда услуг торгово-развлекательного характера, соответствующих по ценам и ассортиментному спросу населения данного региона. Кроме того, необходимо отметить, что в последние 5 лет наблюдается тенденция к увеличению в семейных бюджетах процента расходов на сферу услуг (до 23,5% в 2005 году, см.: http://www.gks.ru/free_doc/2006/b06_11/07-15.htm). По оценкам специалистов, эта динамика сохранится в ближайшее время.
В 2001 году властями города Москвы была утверждена программа создания городской сети семейных спортивно-досуговых центров (ССДЦ), см.: Постановление Правительства Москвы от 25 декабря 2001 г. № 1195 – согласно этой программе, предполагалось открыть за счет инвесторов 20 комплексов, включающих роллеродромы, бильярдные залы, боулинги, дискотеки и т. п. При подготовке данной программы основная цель была в том, чтобы в Москве появились доступные для широкого круга населения центры досуга, ориентированные на отдых и развлечения родителей с детьми, способные активно противостоять антисоциальному поведению молодежи, отвлекать молодых от него.
Основная цель данного исследования – демонстрация использования системы STATISTICA и метода кластерного анализа при принятии решения о выборе целевой аудитории для ТРК – в частности, целевой аудитории потребителей услуг кинотеатра.
Суть метода кластерного анализа заключается в разбиении совокупности объектов исследования на группы с однородными характеристиками.
Проведение кластерного анализа в системе STATISTICA сводится к ряду последовательных шагов:
отбор массива данных для кластеризации;
определение критериев, по которым будут оцениваться объекты выборки;
кодировка данных;
проведение иерархического агломеративного кластерного метода группировки схожих объектов:
выбор мер сходства (расстояние) между объектами,
выбор метода группировки объектов,
проведение кластеризации,
определение числа кластеров;
проведение итеративного метода группировки с использованием метода k-средних для кластеризации всей совокупности объектов;
интерпретация полученных сегментов.
Для проведения исследования методом опроса жителей Зеленоградского АО была собрана первичная информация. Было опрошено 400 респондентов методом случайного отбора.
Результаты опроса внесены в исходную таблицу программы STATISTICA.
В качестве основных признаков (переменных), характеризующих отношения и предпочтения жителей региона к исследуемым услугам, были выбраны следующие: мнение жителей региона о необходимости строительства нового кинотеатра на территории города; гендерные характеристики респондентов (пол); возрастной состав опрашиваемых; семейное положение; уровень образования; ежемесячный уровень дохода на одного человека в семье; наличие детей дошкольного и школьного возраста в семье.
Числовые значения переменных в исходной таблице имеют качественный характер (то есть не отражают упорядоченности значений переменной). Таким образом, таблица исходных данных соответствует одному типу переменных – и это удовлетворяет требованиям кластеризации.
В ходе интервьюирования респондентам предлагались вопросы с вариантами ответов, закодированными для возможности и удобства их обработки. Посредством кодирования данные переводят в цифровые символы, распределяя их по категориям.
Переменные закодированы и приведены к единой шкале следующим образом:
Отношение респондентов к необходимости строительства кинотеатра на территории Зеленограда (1 – нет необходимости, 4 – мне все равно, 7 – есть необходимость).
Пол респондента:
женский (1);
мужской (7).
Возраст:
18–24 (1);
25–34 (2);
35–44 (3);
45–54 (5);
55–65 (6);
старше 65 лет (7).
Уровень образования респондентов:
незаконченное среднее образование (1);
среднее общее образование (2);
среднее профессиональное образование (3);
незаконченное высшее образование (4);
высшее профессиональное образование (5);
два и более высших образования (6);
наличие научной степени (7).
Уровень дохода на одного человека в семье респондента:
до 3 тыс. руб. (1);
3–5 тыс. руб. (2);
5–7 тыс. руб. (3);
7–10 тыс. руб. (4);
10–20 тыс. руб. (5);
20–30 тыс. руб. (6);
свыше 30 тыс. руб. (7).
Семейное положение респондента:
холост/не замужем (1);
женат/замужем (7).
Наличие детей в семье респондента:
нет (1);
есть (7).
Перейдем к этапу проведения кластерного анализа иерархическим агломеративным методом, который состоит в последовательном объединении систем самых близких элементов, а затем и целых групп все более и более отдаленных друг от друга элементов.
Кластеризация проводится методом группировки Уорда, который построен таким образом, чтобы оптимизировать минимальную дисперсию внутри кластеров. По этому методу объединяют те группы объектов, для которых среднеквадратическое отклонение получает минимальное приращение.
В результате кластеризации получаем дендрограмму (древовидную диаграмму), которая графически изображает иерархическую структуру, полученную матрицей сходства и правилом объединения объектов в кластеры. По оси абсцисс отложены объекты (респонденты) с порядковым номером анкеты. На оси ординат представлен коэффициент слияния (евклидовы расстояния).
Рис. 11. 4. Дендрограмма результатов кластеризации с использованием метода Уорда (Linkage Distance – коэффициент слияния, Ward’s method (Euclidean distances) – метод Уорда (Евклидовы расстояния))
Древовидная структура дендрограммы указывает на то, что в данных находится много различных групп и правомерен вопрос: где нужно «обрезать» дерево, чтобы получить оптимальное число групп.
Для этого необходимо просмотреть коэффициенты слияния, которые находятся на оси ординат, и найти значимые «скачки». Большой скачок в коэффициенте слияния свидетельствует о том, что объединяются достаточно несхожие кластеры. В данном случае наблюдаем на первом уровне вариант решения из 4 кластеров (с коэффициентом слияния 25). Этот уровень определяет, что в совокупности действительно есть некая дифференциация по признакам и структура.
Дальнейшее дробление дает худший результат, так как ведет к выделению множества мелких кластеров, что уже не соответствует целям сегментирования.
Группировка всей совокупности проводится итеративным методом k-средних (по принципу ближайшего центра), который заключается в перемещении объектов в кластер с ближайшим «центром тяжести».
Этот метод состоит из следующих шагов.
Исходное разбиение данных на некоторое заданное число кластеров – при этом вычисляют «центры тяжести» полученных кластеров.
Каждые точки данных помещают в кластер с ближайшим «центром тяжести».
Вычисляют новые центры тяжести кластеров: кластеры не заменяют на новые до тех пор, пока все данные не будут просмотрены полностью.
Шаги 2 и 3 повторяют до тех пор, пока не перестанут меняться кластеры.
Окончательное решение получено после двух итераций (подборов). Линейный график значений переменных для каждого кластера представлен на рисунке 11.5.
Рис. 11.5. Линейный график средних значений переменных для каждого кластера (на оси ординат указаны средние оценки переменных по каждому кластеру)
На данном графике изображены профили требований четырех типичных групп респондентов относительно строительства кинотеатра. Расстояния между кластерами представлены в таблице 11.3.
Таблица 11.3
Евклидовы расстояния между кластерами
|
№ 1 |
№ 2 |
№ 3 |
№ 4 |
№ 1 |
0,000000 |
2,658532 |
5,817604 |
7,22252 |
№ 2 |
1,630500 |
0,000000 |
7,746346 |
13,49817 |
№ 3 |
2,411971 |
2,783226 |
0,000000 |
10,84207 |
№ 4 |
2,687474 |
3,673986 |
3,292730 |
0,00000 |
Как можно видеть из приведенной таблицы (в которой указаны квадраты расстояний между кластерами), наибольшее расстояние между 2 и 4 кластером (3,67), а наименьшее между 1 и 2 (1,63), то есть респонденты, входящие в эти кластеры (в 1-й и 2-й), предъявляют наиболее схожие требования – и у них наблюдаются схожие характеристики.
Средние значения переменных для каждого кластера представлены в таблице 11.4.
Таблица 11.4
Средние значения переменных для каждого кластера
|
Cluster 1 |
Cluster 2 |
Cluster 3 |
Cluster 4 |
Необходимость кинотеатра |
5,600000 |
6,850000 |
4,580645 |
5,588235 |
Пол |
1,000000 |
1,000000 |
7,000000 |
3,294118 |
Возраст |
1,666667 |
1,050000 |
1,838710 |
3,117647 |
Семейное положение |
1,800000 |
1,000000 |
1,580645 |
7,000000 |
Образование |
2,400000 |
5,800000 |
2,903226 |
2,588235 |
Доход |
2,133333 |
1,450000 |
3,290323 |
2,470588 |
Дети |
3,000000 |
1,000000 |
1,580645 |
7,000000 |
В итоге было выделено четыре кластера со схожими потребительскими предпочтениями.
Кластер 1 (15% выборки).
Незамужние женщины (заинтересованные).
Представители данного кластера в целом заинтересованы в строительстве на территории Зеленограда нового кинотеатра.
В эту группу вошли женщины в возрасте от 18 до 44 лет, в основном незамужние, со средним уровнем дохода на одного человека в семье до 10 тыс. руб. Уровень образования представителей данного сегмента – в основном, среднее профессиональное и высшее профессиональное; и у двух третей представителей данного сегмента есть дети дошкольного и школьного возраста.
Кластер 2 (20%).
Молодые незамужние женщины с незаконченным высшим образованием (наиболее заинтересованные).
В эту группу вошли молодые женщины в возрасте от 18 до 25 лет, не состоящие в браке (100% данного кластера), с уровнем образования не ниже незаконченного высшего. Детей у представительниц данного сегмента нет, а средний уровень дохода на одного человека в семье составляет, в основном, до 5 тыс. руб.
Практически все представители данного кластера заинтересованы в строительстве нового кинотеатра на территории исследуемого региона.
Кластер 3 (31%).
Молодые неженатые мужчины (наименее заинтересованные).
Представители данного кластера – это мужчины в возрасте от 18 до 34 лет, неженатые, в основном со средним профессиональным и высшим профессиональным образованиями. В данный кластер в равной степени вошли представители различных доходных групп – до 30 тыс. руб. на человека в семье.
Более чем у 90% мужчин кластера 3 нет детей дошкольного и школьного возраста.
Респонденты, вошедшие в этот кластер, в недостаточной степени заинтересованы в строительстве кинотеатра: для 55% строительство кинотеатра необходимо, для 36% – нет, 9% – затруднились ответить.
Кластер 4 (34%).
Семейные люди с детьми (заинтересованные).
Представители кластера 4 в целом заинтересованы в строительстве нового кинотеатра на территории города.
В этот кластер вошли 62% женщин и 38% мужчин в возрасте от 25 до 54 лет. Уровень образования людей, вошедших в кластер 4, – в основном, высшее профессиональное, уровень дохода – до 20 тыс. руб. на одного человека в семье.
Таким образом, выделены три целевые аудитории, на которые должны быть направлены маркетинговые мероприятия по продвижению услуг кинотеатра. Вышеприведенные результаты, в частности, легли в основу разработки проекта создания и строительства торгово-развлекательного комплекса на территории Зеленоградского АО.
Приведенные результаты сегментирования с использованием кластерного анализа предоставляют компаниям возможность определить круг целевых потребителей, их характеристики, глубже понять их предпочтения. Это, в свою очередь, позволит свести к минимуму разницу между представлениями продавцов и покупателей о товаре или услуге.
Что касается программных инструментов обработки результатов, то авторы данной статьи могут рекомендовать пакеты программ STATISTICA и SPSS. Несмотря на кажущееся сходство их пользовательского интерфейса и представления данных с программным пакетом MS Excel, эти программы позволяют обрабатывать информацию быстрее и эффективнее, поскольку аналитик экономит время на дополнительной обработке данных. Кроме того, в программе STATISTICA реализованы методы анализа, недоступные в пакете MS Excel. Наиболее трудоемкая работа при проведении кластерного анализа в системе STATISTICA – это ввод данных, причем в соответствии с определенной шкалой, что исключительно важно при проведении кластерного анализа. Время, затраченное на ввод данных с исполнением всех соответствующих процедур, полностью оправдывает себя на этапе обработки и анализа результатов исследования, поскольку результаты работы программы STATISTICA практически не нуждаются в дополнительном изменении, в отличие от результатов, полученных при использовании MS Excel.