Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Глава 11-12 (ЛМВ) а.doc
Скачиваний:
3
Добавлен:
16.08.2019
Размер:
2.2 Mб
Скачать

11.2. Сегментирование конечного потребителя услуг кинотеатра с использованием кластерного анализа в системе statistica Игрунова о.М., Чекрышова и.И., Манакова е.В.

Конкурентоспособность большинства торгово-развлекательных комп­лек­сов (далее – ТРК) зависит от рекламной кампании, а успешность кампа­нии, в свою очередь, зависит от концептуальности ТРК и правильно выбран­ной це­ле­вой аудитории. Особое внимание к сфере услуг и развлечений обус­лов­лено динамичным развитием данной сферы и недо­статочной пред­став­ленностью на рынке Зеленограда услуг торгово-развлекательного характера, соответству­ю­щих по ценам и ассортиментному спросу населения данного региона. Кроме того, необходимо отметить, что в последние 5 лет наблю­да­ет­ся тенденция к уве­личению в семейных бюджетах процента расходов на сферу ус­луг (до 23,5% в 2005 году, см.: http://www.gks.ru/free_doc/2006/b06_11/07-15.htm). По оцен­кам специалис­тов, эта динамика сохранится в ближайшее время.

В 2001 году властями города Москвы была утверждена программа создания городской сети семейных спортивно-досуговых центров (ССДЦ), см.: Поста­новление Правительства Москвы от 25 декабря 2001 г. № 1195 – согласно этой программе, предполагалось открыть за счет инвесторов 20 комплексов, вклю­чающих роллеродромы, бильярдные залы, боулинги, дискотеки и т. п. При под­готовке данной программы основная цель была в том, чтобы в Москве появились доступные для широкого круга населения центры досуга, ориентированные на отдых и развлечения родителей с деть­ми, способные активно противостоять антисоциальному поведению молоде­жи, отвлекать молодых от него.

Основная цель данного исследования – демонстрация использования системы STATISTICA и метода кластерного анализа при принятии решения о выборе целевой аудитории для ТРК – в частности, целевой аудитории потребителей услуг кинотеатра.

Суть метода кластерного анализа заключается в разбиении совокуп­ности объектов исследования на группы с однородными характеристи­ками.

Проведение кластерного анализа в системе STATISTICA сводится к ряду последовательных шагов:

  1. отбор массива данных для кластеризации;

  2. определение критериев, по которым будут оцениваться объекты выборки;

  3. кодировка данных;

  4. проведение иерархического агломеративного кластерного метода группи­ровки схожих объектов:

          1. выбор мер сходства (расстояние) между объектами,

          2. выбор метода группировки объектов,

          3. проведение кластеризации,

          4. определение числа кластеров;

  5. проведение итеративного метода группировки с использованием метода k-средних для кластеризации всей совокупности объектов;

  6. интерпретация полученных сегментов.

Для проведения исследования методом опроса жителей Зеленоград­ского АО была собрана первичная информация. Было опрошено 400 респон­дентов мето­дом случайного отбора.

Результаты опроса внесены в исходную таблицу программы STATISTICA.

В качестве основных признаков (переменных), характеризующих отно­шения и предпочтения жителей региона к исследуемым услугам, были выбраны следующие: мнение жителей региона о необходимости строитель­ства нового кинотеатра на территории города; гендерные характеристики респондентов (пол); возрастной состав опрашиваемых; семейное положение; уровень образования; ежемесячный уровень дохода на одного человека в семье; наличие детей дошколь­ного и школьного возраста в семье.

Числовые значения переменных в исходной таблице имеют качест­венный характер (то есть не отражают упорядоченности значений пере­менной). Таким образом, таблица исходных данных соответствует одному типу переменных – и это удовлетворяет требованиям кластеризации.

В ходе интервьюирования респондентам предлагались вопросы с вари­антами ответов, закодированными для возможности и удобства их обра­ботки. Посредством кодирования данные переводят в цифровые символы, распределяя их по категориям.

Переменные закодированы и приведены к единой шкале следующим образом:

  1. Отношение респондентов к необходимости строительства кинотеатра на территории Зеленограда (1 – нет необходимости, 4 – мне все равно, 7 – есть необходимость).

  2. Пол респондента:

  • женский (1);

  • мужской (7).

  1. Возраст:

  • 18–24 (1);

  • 25–34 (2);

  • 35–44 (3);

  • 45–54 (5);

  • 55–65 (6);

  • старше 65 лет (7).

  1. Уровень образования респондентов:

  • незаконченное среднее образование (1);

  • среднее общее образование (2);

  • среднее профессиональное образование (3);

  • незаконченное высшее образование (4);

  • высшее профессиональное образование (5);

  • два и более высших образования (6);

  • наличие научной степени (7).

  1. Уровень дохода на одного человека в семье респондента:

  • до 3 тыс. руб. (1);

  • 3–5 тыс. руб. (2);

  • 5–7 тыс. руб. (3);

  • 7–10 тыс. руб. (4);

  • 10–20 тыс. руб. (5);

  • 20–30 тыс. руб. (6);

  • свыше 30 тыс. руб. (7).

  1. Семейное положение респондента:

  • холост/не замужем (1);

  • женат/замужем (7).

  1. Наличие детей в семье респондента:

  • нет (1);

  • есть (7).

Перейдем к этапу проведения кластерного анализа иерархическим агломе­ративным методом, который состоит в последовательном объеди­не­нии систем самых близких элементов, а затем и целых групп все более и более отдаленных друг от друга элементов.

Кластеризация проводится методом группировки Уорда, который по­стро­ен таким образом, чтобы оптимизировать минимальную дисперсию внут­ри кластеров. По этому методу объединяют те группы объектов, для ко­то­рых среднеквадра­тическое отклонение получает минимальное прираще­ние.

В результате кластеризации получаем дендрограмму (древовидную диаграмму), которая графически изображает иерархическую структуру, полу­чен­ную матрицей сходства и правилом объединения объектов в клас­теры. По оси абсцисс отложены объекты (респонденты) с порядковым номером анкеты. На оси ординат представлен коэффициент слияния (евкли­довы расстояния).

Рис. 11. 4. Дендрограмма результатов кластеризации с использованием метода Уорда (Linkage Distance – коэффициент слияния, Ward’s method (Euclidean distances) – метод Уорда (Евклидовы расстояния))

Древовидная структура дендрограммы указывает на то, что в данных нахо­дится много различных групп и правомерен вопрос: где нужно «обрезать» дерево, чтобы получить оптимальное число групп.

Для этого необходимо просмотреть коэффициенты слияния, которые нахо­дятся на оси ординат, и найти значимые «скачки». Большой скачок в коэф­фициенте слияния свидетельствует о том, что объединяются доста­точно несхо­жие кластеры. В данном случае наблюдаем на первом уровне вариант решения из 4 кластеров (с коэффициентом слияния 25). Этот уро­вень определяет, что в со­во­купности действительно есть некая дифферен­циация по признакам и структура.

Дальнейшее дробление дает худший результат, так как ведет к выде­лению множества мелких кластеров, что уже не соответствует целям сегментирования.

Группировка всей совокупности проводится итеративным методом k-сред­них (по принципу ближайшего центра), который заключается в пере­ме­ще­нии объектов в кластер с ближайшим «центром тяжести».

Этот метод состоит из следующих шагов.

  1. Исходное разбиение данных на некоторое заданное число кластеров – при этом вычисляют «центры тяжести» полученных кластеров.

  2. Каждые точки данных помещают в кластер с ближайшим «центром тяжести».

  3. Вычисляют новые центры тяжести кластеров: кластеры не заменяют на новые до тех пор, пока все данные не будут просмотрены полностью.

  4. Шаги 2 и 3 повторяют до тех пор, пока не перестанут меняться кластеры.

Окончательное решение получено после двух итераций (подборов). Линейный график значений переменных для каждого кластера представлен на рисунке 11.5.

Рис. 11.5. Линейный график средних значений переменных для каждого кластера (на оси ординат указаны средние оценки переменных по каждому кластеру)

На данном графике изображены профили требований четырех типичных групп респондентов относительно строительства кинотеатра. Расстояния между кластерами представлены в таблице 11.3.

Таблица 11.3

Евклидовы расстояния между кластерами

№ 1

№ 2

№ 3

№ 4

№ 1

0,000000

2,658532

5,817604

7,22252

№ 2

1,630500

0,000000

7,746346

13,49817

№ 3

2,411971

2,783226

0,000000

10,84207

№ 4

2,687474

3,673986

3,292730

0,00000

Как можно видеть из приведенной таблицы (в которой указаны квадра­ты расстояний между кластерами), наибольшее расстояние между 2 и 4 клас­те­ром (3,67), а наименьшее между 1 и 2 (1,63), то есть респонденты, входящие в эти кластеры (в 1-й и 2-й), предъявляют наиболее схожие требования – и у них наблюдаются схожие характеристики.

Средние значения переменных для каждого кластера представлены в таблице 11.4.

Таблица 11.4

Средние значения переменных для каждого кластера

Cluster 1

Cluster 2

Cluster 3

Cluster 4

Необходимость кинотеатра

5,600000

6,850000

4,580645

5,588235

Пол

1,000000

1,000000

7,000000

3,294118

Возраст

1,666667

1,050000

1,838710

3,117647

Семейное положение

1,800000

1,000000

1,580645

7,000000

Образование

2,400000

5,800000

2,903226

2,588235

Доход

2,133333

1,450000

3,290323

2,470588

Дети

3,000000

1,000000

1,580645

7,000000

В итоге было выделено четыре кластера со схожими потребительскими предпочтениями.

Кластер 1 (15% выборки).

Незамужние женщины (заинтересованные).

Представители данного кластера в целом заинтересованы в строитель­стве на территории Зеленограда нового кинотеатра.

В эту группу вошли женщины в возрасте от 18 до 44 лет, в основном незамужние, со средним уровнем дохода на одного человека в семье до 10 тыс. руб. Уровень образования представителей данного сегмента – в основном, среднее профессиональное и высшее профессиональное; и у двух третей представителей данного сегмента есть дети дошкольного и школьного возраста.

Кластер 2 (20%).

Молодые незамужние женщины с незаконченным высшим образовани­ем (наи­более заинтересованные).

В эту группу вошли молодые женщины в возрасте от 18 до 25 лет, не со­стоящие в браке (100% данного кластера), с уровнем образования не ниже незаконченного высшего. Детей у представительниц данного сегмента нет, а средний уровень дохода на одного человека в семье составляет, в основ­ном, до 5 тыс. руб.

Практически все представители данного кластера заинтересованы в строи­тельстве нового кинотеатра на территории исследуемого региона.

Кластер 3 (31%).

Молодые неженатые мужчины (наименее заинтересованные).

Представители данного кластера – это мужчины в возрасте от 18 до 34 лет, неженатые, в основном со средним профессиональным и высшим профес­сио­нальным образованиями. В данный кластер в равной степени вошли пред­ста­вители различных доходных групп – до 30 тыс. руб. на чело­века в семье.

Более чем у 90% мужчин кластера 3 нет детей дошкольного и школь­ного возраста.

Респонденты, вошедшие в этот кластер, в недостаточной степени заин­те­ресованы в строительстве кинотеатра: для 55% строительство кинотеатра необ­ходимо, для 36% – нет, 9% – затруднились ответить.

Кластер 4 (34%).

Семейные люди с детьми (заинтересованные).

Представители кластера 4 в целом заинтересованы в строительстве нового кинотеатра на территории города.

В этот кластер вошли 62% женщин и 38% мужчин в возрасте от 25 до 54 лет. Уровень образования людей, вошедших в кластер 4, – в основном, высшее профессиональное, уровень дохода – до 20 тыс. руб. на одного человека в семье.

Таким образом, выделены три целевые аудитории, на которые должны быть направлены маркетинговые мероприятия по продвижению услуг кинотеатра. Вышеприведенные результаты, в частности, легли в основу разработки проекта создания и строительства торгово-развлекательного комплекса на территории Зеленоградского АО.

Приведенные результаты сегментирования с использованием кластер­ного анализа предоставляют компаниям возможность определить круг целе­вых потребителей, их характеристики, глубже понять их пред­почтения. Это, в свою очередь, позволит свести к минимуму разницу между представ­лениями про­давцов и покупателей о товаре или услуге.

Что касается программных инструментов обработки результатов, то ав­торы данной статьи могут рекомендовать пакеты программ STATISTICA и SPSS. Несмотря на кажущееся сходство их пользовательского интерфейса и пред­ставления данных с программным пакетом MS Excel, эти программы позволяют обрабатывать информацию быстрее и эффективнее, поскольку аналитик эконо­мит время на дополнительной обработке данных. Кроме того, в програм­ме STATISTICA реализованы методы анализа, недоступные в па­ке­те MS Excel. Наиболее трудоемкая работа при проведении кластерного анализа в систе­ме STATISTICA – это ввод данных, причем в соответствии с определенной шкалой, что исключительно важно при проведении клас­тер­ного анализа. Время, затраченное на ввод данных с исполнением всех соот­ветствующих процедур, полностью оправдывает себя на этапе обработки и анализа результатов исследования, поскольку результаты работы программы STATISTICA прак­тически не нуждаются в дополни­тельном изменении, в отличие от ре­зультатов, полученных при исполь­зовании MS Excel.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]