Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
14.docx
Скачиваний:
62
Добавлен:
20.02.2016
Размер:
31.64 Кб
Скачать

Тема 14. Кластерный анализ

  1. СУЩНОСТЬ КЛАСТЕРНОГО АНАЛИЗА

  2. СТАТИСТИКИ, СВЯЗАННЫЕ С КЛАСТЕРНЫМ АНАЛИЗОМ

  3. Этапы выполнения кластерного анализа.

  4. Формулировка проблемы. Выбор способа измерения расстояния или меры сходства.

  5. Выбор метода кластеризации

  6. Принятие решения о количестве кластеров. Интерпретация и профилирование кластеров.

  7. КЛАСТЕРИЗАЦИЯ ПЕРЕМЕННЫХ

  1. Сущность кластерного анализа

Кластерный анализ представляет собой класс методов, используемых для классификации объектов или событий в относительно однородные группы, которые называют мастерами (clusters). Объекты в каждом кластере должны быть похожи между собой и отличаться от объектов в других кластерах.

Кластерный анализ используют в маркетинге для различных целей.

Сегментация рынка. Например, потребителей можно разбить на кластеры на основе выгод, которые они ожидают получить от покупки данного товара. Каждый кластер может состоять из потребителей, которые ищут схожие выгоды. Этот метод называют сегментаций преимуществ (benefit segmentation).

Понимание поведения покупателей. Кластерный анализ используется для идентификации однородных групп покупателей. Кластерный анализ также использовали, чтобы определить виды стратегий, применяемых покупателями автомобилей для получения внешней информации.

Определение возможностей нового товара. Кластеризацией торговых марок и товаров можно определить конкурентоспособные наборы в пределах данного рынка. Торговые марки в одном и том же кластере конкурируют более жестко между собой, чем с марками других кластеров. Фирма может изучить свои текущие предложения в сравнении с предложениями своих конкурентов, чтобы определить потенциальные возможности новых товаров.

Выбор тестовых рынков. Группировкой городов в однородные кластеры можно подобрать сравнимые города для проверки различных маркетинговых стратегий,

Сокращение размерности данных. Кластерный анализ можно использовать как основной инструмент сокращения размерности данных при создании кластеров или подгрупп данных, более удобных для анализа, чем отдельные наблюдения. Последующий многомерный анализ выполняют над кластерами, а не над отдельными наблюдениями. Например, чтобы описать отличия в поведении потребителей по отношению к товарам, их вначале разбивают на группы. Затем различия между группами проверяют с помощью множественного дискриминантного анализа.

  1. Статистики, связанные с кластерным анализом

Следующие статистики и понятия связаны с кластерным анализом:

  • План агломерации, объединения (agglomeration schedule). Дает информацию об объектах (событиях, случаях), которые должны быть объединены на каждой стадии процесса иерархической кластеризации.

  • Кластерный центроид (cluster centroid). Среднее значение переменных для всех случаев или объектов в конкретном кластере,

  • Кластерные центры (cluster centers). Исходные начальные точки в неиерархической кластеризации. Кластеры строят вокруг этих центров, или зерен кластеризации.

  • Принадлежность кластеру (cluster membership). Указывает кластер, которому принадлежит каждый случай или объект.

  • Древовидная диаграмма (дендрограмма) (dendrogram). Ее также называют древовидный граф— графическое средство для показа результатов кластеризации. Вертикальные линии представляют объединяемые кластеры. Положение вертикальной линии на шкале расстояния (горизонтальная ось) показывает расстояния, при которых объединяли кластеры. Древовидную диаграмму читают слева направо.c.761 рис.20.8

  • Расстояния между кластерными центрами (distances between cluster centres). Указывают, насколько разнесены отдельные пары кластеров, Кластеры, которые разнесены широко, ясно выражены и поэтому желательны.

  • Сосульчатая диаграмма (icicle diagram), Это графическое отображение результатов кластеризации. Она названа так потому, что имеет сходство с рядом сосулек, свисающих с крыши дома.

  • Матрица сходства/матрица расстояний между объединяемыми объектами (similarity/distance coefficient matrix). Матрица сходства (расстояний) — это нижняя треугольная матрица, содержащая значения расстояния между парами объектов или случаев.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]