Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
14.docx
Скачиваний:
62
Добавлен:
20.02.2016
Размер:
31.64 Кб
Скачать
  1. Этапы выполнения кластерного анализа.

  1. формулировка проблемы

  2. выбор меры расстояния

  3. выбор метода кластеризации

  4. принятие решения о количестве кластеров

  5. интерпретация и профилирование кластеров

  6. оценка достоверности кластеризации

Первый этап — формулировка проблемы кластеризации путем определения переменных, на базе которых она будет проводиться, Затем выбирается соответствующий способ измерения расстояния. Мера расстояния показывает, насколько объекты, подвергнутые кластеризации, схожи или не схожи между собой. Разработано несколько методов кластеризации, и исследователю необходимо выбрать наиболее подходящий для решения данной проблемы. Решение о числе кластеров также принимает исследователь. Сформированные кластеры нужно анализировать с точки зрения переменных, использованных для их получения, а также для профилирования кластеров можно использовать дополнительные явно выраженные переменные. И наконец, исследователь должен оценить достоверность (качество) процесса кластеризации.

  1. Формулировка проблемы. Выбор способа измерения расстояния или меры сходства

Самая важная часть формулирования проблемы кластеризации — это выбор переменных, на основе которых проводят кластеризацию.

Для иллюстрации сказанного рассмотрим кластеризацию потребителей на основе их отношения к посещению магазинов для покупки товаров. Опираясь на прошлый опыт, маркетологи определили шесть переменных. Потребителей попросили выразить их степень согласия со следующими утверждениями по семибалльной шкале (1 — не согласен, 7 — согласен):

V1- Посещение магазинов для покупки товаров — приятный процесс.

V2- Посещение магазинов для покупки товаров плохо сказывается на вашем бюджете,

V3-Я совмещаю посещение магазинов для покупки товаров с питанием вне дома.

V4-Я стараюсь сделать лучшие покупки при посещении магазинов.

V5-Мне не нравится посещение магазинов для покупки товаров.

VG6-Вы можете сэкономить много денег, сравнивая цены в разных магазинах,

На практике кластеризацию выполняют для значительно больших по размеру выборок, состоящих из 100 и больше респондентов.

Выбор способа измерения расстояния или меры сходства

Цель кластеризация — группирование схожих объектов. Поэтому для того чтобы оценить, насколько они похожи или непохожи, необходимо использовать некую единицу измерения. Наиболее распространенный метод заключается в том, чтобы в качестве такой меры использовать расстояния между двумя объектами. Объекты с меньшими расстояниями между собой больше похожи, чем объекты с большими расстояниями. Существует несколько способов вычисления расстояния между двумя объектами.

Наиболее часто используемая мера сходства— евклидово расстояние или его квадрат.

Евклидово расстояние (геометрическое расстояние в многомерном пространстве) равно квадратному корню из суммы квадратов разностей значений для каждой переменной.

Существуют и другие способы измерения расстояния. Расстояние городских кварталов) (city-block, или манхэттенское расстояние (Manhattan distance) между двумя объектами — это сумма абсолютных разностей в значениях для каждой переменной. Расстояние Чебышева (Chebychev distance) между двумя объектами — это максимальная абсолютная разность в значениях для любой переменной. Для нашего примера используем квадрат евклидова расстояния.

Использование различных способов измерения расстояния ведет к разным результатам кластеризации. Следовательно, целесообразно использовать различные меры сходства и затем сравнить результаты. Выбрав меру сходства, затем можно выбрать метод кластеризации.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]