Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ММвПСИХ_2014.doc
Скачиваний:
38
Добавлен:
14.05.2015
Размер:
2.07 Mб
Скачать

Тема 9. Кластерный анализ

Кластерный анализ ‒ это многомерная статистическая процедура, выполняющая сбор данных, содержащих информацию о выборке объектов, и затем упорядочивающая объекты в сравнительно однородные группы (кластеры).

Результатом решения задачи кластерного анализа является разбиение на группы, удовлетворяющее некоторому критерию оптимальности.

Кластерный анализ содержит следующие этапы:

  1. Определение множества объектов и множества признаков, по которым будут исследоваться данные объекты.

Часто, результаты измерения объектов представляют собой прямоугольную матрицу размера :

Объекты

Признаки

1

2

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

Т.е. происходит исследование объектов попризнакам.

  1. Вычисление значений меры сходства (различия) между объектами. Составление матрица сходства (различия).

Наиболее известной и естественной с геометрической точки зрения мерой расстояния (сходства) является евклидово расстояние в пространстве признаков:

,

где и‒ номера объектов, между которыми вычисляется расстояние.

Результатом вычисления меры близости объектов исследуемого множества является матрица сходства:

Объекты

Объекты

1

2

3

1

0

2

0

0

...

0

Заметим, что расстояние между объектом и самим собой равно нулю, поэтому на главной диагонали матрицы сходства стоят нули, а расстояние между 1 объектом и 2 равно расстоянию между 2 объектом и 1, поэтому ячейки, расположенные ниже главной диагонали, можно не заполнять.

  1. Выбор метода кластерного анализа для формирования групп сходных (однородных) объектов.

Наибольшее распространение получили иерархические агломеративные методы. В данных алгоритмах процесс объединения объектов классифицируемого множества в однородные группы совершается последовательно за шагов, где‒ количество объектов.

На первом шаге полагаем, что каждый объект множества представляет собой кластер с одним элементом. В матрице сходства находится минимальный элемент и кластеры с номерамииобъединяются в один кластер, его номер обозначают. После этого матрица различий меняется, из нее выбрасываются две строки и два столбца, содержащие расстояния от объектов с номерамиидо остальных объектов множества, но добавляется одна строка и один столбец с расстояниями от кластерадо остальных кластеров. Далее, на каждом очередном шаге процедура повторяется, т.е. находится минимальный элемент в преобразованной матрице различий, соответствующие кластеры объединяются в один и т.д.

Используемая литература: [1-5,7,10,14,18-21].

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]