9. Метод к-средних

Это итеративный метод, который работает непосредственно с объектами, а не с матрицей сходства. Он отличается тем, что позволяет заранее задать число кластеров. Это число определяет сам пользователь, исходя из имеющейся задачи и предсказаний теории. Метод к-средних разобьет все объекты на заданное количество кластеров, которые будут максимально различаться между собой.

В этом методе объект относится к тому классу, расстояние до которого минимально. Расстояние понимается как евклидово расстояние, то есть объекты рассматриваются как точки евклидова пространства. Вначале задается некоторое разбиение данных на кластеры (число кластеров определяется пользователем) и вычисляются центры тяжести кластеров. Затем происходит перемещение каждой точки в ближайший к ней кластер. Затем снова вычисляются центры тяжести новых кластеров, и процесс повторяется, пока не будет найдена стабильная конфигурация (то есть кластеры перестанут изменяться) или число итераций не превысит заданное пользователем.

Можно сказать, что вычислительная процедура данного метода представляет собой дисперсионный анализ «наоборот». Программа начинает работу с к случайных кластеров, а затем перемещает объекты из одного кластера в другой с целью (1) минимизировать вариативность (дисперсию) внутри кластера и (2) максимизировать вариативность между кластерами. Это аналогично дисперсионному анализу «наоборот» в том смысле, что в дисперсионном анализе при определении значимости различий в средних значениях групп оценивается межгрупповая дисперсия в сравнении с внутригрупповой дисперсией. В методе k-средних программа пытается перемещать объекты между группами (кластерами) таким образом, чтобы получить наиболее значимые результаты дисперсионного анализа. Поэтому и результаты этого самого дисперсионного анализа приводятся в разделе результатов применения данного метода.

4. Последовательность кластерного анализа

Отбор объектов для кластеризации.
Определение множества переменных, по которым будут различаться объекты кластеризации.
Выбор метода классификации - агломеративный метод или итеративный метод к-средних. Если выбран агломеративный метод, то выбираем метод объединения объектов в кластеры и меру сходства. Если выбран метод k-средних, то выбираем число кластеров.

4. Интерпретация полученных результатов.

Очевидно, что кластерный анализ дает гораздо больше возможностей, чем факторный, сопоставлять данные с различными теориями и гипотезами. Кроме применения описанных методов, можно нормировать либо не нормировать данные, а некоторые метрики позволяют еще менять параметры в самой формуле вычисления сходства между объектами. Таким образом, число возможных разбиений исходных объектов на кластеры сильно возрастает.

Библиография

Ермолаев, О.Ю. Математическая статистика для психологов / О.Ю. Ермолаев. - М.: МПСИ: Флинта. - 2002. – 325с.
Наследов, А.Д. Математические методы в психологическом исследовании. Анализ и интерпретация данных / А.Д. Наследов. - СПб.: Речь. - 2004.
Бурлачук, Л.Ф., Морозов С.М. Словарь – справочник по психодиагностике / Л.Ф. Бурлачук, С.М. Морозов – СПб: Питер Ком. - 1999. – 528с.

<<< < Предыдущая 34 35 36 37 38 39 40 41 42 43 44 4546 / 7846 47 48 49 50 51 52 53 54 55 56 57 58 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
14.04.201525.43 Кб28Средства и техника педагогического общения.docx
#
15.11.2018350.72 Кб3Стандарт по оформлению курс, дипл. и магист раб....doc
#
10.11.2018178.69 Кб5СТАНОВЛЕНИЕ И РАЗВИТИЕ СОЦИОЛОГИИ В 19-21 веке.doc
#
10.09.2019803.69 Кб17Стас - Вариант_1.04._Курсач_КЭП.docx
#
06.07.2019309.76 Кб1Статика.doc
#
14.04.20152.29 Mб515Статистические методы в психологии.doc
#
22.08.2019928.27 Кб1Статья Life sciences.docx
#
19.07.20191.62 Mб3сточ. воды.doc
#
01.09.2019119.81 Кб5СТП 300042199.022.doc
#
01.09.2019113.15 Кб4СТП 300042199.025.doc
#
01.09.2019154.62 Кб3СТП 300042199.029.doc