Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
MU_Geo_new_2.doc
Скачиваний:
29
Добавлен:
09.11.2019
Размер:
4.51 Mб
Скачать

1) Метод ближней связи

Этот метод является самым простым для понимания из иерархических агломеративных методов кластерного анализа. Метод и начинает процесс классификации с поиска и объединения двух наиболее похожих объектов в матрице сходства. На следующем этапе находятся два очередных наиболее похожих объекта, и процесс повторяется до полного исчерпания матрицы сходства.

В процессе кластеризации методом ближней связи явно прослеживается образование цепочек объектов. Таким образом, для выделения кластеров после окончания процесса кластеризации требуется задаться некоторым пороговым уровнем сходства, на котором выделяется число кластеров, большее единицы. Процедура не всегда обнаруживает такое свойство, как образование одного большого кластера на последнем этапе кластеризации, и часто заканчивается явным разделением всех предъявленных объектов на кластеры.

2) Метод средней связи кинга

Метод средней связи подобен методу ближней связи. Разница в том, что на каком-либо этапе ранее объединенные в один кластер объекты считаются одним объектом с усредненными по кластеру параметрами.

3) Метод уорда

Данный метод напоминает метод средней связи Кинга. Особенностей состоит в том, что основанием для помещения объекта в кластер является не близость двух объектов в каком-либо смысле, в зависимости от меры сходства, а минимум дисперсии внутри кластера при помещении в него текущего классифицируемого объекта.

4) Метод k-средних мак-куина

Теоретическое обоснование метода k-средних (k внутригрупповых средних) сравнительно просто, логично и может быть найдено во многих источниках. Принцип классификации сводится к некоторому, возможно, случайному, исходному разбиению множества объектов на заданное число кластеров (классов, групп, популяций), последующему отнесению остальных объектов к ближайшим кластерам, пересчету новых «центров тяжести» кластеров и продолжению описанной процедуры, пока не будет получено некоторое оптимальное разбиение. Кластеризация обычно продолжается, пока новые «центры тяжести» кластеров не перестанут отличаться от старых «центров тяжести». Особенностью метода является то, что выделенные в результате расчетов кластеры не будут пересекаться – гарантируется, что каждый классифицированный объект будет отнесен только к одному кластеру.

В визуализации результатов кластеризации методом k-средних нет необходимости, хотя может оказаться наглядным и красивым изображение пространственных эллипсоидов (только для размерности не более 3, для большей размерности используются двумерные срезы пространства), coдержащих классифицированные объекты.

5) Метод корреляционных плеяд

Терентьевым был изобретен метод корреляционных плеяд. Суть метода такова. Визуально результаты классификации можно представить в виде цилиндра, рассеченного плоскостями, перпендикулярными его оси. Плоскости соответствуют его уровням (от 0 до 1 с шагом 0,1), на которых объединяются параметры или объекты, подлежащие классификации, поэтому метод напоминает метод ближней связи, но с фиксированными уровнями объединения. Графически результаты классификации изображают в виде окружностей – срезов (плеяд) упомянутого выше корреляционного цилиндра. На окружностях отмечают классифицируемые объекты. Связи между классифицированными объектами указывают путем соединения хордами точек окружности, соответствующих объектам.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]