- •Пояснительная записка
- •Раздел 1. Основные теоретические сведенья по вопросам дисциплины
- •Тема 1. Введение. Измерение в психологии. Основы математической статистики Введение
- •Измерения в психологии
- •Порядковая (ранговая, ординарная) шкала
- •Шкала интервалов
- •Шкала отношений
- •Основы математической статистики
- •Выборочный метод
- •Классификации выборочного наблюдения
- •Характеристики генеральной и выборочной совокупности
- •Тема 2. Случайные величины. Распределения случайных величин
- •Нормальное рапределение
- •Тема 3. Статистические оценки параметров распределения
- •Оценки параметров генеральной совокупности
- •Точечные оценки
- •Интервальные оценки
- •Тема 4. Статистическая проверка статистических гипотез. Исследование статистических зависимостей
- •Проверка гипотезы о нормальном распределении генеральной совокупности. Критерий согласия Пирсона
- •Тема 5. Корреляционный анализ. Ранговая корреляция
- •Тема 6. Регрессионный анализ
- •Парная линейная регрессия
- •Тема 7. Дисперсионный анализ
- •Однофакторный дисперсионный анализ при равном числе наблюдений на различных уровнях
- •Однофакторный дисперсионный анализ при неравном числе наблюдений на различных уровнях
- •Тема 8. Факторный анализ
- •Тема 9. Кластерный анализ
- •Раздел 2. Задания для решения на занятиях
- •Тема 1. Введение. Измерения в психологии. Основы математической статистики Задачи для решения на занятии
- •Лабораторная работа
- •Тема 2. Случайные величины. Распределения случайных величин. Задачи для решения на занятии.
- •Лабораторная работа
- •2. Распределение Пуассона.
- •3. Нормальное распределение.
- •Тема 3. Статистика оценки параметров распределения. Лабораторная работа.
- •Тема 4. Статистическая проверка статистических гипотез. Исследование статистических зависимостей Лабораторная работа.
- •Тема 5. Корреляционный анализ. Ранговая корреляция Лабораторная работа
- •Тема 6. Регрессионный анализ Лабораторная работа
- •Тема 7. Дисперсионный анализ Лабораторная работа
- •Тема 9. Кластерный анализ
- •Раздел 3. Задания для самостоятельной работы
- •Тема 1. Введение. Измерения в психологии. Основы математической статистики
- •Тема 2. Случайные величины. Распределения случайных величин
- •Тема 3. Статистика оценки параметров распределения
- •Тема 4. Статистическая проверка статистических гипотез. Исследование статистических зависимостей
- •Тема 5. Корреляционный анализ. Ранговая корреляция
- •Тема 6. Регрессионный анализ
- •Тема 7. Дисперсионный анализ
- •Тема 9. Кластерный анализ
- •Примерный перечень вопросов к экзамену
- •Рекомендуемая литература
- •Содержание
Тема 9. Кластерный анализ
Кластерный анализ ‒ это многомерная статистическая процедура, выполняющая сбор данных, содержащих информацию о выборке объектов, и затем упорядочивающая объекты в сравнительно однородные группы (кластеры).
Результатом решения задачи кластерного анализа является разбиение на группы, удовлетворяющее некоторому критерию оптимальности.
Кластерный анализ содержит следующие этапы:
Определение множества объектов и множества признаков, по которым будут исследоваться данные объекты.
Часто, результаты измерения объектов представляют собой прямоугольную матрицу размера :
-
Объекты
Признаки
…
1
…
2
…
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
…
Т.е. происходит исследование объектов попризнакам.
Вычисление значений меры сходства (различия) между объектами. Составление матрица сходства (различия).
Наиболее известной и естественной с геометрической точки зрения мерой расстояния (сходства) является евклидово расстояние в пространстве признаков:
,
где и‒ номера объектов, между которыми вычисляется расстояние.
Результатом вычисления меры близости объектов исследуемого множества является матрица сходства:
-
Объекты
Объекты
1
2
3
…
1
0
…
2
0
…
…
0
…
…
...
0
Заметим, что расстояние между объектом и самим собой равно нулю, поэтому на главной диагонали матрицы сходства стоят нули, а расстояние между 1 объектом и 2 равно расстоянию между 2 объектом и 1, поэтому ячейки, расположенные ниже главной диагонали, можно не заполнять.
Выбор метода кластерного анализа для формирования групп сходных (однородных) объектов.
Наибольшее распространение получили иерархические агломеративные методы. В данных алгоритмах процесс объединения объектов классифицируемого множества в однородные группы совершается последовательно за шагов, где‒ количество объектов.
На первом шаге полагаем, что каждый объект множества представляет собой кластер с одним элементом. В матрице сходства находится минимальный элемент и кластеры с номерамииобъединяются в один кластер, его номер обозначают. После этого матрица различий меняется, из нее выбрасываются две строки и два столбца, содержащие расстояния от объектов с номерамиидо остальных объектов множества, но добавляется одна строка и один столбец с расстояниями от кластерадо остальных кластеров. Далее, на каждом очередном шаге процедура повторяется, т.е. находится минимальный элемент в преобразованной матрице различий, соответствующие кластеры объединяются в один и т.д.
Используемая литература: [1-5,7,10,14,18-21].