Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Lupandin_V_I_Matematicheskie_metody_v_psikhologi.doc
Скачиваний:
457
Добавлен:
12.03.2016
Размер:
2.97 Mб
Скачать

Раздел 11. Элементы многомерной статистики

11.1. Основные понятия

Методы многомерной статистики используются в тех случаях, когда необходимо упорядочить (привести в определенную систему) большое количество переменных (измеряемых свойств, признаков, характеристик, психологических свойств и т. п.). Чаще всего к многомерной статистике прибегают специалисты в области дифференциальной психологии, которая решает проблему индивидуальных психологических различий, проблему типологизации личности и т. д.

Наиболее часто в психологии используются кластерный и факторный анализ, реже – дискриминантный анализ. Каждый из них давно уже перерос из отдельных методов в самостоятельные области математической статистики. По сути, эти направления лишь условно можно назвать «статистикой» (на том основании, что они основаны на использовании стандартных статистических методов). На самом же деле это более высокий уровень – уровень математического моделирования различных психологических свойств, процессов и состояний.

В данном разделе будут рассмотрены кластерный и факторный анализ.

11.2. Кластерный анализ

По степени использования кластерного анализа психологи, очевидно, занимают второе место (после биологов). В биологии кластерный анализ используется, в первую очередь, для создания классификационных (таксономических) схем растительного и животного мира. В психологии же кластерный анализ используется при исследовании структуры психологических свойств индивида, степени общности различных психологических характеристик, черт, признаков, характера их взаимной упорядоченности, взаимоотношений с множеством других признаков и т. д. Вполне понятно, что каждый психологический признак, свойство или черта не являются изолированными – как правило, они имеют большую или меньшую степень связи друг с другом. Для выявления этих взаимосвязей и предназначен кластерный анализ. Кластерный анализ имеет смысл проводить в тех случаях, когда регистрируется большое число переменных (по крайней мере, больше десятка разных признаков).

В математическом смысле задача кластерного анализа заключается в том, чтобы на основании данных, содержащихся в множестве Х, разбить множество объектов I на m кластеров (подмножеств) p1, p2, ..., pm так, чтобы каждый объект Ii принадлежал одному и только одному подмножеству разбиения и чтобы объекты, принадлежащие одному и тому же кластеру, были сходными, в то время как объекты, принадлежащие разным кластерам, были разнородными (несходными) по выбранному критерию.

Решением задачи кластерного анализа является разбиение, удовлетворяющее некоторому критерию оптимальности (целевой функции).

Пример:

8 объектов, обладают одной характеристикой (n = 8, p = 1); результаты измерения представляют собой множество X = {3, 4, 7, 4, 3, 3, 4, 4}; целевая функция – внутригрупповая сумма квадратов отклонений, которая предполагается быть минимальной.

Тогда:

(11.1)

где xi представляет собой измерение i-го объекта.

В нашем случае: W = 140 – 128 = 12.

Если множество X разбить на 3 группы: G1 = {3, 3, 3}, G2 = {4, 4, 4, 4} , G3 = {7}, то все внутригрупповые суммы квадратов отклонений будут равны нулю: W1 + W2 + W3 = 0 + 0 + 0 = 0, где Wi обозначает сумму квадратов, соответствующую группе Gi. Оптимальное значение для этого примера равно нулю при условии, что ведется разбиение на 3 группы. В общем случае необходимо рассматривать значение целевой функции в сочетании с желаемым числом групп разбиения.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]