Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
готовые билеты по матстатистика к экзамену.doc
Скачиваний:
149
Добавлен:
13.05.2015
Размер:
1.22 Mб
Скачать

Модели теории графов и геометрическое моделирование.

К данному типу относится моделирование психологических структур и процессов. Например, восприятие можно моделировать с помощью субъективных пространств; при разработке теории личности используются модели классификации и реконструируются семантические пространства и т.д. эти модели строятся на основе применения методов многомерного шкалирования и кластерного анализа. Входными данными в эти методы являются матрицы близостей.

Для подсчёта матрицы расстояния необходимо выбрать метрику или метод вычисления расстояния между объектами в многомерном пространстве. Наиболее часто используются следующие метрики:

Евклида:

сити-блок (Манхеттен):

Минковского:

метрика на основе корреляции Пирсона:

метрика на основе корреляции Спирмена:

i,j– номера столбцов;

k– номер строки;

dij– элемент матрицы расстояний;

xik,xjk– элемент исходной матрицы;

n–количество объектов.

Коэффициент корреляции Пирсона подсчитывается для данных, измеренных в порядковых шкалах и шкалах наименований:

Коэффициент ранговой корреляции rsСпирмена является непараметрическим аналогом классического выборочного коэффициента корреляции (неранговые выборки автоматически ранжируются):

Исходный этап для применения многомерного шкалирования(далее –МШ) икластерного анализа(КА) – это вычисление расстояний между строками или столбцами.

Наиболее распространённой считается обычная евклидова метрика. Её обобщение – метрика Минковского, частным случаем которой является манхэттеновская метрика, или метрика сити-блок. Нормализованные евклидовы расстояния в большей степени подходят для переменных, измеренных в различных единицах или значительно отличающихся по величине. Манхэттеновская метрика, как правило, применяется для номинальных или качественных переменных.

Расстояния, вычисляемые на основе коэффициента корреляции, отражают согласованность колебаний оценок, в отличие от метрики Евклида, которая определяет, в среднем, сходные показатели.

Кластерный анализ (ка).

КА позволяет строить систему классификации исследованных объектов и переменных в виде «дерева» (дендрограммы)или же осуществлять разбиение объектов на заданное число удалённых друг от друга классов.

Методы КА можно расклассифицировать на:

Внутренние– признаки классификации равнозначны; Внутренние можно разделить на:

Иерархические– процедура классификации имеет древовидную структуру. Иерархические, в свою очередь подразделяются на:

Агломеративные– объединяющие;

Дивизитивные– разъединяющие.

Неиерархические

Внешние– существует один главный признак классификации, который определяют по остальным.

В психологии наиболее распространён иерархический дивизитивный метод.Он позволяет строить «дерево» классификацииnобъектов посредством их иерархического объединения в группы или кластеры на основе заданного критерия – минимума расстояния в пространствеmпеременных, описывающих объекты. Кроме того, с его помощью осуществляется разбиение некоторого множества объектов на естественное число кластеров.

Графическое представление результатов даётся в виде «дерева» иерархической кластеризации. По оси X– объекты, подлежащие классификации (на одинаковом расстоянии друг от друга). По осиY– расстояния, на которых происходит объединение объектов в кластеры. Для определения естественного числа кластеров вводится оценка разбиения на классы, которую вычисляют по величине отношения средних внутрикластерных расстояний к межкластерным (А.Дрынков, Т.Савченко, 1980). Глобальный минимум оценки характеризует естественное число классов, а локальныепод- и надструктуры. Методы иерархического КА различаются по стратегии объединения, т.е. пересчёта расстояний. Выделяются стратегии ближайшего соседа. При объединенииi-го иj-го классов в классkрасстояние между новым классомkи любым другим классомhпересчитываются следующим образом:

Расстояния между другими классами остаются неизменными.

Стратегия дальнего соседа:

Группового среднего:

где ni,nj,nk– число объектов в классахi,j,k.

Первые две стратегии, за исключением последней, изменяют пространство (сужают и растягивают). Поэтому, если не удаётся если не удаётся получить хорошего разбиения на классы с помощью третьей стратегии (а их необходимо выделить), то используются первые две. При этом первая стратегия объединяет классы по близким границам, а вторая – по дальним.

В социальной психологиипри исследовании взаимоотношений в коллективах, помимо разбиения на классы, необходимо установить также объекты, через которые классы связаны друг с другом. На эти вопросы можно ответить с помощью дендритного КА, который часто применяется совместно с иерархическим (Плюта, 1981). Главная роль в нём принадлежитдендриту– ломаной линии, которая не содержит замкнутых ломанных и в то же время соединяет любые два элемента. Предлагается построение дендрита, у которого сумма длин связей минимальна. Сначала к каждому объекту находится ближайший, при этом образуетсяскопление первого порядка, которые затем также объединяются по величине минимального расстояния до тех пор, пока не будет построен дендрит. Группы объектов считаютсявполне отделимыми, если длина дуги между ними, где;Cсрсредняя длина дуги;Sстандартное отклонение.

Дендриты могут иметь форму розетки, амёбообразного следа, цепочки. При совместном использовании иерархического КА и дендрита распределение элементов по классам осуществляется по первому методу, а взаимосвязи между ними анализируются с помощью дендрита.