Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ММСИ ШПОРЫ.docx
Скачиваний:
1
Добавлен:
26.09.2019
Размер:
35.05 Кб
Скачать

Методология анализа соц-х данных – это система научных взгядов на существование различных типов соц-й информации, специфики приемов ее измерения, логики и методов ее анализа.

Даные м.б.

  1. Первичные (результаты эмпирич-го исслед.)

  2. Вторичные (полученные кем-то и использованные нами)

Восходящая стратегия анализа данных – это поиск эмпирических закономерностей, начиная с простых и заканчивая сложными для формирования структурных выводов исследования.

Нисходящая стратегия анализа данных – это логика и методы проверки и объяснения гипотез в СИ.

Логическая программа складывается из следующих частей:

  1. Постановка задачи обработки

  2. Выбор методики решения задачи

  3. Разработка алгоритма решения задачи

  4. вывод

Основы многомерного анализа

В рамках стат-го подхода в СИ используют 2 вида данных: атрибутивные и реляционные

Атрибутивные данные характеризуют О-ты изучаемой статистической совокупности по 2 основным критериям: объект и признак.

Реляционые данные характеризуют структуру отношений между О-ми, составляющими выборку и представленную в виде социометрической матрицы.

Методы анализа реляционных отношений объединены общим названием – анализ соц-х сетей.

Методы снижения размерности переменных:

  1. Факторный анализ

  2. Многомерное шкалироваие

  3. Построение интегральных показателей (индексов)

Методы классификации:

  1. Кластерный анализ

  2. Дискриминантный анализ

Методы исследования многомерных причинных связей

  1. Множественный регрессионный анализ

  2. Многофакторный дисперсионный анализ

Для большинства методов многомерной статистики первичной исходной числовой моделью является матрица «объект – признак».

Представление данных в виде матрицы «О-т – признак» приводит к 2 типам задач:

  1. Выявление сходства между явлениями (задача классификации). Сжимают матрицу по строкам.

  2. Анализ взаимосвязи переменных (снижение размерности). Сжимают матрицу по столбцам.

В пространстве признаков объекты изображаются в виде точек с координатами соответствующих значений переменных.

Переменные выступают осями этого пространства.

В качестве осей пространства могут рассматриваться:

  1. Количественные

  2. Псевдоколичественные (псевдоинтервальные)

  3. Дихотомические переменные.

Если переменные схожи, то оси признаков расположены друг к другу (и наоборот).

Оси пространства тем ближе друг к другу, чем выше корреляция тех переменных друг с другом.

Независимость признаков выступает как ортогональность соответствующих осей.

Для описания осей пространства признаков используется матрица корреляции.

Матрица корреляции представляет собой квадратную матрицу, в которой строки и столбцы соответствуют одним и тем же переменным.

В матрице корреляции м.б. зафиксированы следующие коэффициенты корреляции:

  1. К. Пирсона

  2. К. Спирмена

  3. К. Фи

Корреляционные матрицы м.б. изображены на плоскости в виде графа-связи.

Граф – это геометрическая схема, представляющая собой системы линий соединяющие заданные точки. Точки называются вершинами или углами графа, а линии называются ребрами или дугами графа.

Расстояние между вершинами – это мин. число ребер по которым необходимо пройти чтобы попасть из одной вершины в другую.

Если из одной вершины нельзя попасть в другую, то расстояние между ними равно бесконечности.

Граф-связи строится только для тех переменных, корреляция между которыми превышает 0,4.

Метод факторного анализа – это один из способов снижения размерности, т.е. выделение во всей совокупности признаков тех, которые действительно влияют на изменение зависимой переменной.

Этапы ФА:

  1. Первоначальное извлечение факторов (метод главных компонент)

  2. Интерпретация факторов и главных компонент

  3. Вращение факторной структуры

  4. Интерпретация вращёной структуры

  5. Вычисление значений факторов

ФА решает задачи:

  1. Изучение структуры набора переменных

  2. Снижение размерности

Основные подходы к определению числа главных компанент:

  1. Критерий Кайзера – сост. В отбрасывании компанент собств. знач. которых меньше 1-цы.

  2. Критерий Кеттела – графическое изображение факторов и выблр некоторых из них.

  3. Критерий отбрасывания компанент, мкнише 5-ти – 30% общей дисперсии.

ФА работает только с количественными и порядковыми переменными

В зависимости от видов нагрузок выделяют 2 вида факторов:

  1. Ф. размера (нагрузки с одинаковыми знаками, показывает насколько у респондентов выражено измеряемое свойство).

  2. Ф. формы (нагрузки с разными знаками).

Факторное вращение:

  1. Ортогональное (факторы не коррелируют между собой)

  2. Не ортогональное (ф-ры коррелируют между собой)

В SPSS интервал от - 4 до + 4.

Снижение размерности пространства признаков

Наряду с методом ФА для снижения размерности пространства признаков используются методики построения интегральных показателей или индексов.

Индексом называется производный или интегральный показатель сформированный из исходных составляющих посредством математических операций.

Исходными данными для построения индексов являются эмпирических индикаторы и производные от них показатели.

Семантический дифференциал.

Одним из показателей методов количественного и качественного индексирования значения объектов является семантический дифференциал (СД).

СД относится к области психосемантики. Метод СМ был придуман Осгутом в 1957 г.

В основе метода СД лежит явление синестезии.

Синестезия – это мышление по аналогии, возможность возникновения одних чувств под воздействием других.

СД выступает и как метод интерпретации и как метод анализа.

В СД в качестве исходных переменных (индикаторов) используются биполярные шкалы.

В результате СД для каждого респондента получается индивидуальная матрица «объект-признак». Такой набор оценок О-в по всем шкалам называется «профилем респондента».

Используя факторный анализ Озгут показал, что основу семантического пространства любого человека составляет 3 основных фактора: оценка, сила, активность.

Пространство построенное Озгутом является ортогональным, поэтому в качестве меры близости используется Евклидово расстояние.

В СД организация данных имеет 3 измерения:

  • Респондент

  • Объект

  • Переменная

Многомерное шкалирование

Задачи МШ:

  1. Выявление латентных факторов определяющих восприятие определенных объектов или влияющая на процесс принятия решений экспертной или поведенческих ситуациях.

  2. Изучение структуры объектов с целью оценки их латентных свойств и последствий классификации.

Термин МШ ввел Торгерсон в 1952.

Исходными данными для МШ является матрица различий между объектами.

Объекты из выборки изображаются в пространстве в виде точек.

Мера различий: чем больше расстояние между О-ми, тем сильнее они оличакются друг от друга по значениям переменных.

2 О-та идентичны если описывающие их переменные принимают одинаковые значения, в этом случае расстояние между ними равно нулю.

Выбор меры расстояния зависит от конфигурации пространства и уровня измерения образующих его переменных. Конфигурация пространства определяется углами между осями.

Пространство является ортогональным если все углы в нем прямые. Евклидово расстояние.

Если пространство не является ортогональным используется расстояние Махаланобиса (обобщенное евклидово расстояние)

Для дихотомических переменных вычисляется расстояние Хемминга (расстояние городских кварталов), которое равняется количеству несовпадений ответов респондентов А и В по набору дихотомических вопросов.

По главной диагонали располагаются нулевые значения (рассмотрение о-та самого с собой) и матрица симметрично относительно главной диагонали.

В МШ О-ми могут быть:

  1. Оцениваемые стимулы (предметы, понятия, высказывания)

  2. Физические объекты (экосистемы и т.д.)

  3. S-ты принимающие решения (эксперты, депутаты)

Основным инструментом МШ является построение координатного пространства небольшой размерности и визуализация в нем структуры сходства или различия изучаемых О-в.

В МШ различают 2 основных подхода:

  1. Метрический (расстояние между о-ми измеряется по шкале с уровнем измерения не ниже интервального).

  2. Не метрический (ранговая шкала)

Существует 3 критерия для классификации данных в зависимости от процедуры их сбора:

  1. Индивидуальные – набор О-в оценивается одним наблюдателем.

Усредненные – полученные в результате групповых и массовых опросов.

  1. S-е являются – результатом оценивания О-в одним или несколькими респондентами.

О-е – независимы от s-х оценок (результаты голосования)

  1. Метрические – О-ты оцениваются с использованием набора переменных, которые в последствии используются для вычисления расстояний между О-ми.

Не метрические – возникают непосредственно при оценке сходства или различий между парами объектов, методом парных сравнений

Методы МШ:

  1. Методы реализующие модели анализа предпочтений.

  2. Методы реализующие модели анализа близостей.

Сатаров выделил 3 группы методов:

  1. МШ матриц близости (основана на визуализации в метрическом пространстве заранее подготовленной матрицы близости-различий).

  2. Индивидуальное шкалирование (базируется на оценках О-в одним испытуемым по нескольким переменным и имеет общие черты с методом главных компонент).

  3. Не метрическое многомерное развертывание (предназначено для анализа данных о предпочтениях организованных в виде наборов упорядочений или ранжировок респондентами данного набора О-в).

В основе модели НМР лежит представление об объединенном психическом пространстве и в этом пространстве образованном латентными факторами или конструктами описывается точками и О-ты и респонденты.

Каждый респондент представлен точкой – идеальная точка.

Наилучший О-т – ближайший к идеальной точке.