Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
lection.DOC
Скачиваний:
23
Добавлен:
23.08.2019
Размер:
2.5 Mб
Скачать

10. Факторный анализ

10.1. Общие сведения. Факторный анализ (далее - ФА) - комплекс аналитических методов, позволяющих выявить скрытые (латентные) признаки какого-либо явления или события, его внутреннюю (чаще всего скрытую) структуру. Возникновение ФА было связано с одной стороны с осознанием того, что множество явлений психологического или социального характера имеет сложную природу, а с другой стороны, с внедрением статистических методов в общественные науки. ФА представляет особую гордость психологов, поскольку его появление и развитие связано с именами Чарльза Спирмена (1863-1945) и Лайонела Терстоуна (1887-1955), которые были известными учеными-психологами. Немалая заслуга внедрения ФА в психологию принадлежит Р.Б.Кеттелу и Г.Ю.Айзенку, создавшим на основе применения этого метода факторные теории личности.

10.2. Задачи факторного анализа. ФА предназначен для исследования явлений, событий или объектов имеющих сложную структуру со множеством внутренних связей. Большинство психических явлений, особенно интеллект, личность, мотивация и т.д. можно рассматривать именно так. Поскольку такие явления могут быть измерены сразу по многим переменным, ФА позволяет совершить переход от множества непосредственно измеренных признаков изучаемого явления к комплексным обобщенным факторам, за которыми стоят комбинации исходных признаков. Например, об уровне интеллекта ученика могут свидетельствовать оценки по учебным предметам, результаты исследования внимания, памяти, мышления и т.д., однако множество измерений отдельных переменных, информация по которым может оказаться избыточной, можно свести к сравнительно небольшому набору факторов, которые будут также хорошо описывать интеллект, как и исходные переменные, и при этом, что очень важно, информативность такого описания будет не ниже, чем при использовании полного набора исходных переменных.

Главной задачей ФА, таким образом, является уменьшение объема статистического описания какого-либо явления без потери информативности такого описания. Из всего многообразия статистических методов ФА, пожалуй, более, чем какой-либо другой, учитывая системность изучаемых явлений, отвечает предмету психологии.

10.3. Процедура факторного анализа.

10.3.1. Исходными данными для ФА является таблица результатов измерения множества индивидов (объектов) по множеству переменных (шкал, тестов и т.д.). Например, это может быть исследование множества учеников по множеству тестов умственных способностей, или исследование случайных испытуемых по множеству шкал, отражающих личностные характеристики. Предполагается, что результаты измерения отражают общую структуру исследуемого явления, а результаты отдельного испытуемого представляют собой частный случай реализации общей структуры. С другой стороны, каждая отдельная шкала по которой были измерены множество индивидов также вносит свой вклад в общую структуру исследуемого явления. Уменьшение числа испытуемых может приводить к меньшей точности ФА, а уменьшение числа исходных шкал - к обеднению структуры исследуемого явления. Поэтому, ФА предполагает обработку достаточно большого объема информации, и его развитие оказалось тесно связано с появлением электронно-вычислительных машин. В общем виде таблица результатов эксперимента, которые впоследствии подвергаются ФА имеет следующий вид:

1 тест

2 тест

3 тест

.

k-й тест

1 индивид

X1,1

X1,2

X1,3

.

X1,k

2 индивид

X,2,1

X,2,2

X,2,3

.

X,2,k

3 индивид

X3,1

X3,2

X3,3

.

X3,k

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

n-й индивид

Xn,1

Xn,2

Xn,3

.

Xn,k

Рис. 10.1 Таблица результатов эксперимента для ФА.

10.3.2. Второй этап ФА - подсчет коэффициентов корреляции между всеми исходными переменными (т.е. каждой переменной с каждой), в результате чего получается матрица корреляций между переменными, или, по-другому, матрица интеркорреляций.

1 тест

2 тест

3 тест

.

k-й тест

1 тест

r1,1

r1,2

r1,3

.

r1,k

2 тест

r2,1

r2,2

r2,3

.

r2,k

3 тест

r3,1

r3,2

r3,3

.

r3,k

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

k-й тест

rk,1

rk,2

rk,3

.

rk,k

Рис 10.2. Общий вид матрицы интеркорреляций

При этом интеркорреляционная матрица всегда имеет одинаковое количество строк и столбцов, симметрична относительно главной диагонали (где расположены элементы с одинаковыми подстрочными индексами) и элементами главной диагонали всегда являются единицы (коэффициент корреляции переменной с самой собой всегда равен «1.00»).

10.3.3. Третий этап ФА - получение редуцированной корреляционной матрицы. Она отличается от матрицы попарных корреляций тем, что по ее диагонали находятся не единицы, а т.н. ''общности'' или ''запасы общей изменчивости'' - наибольшие значения коэффициента корреляции (по модулю) в столбце (строке) соответствующей данной переменной.

10.3.4. На четвертом этапе подсчитывается сумма коэффициентов корреляции в каждом столбце и общая сумма всех элементов матрицы интрекорреляций. В том случае, если хотя бы одна из сумм оказывается отрицательной, необходимо изменить знак всех коэффициентов корреляции в данном столбце (строке) на противоположный. Такая процедура равносильна повороту шкалы измерения данной переменной на 180 градусов, т.е там где был плюс становится минус и наоборот.

10.3.5. На пятом этапе необходимо определить факторные нагрузки каждой переменной на первый фактор. Для этого каждую сумму делят на корень квадратный из общей суммы всех коэффициентов корреляции в матрице:

Поскольку количество факторных нагрузок каждой переменной на первый фактор равно количеству исходных переменных, то в результате вычислений получается матрица факторных нагрузок размерностью 1X n (где n – число исходных переменных) иначе называемая вектор-строка.

10.3.6. Полученную матрицу факторных нагрузок необходимо умножить на транспонированную матрицу факторных нагрузок, представляющую собой вектор-столбец(размерностью n X 1). Результатом таких вычислений является матрица попарных произведений факторных нагрузок размерностью n X n.

10.3.7. На следующем этапе необходимо из редуцированной корреляционной матрицы вычесть матрицу попарных произведений факторных нагрузок, что означает вычитание из каждого элемента первой матрицы каждого соответствующего элемента второй. Результатом этого этапа является остаточная матрица.

10.3.8. На последнем этапе остаточная матрица проверяется на соответствие матрице погрешностей, что означает установление необходимости дальнейшей факторизации. Для этой процедуры обычно используется критерий Сондерса или уравнения Терстоуна (см. Г.В.Суходольский “Основы математической статистики для психологов”). Если обнаруживается, что остаточная матрица не соответствует матрице погрешностей, то весь алгоритм ФА повторяется сначала, но уже с остаточной матрицей, в результате чего получается матрица факторных нагрузок переменных на второй фактор, затем на третий и т.д. Вся процедура ФА может повторяться, таким образом, до тех пор, пока остаточная матрица не станет соответствовать матрице погрешностей, но при этом, количество полученных в ФА факторов в любом случае будет меньше, чем количество исходных переменных.

10.4. Результаты ФА. Завершающий этап ФА - получение факторной матрицы (матрицы факторных нагрузок каждой переменной на каждый фактор), подсчет процента дисперсии, приходящейся на каждый фактор, а далее - построение факторной диаграммы. При этом считается что:

  1. Факторы определены через исходные переменные;

  2. Система факторов образует пространство, в котором через факторные нагрузки определены исходные переменные;

  3. Факторы ранжированы в порядке убывания их значимости для объяснения эмпирических результатов;

  4. Количество факторов существенно меньше, чем исходных переменных;

  5. Факторам придается смысл скрытых источников, порождающих эмпирические результаты;

  6. Все факторы независимы друг от друга.

10.5. Построение факторных диаграмм. Исходным предположением для построения факторной диаграммы является то, что факторы не коррелируют между собой и представляют оси многомерного факторного пространства, где переменные можно представить в виде векторов или точек с координатами, соответствующими факторным нагрузкам каждой переменной на каждый из полученных факторов. Как правило, при построении факторной диаграммы ограничиваются двумя первыми факторами, поскольку на плоскости трудно изобразить пространство большей размерности.

Факторные нагрузки, при этом, - не что иное, как координаты точек исходных переменных в пространстве полученных факторов.

10.6. Эмпирический пример ФА. В качестве эмпирического примера ФА взяты результаты исследования эмоциональной устойчивости 38 испытуемых, проведенные при помощи 9 тестов, дающих 10 исходных переменных. Это были бланковые тесты-опросники (первые 8 переменных) и компьютерный мнемический тест (КМТ), в котором создавался стресс неуспеха, дающий две переменные – количество правильных ответов и время реакции или время воспроизведения правильных ответов (см. рис.10.3).

Испытуемые

Пластичность

ЦНС

Эмоциональная чувствительность

Ситуативная тревожность

Личностная тревожность

Нейротизм

Мотивация достижения

Нетерпимость неопределенности

Стратегия выхода из крит. ситуаций

Кол-во правильных ответов в КМТ

Время реакции в КМТ

Г.И.

8

9

1,80

1,95

17

142

360

0,75

14

6,07

В.В.

5

11

2,25

3,45

19

116

313

0,60

10

5,30

Б.Я.

11

0

1,95

1,95

11

129

269

0,60

11

4,83

Е.Б.

10

9

1,90

2,15

10

118

343

0,52

10

8,06

К.В.

12

1

2,65

1,70

10

199

288

0,77

11

3,86

О.А.

8

10

2,20

3,15

20

111

351

0,56

6

6,36

Е.В.

4

11

2,00

2,45

16

127

382

0,56

10

7,90

Е.А.

6

11

1,90

2,75

19

137

375

0,49

10

6,01

В.Б.

8

5

2,00

2,50

13

130

309

0,60

12

5,56

В.В.

5

10

3,00

2,90

19

107

331

0,48

8

4,68

О.М.

4

12

2,90

3,55

19

105

322

0,43

5

4,61

Н.П.

2

6

1,75

2,25

18

118

336

0,60

8

6,02

Т.В.

12

12

2,70

3,00

21

125

324

0,67

10

5,13

О.В.

5

7

2,05

2,35

16

114

363

0,59

8

7,15

З.Л.

0

11

3,45

3,10

21

95

341

0,56

7

4,97

Л.В.

12

8

3,60

2,50

17

132

313

0,68

7

4,72

Е.В.

5

10

2,05

2,25

18

118

379

0,74

14

6,64

Н.А.

6

7

2,10

2,15

14

141

339

0,55

11

6,07

Л.А.

6

11

2,45

2,80

15

154

283

0,59

6

6,12

Н.В.

2

6

3,00

3,00

16

132

375

0,63

9

7,13

А.Ю.

11

0

1,75

1,70

5

155

279

0,82

12

4,60

В.Н.

4

12

3,05

2,40

18

115

301

0,57

10

4,58

Е.В.

4

2

1,90

2,60

21

127

342

0,57

8

5,98

Л.В.

11

1

1,25

1,70

6

134

309

0,65

9

5,75

С.В.

4

12

2,95

3,25

22

90

364

0,51

2

4,01

Б.В.

9

2

1,55

2,10

11

126

279

0,61

12

5,17

А.Л.

5

9

1,85

2,15

19

124

318

0,56

12

4,51

Ж.И.

10

5

2,25

2,80

13

121

243

0,54

6

5,87

А.В.

4

12

3,10

3,35

18

124

242

0,47

11

4,51

Ю.В.

10

4

1,70

2,05

13

167

314

0,64

13

3,79

Б.Г.

8

5

2,05

2,35

18

125

339

0,58

5

5,05

А.П.

2

6

1,45

2,60

13

113

357

0,60

15

2,61

Н.А.

7

0

1,85

1,90

9

123

255

0,63

16

3,37

Д.Е.

11

10

2,35

2,20

17

129

333

0,57

13

4,05

А.И.

0

11

1,60

2,50

19

120

301

0,53

15

4,24

О.А.

3

6

1,75

1,90

11

105

343

0,63

11

6,20

И.П.

12

1

1,55

1,80

12

141

272

0,85

7

5,62

М.В.

10

1

1,35

1,40

3

176

210

1,06

11

5,84

Рис. 10.3. Таблица результатов эксперимента

Здесь необходимо отметить, что эмоциональная устойчивость имеет сложную, многофакторную природу, что и предопределило выбор исходных переменных. В действительности, в этом эксперименте было 23 исходных переменных, т.к. компьютерный мнемический тест состоял из трех серий, результаты которых тоже содержали несколько переменных времени реакции и количества ответов, однако, в качестве учебного примера их количество было сокращено (были взяты только средние арифметические времени реакции и количества правильных ответов).

После подсчета коэффициентов корреляции была получена матрица интеркорреляций:

Переменные

Пластичность

ЦНС

Эмоциональная чувствительность

Ситуативная тревожность

Личностная тревожность

Нейротизм

Мотивация достижения

Нетерпимость неопределенности

Стратегия выхода из крит. ситуаций

Кол-во правильных ответов в КМТ

Время реакции в КМТ

Пласт. ЦНС

1,000

-0,475

-0,173

-0,474

-0,508

0,561

-0,417

0,472

0,027

-0,042

-1,029

Эмоцион. чувств.

-0,475

1,000

0,538

0,716

0,762

-0,509

0,461

-0,558

-0,207

0,117

0,846

Ситуативн.

тревожность

-0,173

0,538

1,000

0,633

0,539

-0,272

0,111

-0,349

-0,464

-0,125

0,438

Личностная тревожность

-0,474

0,716

0,633

1,000

0,751

-0,578

0,282

-0,658

-0,467

-0,020

0,183

Нейротизм

-0,508

0,762

0,539

0,751

1,000

-0,562

0,542

-0,597

-0,346

-0,012

0,568

Мотивация

достижения

0,561

-0,509

-0,272

-0,578

-0,562

1,000

-0,410

0,631

0,300

-0,054

-0,893

Нетерпим.

неопредел.

-0,417

0,461

0,111

0,282

0,542

-0,410

1,000

-0,369

-0,101

0,347

0,447

Стратегия

вых. из КС

0,472

-0,558

-0,349

-0,658

-0,597

0,631

-0,369

1,000

0,230

0,029

-1,168

К-во ответов

в КМТ

0,027

-0,207

-0,464

-0,467

-0,346

0,300

-0,101

0,230

1,000

-0,223

-1,253

Время реакц.

в КМТ

-0,042

0,117

-0,125

-0,020

-0,012

-0,054

0,347

0,029

-0,223

1,000

0,018

Суммы

-1,029

0,846

0,438

0,183

0,568

-0,893

0,447

-1,168

-1,153

0,018

-1,842

Рис. 10.4. Матрица интеркорреляций

В данном случае хорошо видно, что общая сумма всех коэффициентов корреляции в матрице равна ''-1,842'', а по условию ФА она должна быть больше нуля (иначе невозможно подсчитать факторные нагрузки) и поэтому необходима инверсия тех шкал, у которых сумма коэффициентов корреляции отрицательна. Инверсия шкалы ''Стратегия выхода из критических ситуаций'' привела к тому, что общая сумма стала положительной, и в матрицу коэффициентов корреляции были включены ''запасы общей изменчивости'':

Переменные

Пластичность

ЦНС

Эмоциональная чувствительность

Ситуативная тревожность

Личностная тревожность

Нейротизм

Мотивация достижения

Нетерпимость неопределенности

Стратегия выхода из крит. ситуаций

Кол-во правильных ответов в КМТ

Время реакции в КМТ

Пласт. ЦНС

0,561

-0,475

-0,173

-0,474

-0,508

0,561

-0,417

-0,472

0,027

-0,042

-1,412

Эмоцион. чувств.

-0,475

0,762

0,538

0,716

0,762

-0,509

0,461

0,558

-0,207

0,117

2,723

Ситуативн.

тревожность

-0,173

0,538

0,633

0,633

0,539

-0,272

0,111

0,349

-0,464

-0,125

1,768

Личностная тревожность

-0,474

0,716

0,633

0,751

0,751

-0,578

0,282

0,658

-0,467

-0,020

2,251

Нейротизм

-0,508

0,762

0,539

0,751

0,762

-0,562

0,542

0,597

-0,346

-0,012

2,524

Мотивация

достижения

0,561

-0,509

-0,272

-0,578

-0,562

-0,631

-0,410

-0,631

0,300

-0,054

-2,786

Нетерпим.

неопредел.

-0,417

0,461

0,111

0,282

0,542

-0,410

0,542

0,369

-0,101

0,347

1,726

Стратегия

вых. из КС

-0,472

0,558

0,349

0,658

0,597

-0,631

0,369

0,658

-0,230

-0,029

1,826

К-во ответов

в КМТ

0,027

-0,207

-0,464

-0,467

-0,346

0,300

-0,101

-0,230

-0,467

-0,223

-2,180

Время реакц.

в КМТ

-0,042

0,117

-0,125

-0,020

-0,012

-0,054

0,347

-0,029

-0,223

0,347

0,307

Суммы

-1,412

2,723

1,768

2,251

2,524

-2,786

1,726

1,826

-2,180

0,307

6,747

Рис. 10.5. Редуцированная матрица интеркорреляций

Затем по формуле в п.10.3.5. были вычислены факторные нагрузки:

Переменные

Пластичность

ЦНС

Эмоциональная чувствительность

Ситуативная тревожность

Личностная тревожность

Нейротизм

Мотивация достижения

Нетерпимость неопределенности

Стратегия выхода из крит. ситуаций

Кол-во правильных ответов в КМТ

Время реакции в КМТ

Факторные нагрузки

-0,543

1,048

0,681

0,867

0,972

-1,073

0,664

0,703

-0,839

0,118

Рис. 10.6. Матрица факторных нагрузок переменных на 1-й фактор

При умножении матрицы факторных нагрузок на свою транспозицию, где Ai,1 – факторная нагрузка i-ой переменной на 1-й фактор, получена матрица попарных произведений факторных нагрузок:

A1,1

A2,1

A3,1

A4,1

A5,1

A6,1

A7,1

A8,1

A9,1

A10,1

A1,1

0,295

-0,570

-0,370

-0,471

-0,528

0,583

-0,361

-0,382

0,456

-0,064

A2,1

-0,570

1,099

0,713

0,908

1,019

-1,124

0,696

0,737

-0,880

0,124

A3,1

-0,370

0,713

0,463

0,590

0,661

-0,730

0,452

0,478

-0,571

0,080

A4,1

-0,471

0,908

0,590

0,751

0,842

-0,929

0,576

0,609

-0,727

0,102

A5,1

-0,528

1,019

0,661

0,842

0,944

-1,042

0,646

0,683

-0,815

0,115

A6,1

0,583

-1,124

-0,730

-0,929

-1,042

1,150

-0,712

-0,754

0,900

-0,127

A7,1

-0,361

0,696

0,452

0,576

0,646

-0,712

0,441

0,467

-0,557

0,078

A8,1

-0,382

0,737

0,478

0,609

0,683

-0,754

0,467

0,494

-0,590

0,083

A9,1

0,456

-0,880

-0,571

-0,727

-0,815

0,900

-0,557

-0,590

0,704

-0,099

A10,1

-0,064

0,124

0,080

0,102

0,115

-0,127

0,078

0,083

-0,099

0,014

Рис. 10.7. Матрица попарных произведений факторных нагрузок

При вычитании которой из редуцированной корреляционной матрицы получается остаточная матрица:

Переменные

Пластичность

ЦНС

Эмоциональная чувствительность

Ситуативная тревожность

Личностная тревожность

Нейротизм

Мотивация достижения

Нетерпимость неопределенности

Стратегия выхода из крит. ситуаций

Кол-во правильных ответов в КМТ

Время реакции в КМТ

Пласт. ЦНС

0,266

0,095

0,196

-0,003

0,020

-0,022

-0,056

-0,090

-0,430

0,023

Эмоцион. чувств.

0,095

-0,337

-0,175

-0,193

-0,257

0,616

-0,236

-0,180

0,673

-0,007

Ситуативн.

тревожность

0,196

-0,175

0,169

0,043

-0,122

0,458

-0,341

-0,130

0,107

-0,205

Личностная тревожность

-0,003

-0,193

0,043

0,000

-0,091

0,351

-0,293

0,049

0,260

-0,123

Нейротизм

0,020

-0,257

-0,122

-0,091

-0,182

0,480

-0,104

-0,086

0,469

-0,127

Мотивация

достижения

-0,022

0,616

0,458

0,351

0,480

-1,781

0,303

0,123

-0,600

0,073

Нетерпим.

неопредел.

-0,056

-0,236

-0,341

-0,293

-0,104

0,303

0,100

-0,099

0,456

0,269

Стратегия

вых. из КС

-0,090

-0,180

-0,130

0,049

-0,086

0,123

-0,099

0,164

0,360

-0,112

К-во ответов

в КМТ

-0,430

0,673

0,107

0,260

0,469

-0,600

0,456

0,360

-1,171

-0,124

Время реакц.

в КМТ

0,023

-0,007

-0,205

-0,123

-0,127

0,073

0,269

-0,112

-0,124

0,334

Рис. 10.8. Остаточная матрица после извлечения 1-го фактора

В этом заключается основная процедура ФА. Однако, она не может быть закончена, если остаточная матрица не соответствует матрице погрешностей. Согласно критерию Сондерса в матрице содержится еще некоторое количество факторов и поэтому процесс факторизации может быть продолжен, но уже с остаточной матрицей.

Ниже (см.рис.10.9.) приведен пример факторной диаграммы расположения переменных в пространстве двух факторов, полученной при факторном анализе полного набора из 23 переменных. На рисунке видно, что одна из точек имеет максимальную факторную нагрузку по F1 и нулевую по F2 . Ее координаты (0.595;0). Эта точка соответствует переменной времени реакции в серии компьютерного мнемического теста, где создавался стресс неуспеха, поэтому и 1-й фактор может быть интерпретирован, как “фактор времени реакции”. Другая точка имеет максимальную факторную нагрузку по F2 и низкую по F1 . Эта точка с координатами (0.056;0.309) соответствует переменной количества ответов в КМТ в той серии, где создавался стресс неуспеха, поэтому 2-й фактор может быть назван “фактором продуктивности деятельности в критических условиях”.

Рис. 10.9. Факторная диаграмма полученная по центроидному методу

Интерпретируя факторную диаграмму можно сказать, что основными факторами эмоциональной устойчивости являются два параметра: скорость и точность действий в критических ситуациях. Если учитывать, что оба параметра измеряются при помощи одной методики КМТ, то можно получить и еще один вывод: наилучшим методом исследования эмоциональной устойчивости является компьютерный тест моделирующий стресс неуспеха, а не бланковые тест-опросники.

10.7. Метод факторного анализа Баннистера. Это наиболее простой из методов мультифакторного анализа. Он заключается в том, что матрицу корреляций возводят в квадрат (что означает возведение каждого элемента матрицы в квадрат) и умножают на 100, однако, если знак коэффициента корреляции являлся отрицательным, то его при этом сохраняют. Полученная в результате таких преобразований матрица называется матрицей коэффициентов Баннистера. Затем необходимо подсчитать сумму коэффициентов Баннистера по столбцам (строкам) без учета диагональных элементов (которые всегда равны 100), и та переменная, которая набрала наибольшую из сумм, и будет являться первым фактором.

1 тест

2 тест

3 тест

.

k-й тест

1 тест

100

К1,2

К1,3

.

К1,k

2 тест

К2,1

100

К2,3

.

К2,k

3 тест

К3,1

К3,2

100

.

К3,k

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

k-й тест

Кk,1

Кk,2

Кk,3

.

100

Рис. 10.10. Общий вид матрицы коэффициентов Баннистера

где K- коэффициент Баннистера, вычисляемый по формуле (значок * указывает на то, что при возведении в квадрат должен быть оставлен исходный знак коэффициента корреляции)

Интерпретация первого фактора довольно проста. Это исходная переменная, которая аккумулирует наибольшее количество связей с другими переменными. В качестве второго фактора берут переменную набравшую вторую по величине сумму, но только в том случае, если она не имеет значимого коэффициента корреляции с первым фактором. Полученные факторы, таким образом, являются самими исходными переменными, но это не говорит о том, что они не являлись до этого скрытыми, поскольку предсказать заранее, какая именно из переменных окажется наиболее весомым фактором, в большинстве случаев невозможно.

Данный вариант ФА позволяет построить косоугольное факторное пространство, поскольку коэффициент корреляции между факторами в большинстве случаев не является нулевым. Факторы, полученные таким образом, называются облическими.

На рис. 10.11. приведена факторная диаграмма, полученная на основе применения ФА по Баннистеру к тем же данным, к которым был применен ФА по Терстоуну. Интересно то, что первый фактор остался тем же самым – ''время реакции'', а вот вторым фактором оказалась эмоциональная чувствительность (по опроснику).

Рис. 10.11. Факторная диаграмма по Баннистеру

Интерпретация полученных данных будет отличаться от ФА по Терстоуну. В данном случае выявлено, что основными факторами эмоциональной устойчивости являются быстрота действий в критической ситуации и уровень эмоциональной чувствительности, однако, какой именно из методов ФА является более предпочтительным, в каждом отдельном случае исследователь решает самостоятельно.

10.8. Некоторые замечания о методе ФА. Как правило исследователь начинает с заранее избыточного количества дублирующих друг друга переменных, чтобы впоследствии свести их с помощью ФА к небольшому количеству уже независимых факторов, поскольку практически невозможно знать заранее, какие характеристики окажутся и существенными и независимыми друг от друга. Примерно такие предпосылки заставили Р.Б.Кеттела проанализировать около 4500 слов английского языка описывающих личность и поведение человека, чтобы затем с помощью семантического анализа свести их в 171 синонимичную группу, которая была подвергнута факторному анализу. Результатом факторного анализа понятий языка, описывающих личность и поведение человека, явилась факторная теория личности Р.Б.Кеттела и созданный на ее основе 16-факторный личностный опросник. Многочисленные кросскультурные исследования, проведенные во многих странах, показали удивительно высокую устойчивость факторной структуры личности, поэтому ФА является как разведочным методом, позволяющим выдвинуть гипотезы, так и методом проверки гипотез. Кроме того, обнаружили, что различные методы ФА дают сходные результаты, что говорит о том, что если исследователь имеет дело не со случайным набором переменных, а с действительно сложным, но устойчивым явлением, то разные варианты ФА приведут к одним и тем же выводам.

Необходимо коснуться вопроса об уровне используемых для измерения шкал. Как правило, измерение переменных должно быть проведено в шкале интервалов или отношений, что на практике, к сожалению, не всегда оказывается возможным, поскольку некоторые из переменных (например, пол, социальное положение, политическую ориентацию и т.д.) нельзя измерить в этих шкалах.

Приложение ''Статистические показатели, их обозначения и формулы''

  1. X – обозначение переменной (случайной величины)

  1. xi – отдельное значение случайной величины

  2. i – подстрочный индекс означающий ''каждый''

  3. R – ранжированная случайная величина

  4. n – количество значений в распределении случайной величины, количество наблюдений в выборке

  5. N – количество наблюдений в генеральной совокупности или в объединенной выборке

  6. - знак суммы (сигма большая).

Подстрочный и надстрочный индексы означают ''от первого до последнего значения переменной (иногда могут быть опущены)

  1. Среднее арифметическое

  1. Md - Медиана - значение случайной величины, находящееся в середине упорядоченного распределения

  2. Mo - Мода - наиболее частое значение случайной величины в распределении

  3. Qi, Ki, Di, Pi – обозначения квартиля, квинтиля, дециля и процентиля

  4. Размах

  1. Среднее отклонение

  1. Дисперсия

  1. Стандартное (среднеквадратическое) отклонение

  1. Асимметрия

  1. Эксцесс

  1. Стандартная оценка

  1. Коэффициент корреляции Пирсона

, или

, или

  1. Коэффициент ранговой корреляции Спирмена

  1. Коэффициент ассоциации Пирсона

,

где pxy – доля людей имеющих признаки X и Y, px – доля людей имеющих только признак X, py – доля людей имеющих только признак Y, qx – доля людей не имеющих признак X, qy – доля людей не имеющих признак Y

22. Четырехпольный коэффициент ассоциации ,

где a,b,c,d – значения, стоящие в четырехклеточной таблице сопряженности признаков

  1. Точечно-бисериальный коэффициент корреляции

,

где - среднее по X c единицей, - среднее по X c нулем

  1. Рангово-бисериальный коэффициент корреляции

  1. U – критерий Манна-Уитни

и

  1. t – критерий Стьюдента

  1. F – критерий Фишера

  1.  – критерий Пирсона

,

где fxj эмпирическая частота, fyj теоретическая частота

  1. G – критерий знаков – количество сдвигов значений случайной величины в сторону увеличения или уменьшения значений под влиянием фактора

  2. T – критерий Вилкоксона

,

где Rr ранговые значения сдвигов с более редким знаком

  1. Биномиальный критерий m – эмпирическая частота какого-либо признака в выборке

  2. – критерий Фишера с угловым преобразованием

,

где угол, соответствующей большей процентной доле, выраженный в радианах

– угол, соответствующей меньшей процентной доле, выраженный в радианах

n1 количество наблюдений в выборке 1

n2 количество наблюдений в выборке 2

33. Формулы и обозначения по дисперсионному, регрессионному и факторному анализу даны в соответствующих разделах методического пособия

Научная гипотеза – это обоснованное и развитое содержательное предположение о неочевидных явлениях и событиях. Этими явлениями и событиями могут быть факты и феномены объекта или предмета исследования, связи между исследуемыми переменными, отличие одних объектов от других по каким-либо параметрам и т.д. Научная гипотеза обычно формулируется как теорема и предполагает практическую проверку ее хотя бы в будущем, если в данный момент это неосуществимо. Среди научных гипотез отдельно выделяются статистические гипотезы, но в отличии от большинства научных гипотез, они являются формальным утверждением относительно различий между двумя или несколькими распределениями и предполагают реальную проверку их при помощи существующих методов математической статистики.

Статистические гипотезы разделяются на два вида: нулевые и альтернативные. Нулевая гипотеза (H0) утверждает об отсутствии различий между двумя распределениями (различия равны нулю), альтернативная (H1) – о существовании или значимости различий. Нулевая и альтернативная гипотезы являются взаимоисключающими, и в этом плане, одна из них должна будет оказаться истинной, а другая – ложной. Для проверки статистических гипотез служат статистические критерии. Статистические гипотезы могут быть направленные и ненаправленные. Если гипотеза просто утверждает отсутствие или значимость различий, то она является ненаправленной, т.к. в ее формулировку не входит направление различий. Если гипотеза помимо отсутствия или значимости различий утверждает и то, что параметры одного распределения должны оказаться больше или меньше, чем параметры другого, то она является направленной.

Статистический критерий – это решающее правило, обеспечивающее надежное принятие истинной гипотезы и отклонение ложной с высокой вероятностью, а также метод расчета числа, говорящего о значимости различий между распределениями случайной величины и само это число.

Статистические критерии служат тем пробным камнем, на котором проверяются гипотезы научные, и, до тех пор, пока научная гипотеза не пройдет такой проверки, она не может быть признана научным фактом. Статистические критерии, однако, сами по себе, не являются средством решения научных проблем, так как статистические методы не заменяют собой мышления ученого. Результат, полученный при помощи применения статистических критериев всегда носит вероятностный характер, т.к. исследователь в большинстве случаев имеет дело не только со случайной величиной, но и со случайной выборкой, и поэтому, выводы его также обладают определенной степенью достоверности или значимости, или, по другому говоря, допускают некоторую вероятность ошибки.

Уровень значимости статистических критериев () – это вероятность того, что исследователь счел различия существенными, а они на самом деле случайны.

В психологии обычно используется три уровня значимости: 5-процентный (0,95), 1-процентный (0, 99) и 0.1- процентный (0, 999) (хотя последний намного реже). Если указывают, что различия достоверны на 5%-ом уровне значимости (p < 0.05), то имеют ввиду, что вероятность ошибочного вывода составляет 0.05, если на 1%-ом – 0.01 (p < 0.01) и т.д. При этом, 5%-й уровень считается низшим, а 0.1%-й – высшим уровнем значимости.

Число степеней свободы. - это характеристика распределения, используемая при проверке статистических гипотез (обозначается df или ). Число степеней свободы равно числу классов вариационного ряда минус число условий, при которых он был сформирован.

Предположим, что выборка из 100 человек была разбита на три класса в зависимости от степени выраженности какого-либо признака. В первый класс могут попасть те, у кого признак выражен максимально, во второй те, у кого он выражен в средней степени, но в третий могут попасть только оставшиеся, вне зависимости от того минимально выражен у них признак, или вовсе отсутствует. Можно, конечно, допустить и другое разбиение, но число степеней свободы в данном случае будет равно df = 31= 2. Если исследователь имеет дело с классификацией из 100 классов, то df будет равно 99 и т.д. Для двух распределений df = c – 2 (c – число классов), а при представлении переменных в таблице размером a x b, df = (a – 1)(b – 1), где a – число столбцов, а b – число строк.

Для того, чтобы принять или отклонить статистические гипотезы существуют определенные правила принятия и отклонения нулевой и альтернативной гипотез. Поскольку статистический критерий – не только метод расчета числа, говорящего о различиях между распределениями, но и само это число, в задачи исследователя входит и правильная интерпретация полученного значения статистического критерия. Для того, чтобы определить, какая из двух гипотез верна, необходимо обратиться к таблицам значимости статистических критериев. В этих таблицах даются критические значения статистического критерия для соответствующего числа степеней свободы и уровня значимости. Например, если применялся t-критерий Стьюдента, а число степеней свободы было равно 20-ти, то необходимо найти значения t-критерия на 5%-ом и 1%-ом уровне значимости (2.09 и 2.85 соответственно). Если полученное эмпирическое значение окажется меньше, либо равняется критическому (табличному) значению на 5%-ом уровне, то необходимо признать верной нулевую гипотезу, если же выше, чем на 1%-ом уровне – альтернативную. В том случае, когда эмпирическое значение оказывается между двух критических, ни нулевую, ни альтернативную гипотезу принять нельзя, необходимо либо увеличить объем выборки, чтобы различия стали достоверны, либо воспользоваться другим критерием. Так обстоит дело с большинством критериев – чем выше число, тем достоверней различия между распределениями, и лишь в отношении некоторых критериев картина обратная (см. описания критериев).

Мощность критерия (1–) – это его способность выявлять различия, если они есть, т.е. его способность отклонить нулевую гипотезу об отсутствии различий, если она неверна.

Мощность критерия определяется эмпирическим путем. Для проверки одной и той же гипотезы можно использовать разные критерии, но при этом обнаруживается, что одни критерии выявляют различия, а другие – нет. Те критерии, которые обнаруживают различия, особенно на малых выборках, в то время как другие неспособны это сделать признаются более мощными, и это снижает, хотя это и не устраняет вероятности ошибочного вывода.

Статистический вывод связан с так называемыми ошибками I и II рода.

Ошибка, состоящая в том, что была отклонена нулевая гипотеза, в то время, как она верна, называется ошибкой I рода.

Ошибка, состоящая в том, что была принята нулевая гипотеза, в то время как она неверна, является ошибкой II рода.

Иначе говоря, это ошибки отвержения истинной гипотезы и принятия ложной.

Ниже представлено распределение истинных решений и возможных ошибок статистического вывода.

H0 верна

H1 неверна

H0 неверна

H1 верна

Отклонить H0

Принять H1

Ошибка I рода

Истинное решение



Принять H0

Отклонить H1

Истинное решение



Ошибка II рода

Распределение ошибок и истинных решений в зависимости от верности гипотез и решений исследователя.

Критерии принято делить на параметрические и непараметрические. Параметрическими критериями являются те, в формулу расчета которых входят параметры распределения – средние или дисперсии. Непараметрические критерии, в отличии от параметрических, основаны на использовании в их формулах частот, долей или рангов. Непараметрические критерии применимы к переменным выраженным в любых шкалах, а параметрические – только лишь к тем переменным, которые выраженны в шкалах интервалов или отношений.

И те, и другие критерии имеют свои преимущества и недостатки. В тех случаях, когда переменная измерена в шкале интервалов и ее распределение близко к нормальному, лучше пользоваться параметрическими критериями, т.к. они оказываются более мощными, чем непараметрические. Но в том случае, если эти условия не выполняются, более эффективными окажутся непараметрические критерии, так как им ''все равно'' в каких шкалах измерены переменные и соответствует распределение нормальному или нет. В ряде случаев непараметрическим критериям нет замены, особенно если признак определялся не количественно, а качественно.

До настоящего времени созданы десятки статистических критериев, которые существуют для решения довольно ограниченного круга задач. Создание статических критериев не является самоцелью, каждый из таких методов проверки гипотез имеет свои преимущества и недостатки, и в некоторых случаях может, а в некоторых – не может быть заменен другими критериями. Основанием для выбора критерия является не только его мощность, но и другие характеристики: простота вычисления, применимость к неравным по объему выборкам, применимость к нескольким выборкам сразу, возможность использования его для переменных, измеренных в разных шкалах, универсальность (возможность применения его к решению самых различных задач).

Все многообразие задач, с которыми приходится сталкиваться экспериментатору при проверке гипотез можно свести к нескольким группам:

  1. Выявление различий в распределении переменной в разных группах испытуемых;

  2. Проверка совпадения эмпирических результатов с ожидаемыми теоретическими;

  3. Обнаружение влияния фактора на распределение переменной;

  4. Обнаружение интересующего исследователя эффекта в одной или разных выборках испытуемых.

7.9. Выявление различий в распределении переменной в разных группах испытуемых. Эта задача выявления различий между мужчинами и женщинами, здоровыми и больными, представителями разных социальных групп, людьми разного возраста и т.д. в отношении их психологических особенностей.

t-критерий Стьюдента Это один из наиболее известных параметрических критериев, применяемый для определения того, относятся две выборки к одной генеральной совокупности или нет, или, по-другому, для установления того, насколько сильно различаются средние и дисперсии двух распределений:

Особенности его следующие:

  1. Может быть использован для установления различий между двумя выборками в уровне исследуемого признака, поскольку в его формулу обязательно входит разность средних арифметических двух выборок;

  2. Чем больше разность между средними арифметическими двух выборок, тем больше будет эмпирическое значение t-критерия и тем более вероятно обнаружение различий;

  3. Критерий позволяет сформулировать направленные гипотезы;

  4. Переменные должны быть измерены в шкалах интервалов или отношений и, по крайней мере, теоретически, подвержены норальному распределению;

  5. Выборки могут быть сколь угодно большими.

X

Y

97

99

25

1

103

98

1

0

92

98

100

0

101

97

1

1

105

100

9

4

106

95

16

9

99

99

9

1

94

98

64

0

93

98

81

0

109

49

110

64

115

169

Суммы

588

16

,

, t0.05 = 2.09, t0.01 = 2.86

Вывод: распределения X и Y статистически не различаются (или, по-другому, выборки относятся к одной генеральной совокупности), т.к. tэмп < t0.05 .

Проверка совпадения эмпирических результатов с ожидаемыми теоретическими - это стандартная психологическая задача, которая часто лежит в основе всех экспериментальнальных исследований. Например, эта задача является довольно традиционной при создании и адаптации психологических тестов, когда необходимо проверить насколько совпадает эмпирическое распределение тестового балла с нормальным распределением. Близкой, по сути, является и задача сопоставления двух эмпирических распределений, например, если необходимо сравнить распределения того же тестового балла в разных группах испытуемых. Можно аналогичным образом сравнивать распределение реакций одного испытуемого в разных условиях, и все это будет сравнением двух распределений: теоретического с эмпирическим или эмпирического с эмпирическим.

t-критерий Стьюдента предназначен только для сопоставления двух распределений, вне зависимости от решаемой исследователем задачи. Помимо этого критерия существуют еще и те, которые позволяют сопоставлять три, четыре и большее количество распределений, а также решать более сложные задачи. Многие ответы на вопросы могут быть получены и при комбинированном применении статистических критериев, а также в совокупности с другими методами математической статистики, что, как правило, рассматривается в специальных руководствах.

Единицы измерения статистических мер применяются при описании результатов исследований. Специалисту-психологу важно понимать не только в какой шкале и в каких единицах измерялся признак, но и в каких единицах измеряются статистические меры, чтобы перевести полученные результаты с языка математической статистики на язык своей науки. Ниже приводится таблица единиц измерения описанных в пособии статистических мер.

Единицы измерения статистических мер.

Статистические меры

Единицы измерения

Среднее арифметическое

Единицы признака

Медиана

Единицы признака

Мода

Единицы признака

Квантили распределения

Единицы признака

Размах

Единицы признака

Среднее отклонение

Единицы признака

Дисперсия

Квадрат единицы признака

Стандартное отклонение

Единицы признака

Стандартная оценка

Условные единицы

Асимметрия

Условные единицы

Эксцесс

Условные единицы

Коэффициенты корреляции

Все в условных единицах

Коэффициент регрессии

Условные единицы

Статистические критерии

Все в условных единицах

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]