Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
57
Добавлен:
28.04.2017
Размер:
143.36 Кб
Скачать

Литература

    • Радчикова Н.П. Компьютерная обработка психологической информации. Часть 2. – Мн., 2005.

    • Гусев А.Н., Измайлов Ч.А., Михалевская М.Б. Измерение в психологии: общий психологический практикум. – М.: Смысл, 1997.

    • Ермолаев О.Ю. Математическая статистика для психологов: Учебник/ - 2-е изд., испр. – М.: Московский психолого-социальный институт: Флинта, 2003.

Более подробное описание можно найти в книгах:

    • Иберла К. Факторный анализ. – М.: Статистика, 1980.

    • Окунь Я. Факторный анализ. – М.: Статистика, 1974.

    • Факторный, дискриминантный и кластерный анализ. – М.: Финансы и статистика, 1989.

Читатель с более солидной математической подготовкой может обратиться к книгам

    • Дубров А.М., Мхитарян В.С., Трошин Л.И. Многомерные статистические методы. - М.: Финансы и статистика, 2000.

    • Лоули Д., Максвелл А. Факторный анализ как статистический метод. – М.: Мир, 1967.

    • Суходольский Г.В. Основы математической статистики для психологов. – Изд-во Ленинградского ун-та, 1972.

    • Харман Г. Современный факторный анализ. – М.: Статистика, 1972.

Пример проведения факторного анализа

Сначала рассмотрим учебный пример, данные для которого есть в примерах программы STATISTICA.

    1. Прочитайте главу «Главные компоненты и факторный анализ» из электронного учебника по статистике.

    2. Откройте программу STATISTICA. В Statistica Module Switcher выберите модуль Factor Analysis. В модуле Factor Analysis откройте файл Factor.sta. В этом файле приведены некоторые измерения удовлетворенности испытуемых от деятельности на работе (WORK), в свободное время (HOBBY), дома (HOME) и общая удовлетворенность жизнью (MISCEL). Вы можете прочитать описание каждой переменной в окне Long name, два раза щелкнув мышкой на ее название. Считаем, что значения удовлетворенности получились в результате какого-то теста и больший балл выражает большую степень удовлетворенности.

    3. Начинаем анализ Analysis Resume Analysis…

    4. С помощью кнопки Variables выберем все переменные.

    5. Для ввода данных для факторного анализа в программе существует две возможности: 1) Raw data - "сырые" данные (это как раз наш случай, потому что в файле данных набраны значения переменных для каждого испытуемого) и 2) Correlation matrix - корреляционная матрица (если вы помните, ее можно было получить в модуле Basic Statistics при подсчете коэффициента корреляции Пирсона и сохранить для дальнейшего анализа). Так как в данном случае в файле находятся "сырые" данные, то в окошке Input file (входной файл) оставляем Raw data.

    6. MD deletion (missing data deletion) - функция, которая служит для выбора способа обработки пропусков (пропущенных значений). Она имеет три варианта: 1) Casewise - только данные тех испытуемых, которые совсем не содержат пропусков, будут использованы для анализа (этот вариант может сильно сократить число испытуемых в выборке); 2)Pairwise MD deletion - данные, содержащие пропуски, не используются для анализа только тех переменных, где эти пропуски есть, и используются во всех остальных случаях; 3) Mean substitution - пропуски заменяются на средние значения по данной переменной. В нашем случае пропусков нет, поэтому все равно, какой вариант выбрать - оставляем Casewise.

    7. Нажмите кнопку ОК и попадете в окно Define Method of Factor Extraction. Вверху окна (на белом фоне) описано то, что было проделано с вашими данными: как поступили с пропусками, сколько испытуемых было взято для подсчета и т.д.

    8. В разделе Extraction method (метод отбора) надо задать метод, который будет использоваться для нахождения факторов. Как правило берется метод главных компонент (principal components), поэтому можно смело оставить его по умолчанию.

    9. Рядом задается максимальное количество факторов, которое вы бы хотели выделить (Maximum no. of factors) и минимальное собственное значение, которое обычно равно 1 по критерию Кайзера (Minimum eigenvalue). Число факторов вы определяете произвольно, а собственное значение лучше оставим так, как есть. Так как у нас 10 переменных, давайте попробуем сократить их количество вдвое. Поставьте цифру "5" в окошке Maximum no. of factors. Нажмите кнопку ОК. Вы попадаете в окно Factor Analysis Results.

Рассмотрим, что интересного можно найти в результатах:

    1. Кнопка Eigenvalues (собственные значения) показывает нам 1) собственные значения факторов, которые были выделены; 2) процент объясненной дисперсии; 3) кумулятивные собственные значения и 4) кумулятивный процент объясненной дисперсии. В нашем случае выделилось два фактора, так как, видимо, остальные собственные значения оказались меньше 1. Определите, какой процент дисперсии объясняет наша модель с двумя факторами. В окно результатов можно вернуться с помощью кнопки Continue.

    2. Кнопка Scree plot (точечная диаграмма) нужна для просмотра графика критерия "каменистой осыпи". Нажмите ее и рассмотрите график. Определите, сколько надо взять факторов согласно этому критерию. В окно результатов можно вернуться с помощью кнопки Continue.

    3. Кнопка Communalities (общности) - это доли дисперсии отдельных переменных, принадлежащие общим факторам (и разделяемая с другими переменными). Дополнительной работой, стоящей перед исследователем при применении этой модели, является оценка общностей для каждой переменной, т.е. доли дисперсии, которая является общей для всех пунктов. Доля дисперсии, за которую отвечает каждый пункт, равна тогда суммарной дисперсии, соответствующей всем переменным, минус общность.

    4. Кнопка Reproduced/Residual corrs. Служит для дополнительной проверки достаточности выбранного количества факторов. Когда вы на нее нажмете, будет подсчитана корреляционная матрица, которая получилась бы, если бы действительно существовали только эти факторы. Она называется воспроизведенной матрицей (reproduced matrix). Чтобы проверить, насколько воспроизведенная матрица отличается от исходной, подсчитывается матрица остаточных корреляций (residual matrix), равная поэлементной разности исходной и воспроизведенной матриц. Вы действительно можете проверить это, посчитав корреляционную матрицу (кнопки Review corrs/means/SD Correlations) и сравнив ее с воспроизведенной матрицей. Их поэлементная разность даст вам матрицу остатков. Матрица остаточных корреляций может показывать несоответствия, т.е. определенные коэффициенты корреляции, которые не могут быть корректно воспроизведены при данном количестве факторов.

    5. Переходим к факторным нагрузкам. Первой следует нажимать кнопку Factor loadings (факторные нагрузки), если вы хотите посмотреть их до всякого вращения. Нажмите ее и рассмотрите, что получилось. Какие переменные вошли в первый фактор? Какие во второй? Вернитесь в окно результатов с помощью кнопки Continue.

    6. Чтобы картина прояснилась еще больше, нажмите кнопку Factor rotation Varimax normalized. Вы получите факторные нагрузки после вращения (вращение сделано с помощью метода нормализированного варимакса, так как он является наиболее популярным). Сравните результаты до и после вращения. Изменилось ли что-нибудь? Кроме варимакса есть и другие методы вращения. Попробуйте применить их и сравните результаты. Теперь попробуйте назвать получившиеся факторы.

    7. Кнопки Plot of Loadings, 2D и Plot of Loadings, 3D показывают диаграммы факторных нагрузок для двух- и трехмерного случаев.

    8. Кнопка Hierarchical factor analysis служит для выполнения иерархического факторного анализа, который выходит за рамки базового курса статистики для психологов. Краткое разъяснение этого метода можно найти в электронном учебнике.

    9. Кнопка Factor score coefficients нужна для подсчета коэффициентов факторных значений, которые вычисляются на основе факторных нагрузок и, в свою очередь, служат для вычисления факторных значений.

    10. Кнопка Factor scores показывает эти самые факторные значения, которые рассчитываются для каждого испытуемого по каждому фактору. Факторные значения лежат, как правило, в пределах от -3 до +3 и характеризуют положение испытуемого на шкале, задаваемой фактором. Предположим, что фактор 1 мы назвали "удовлетворением общественной жизнью". Испытуемый № 17 имеет низкое удовлетворение от своей общественной жизни, а испытуемый № 56 - высокое. ИМЕННО ПО ЭТИМ ЗНАЧЕНИЯМ И МОЖНО ДЕЛИТЬ ИСПЫТУЕМЫХ НА ГРУППЫ (например, группа довольных общественной жизнью и группа недовольных). То же самое и второму фактору, который однозначно представляет собой "удовлетворенность семейной жизнью". Испытуемый № 53 явно доволен своей семейной жизнью, а испытуемый № 37 - явно недоволен. Обратите внимание, что какой-либо опрошенный может быть доволен общественной жизнью, но недоволен семейной (например, №37) или доволен и общественной, и семейной жизнью (например, №32). Поэтому, имея два фактора, мы можем поделить испытуемых минимум на 4 группы:

Доволен общественной жизнью Доволен семейной жизнью

Доволен общественной жизнью Не доволен семейной жизнью

Не доволен общественной жизнью Доволен семейной жизнью

Всем недоволен

Следует помнить, что столь полезные факторные коэффициенты могут быть подсчитаны только если в качестве входного файла были взяты сырые данные. Если в качестве способа обработки пропусков был выбран режим Casewise или Pairwise MD deletion, то факторные коэффициенты будут подсчитаны только для случаев, не содержащих ни одного пропуска.

    1. Кнопка Save factor scores сохраняет факторные значения в отдельном файле.

    2. Кнопка Review corrs/means/SD служит для подсчета вспомогательной статистики - корреляционной матрицы, описательной статистики, диаграмм рассеяния и т.д.

    3. Кнопка Multiple Regression служит для подсчета множественной регрессии. Эту кнопку мы пока не трогаем, нам бы хоть с факторным анализом разобраться.

    4. Итак, мы научились делать факторный анализ на учебном примере. Для закрепления навыков сделайте еще один факторный анализ - на этот раз с тремя факторами. Оцените процент объясненной дисперсии. Посчитайте факторные нагрузки. Что изменилось? Назовите и объясните получившиеся факторы. Как вы думаете, сколько факторов все-таки стоит оставить - два или три?

15