Добавил:

Studfiles2 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный электротехнический университет "ЛЭТИ"

Предмет:

Анализ и интерпретация данных

Файл:

Методы анализа больших массивов данных / bmd3.doc

Скачиваний:

Добавлен:

01.05.2014

Размер:

988.67 Кб

Скачать

☆

1 / 71 2 3 4 5 6 7 > Следующая >>>

62 Двоенко с.Д. Методы анализа бмд

3. Задача факторного анализа

3.1. Модель факторного анализа

Рассмотрим корреляционную матрицу R,полученную из матрицы данныхX, и рассмотрим несколько признаков. Наличие корреляции между ними можно понимать двояко: либо один из них определяет остальные, либо существует некоторый скрытый признак, не включенный в матрицу данных, оказывающий влияние на коррелированные признаки. Такие скрытые признаки называют общими факторами.

Основное предположение факторного анализа состоит в следующем: признаки из матрицы данных можно описать посредством небольшого числа общих факторов. Другими словами, сложные взаимосвязи между признаками определяются относительно более простой, скрытой за внешними проявлениями, структурой, отражающей наиболее характерные и часто повторяющиеся взаимосвязи.

Следовательно, предполагается, что каждый признак является функцией небольшого числа общих факторов и характерного фактора ,то есть где каждый из общих факторовоказывает влияние на все признаки, а характерный факторвлияет только на признак. Характерный фактор выражает специфичность признака, которая не зависит от общих факторов и не выражается через них.

В различных факторных моделях по-разному объясняется специфичность и накладываются различные ограничения на общие факторы.

Часто задача факторного анализа понимается как задача аппроксимации большой матрицы корреляций признаков меньшей матрицей факторных нагрузок или как задача аппроксимации матрицы исходных данных матрицей значений факторов на объектах. При таком подходе появляется возможность оценить как точность получаемого описания исходных данных, так и выигрыш, полученный при сжатии описания.

Предполагается, что факторная модель является линейной, т.е.

, где

- исходныйj-й признак, измеренный наN объектах;

- скрытыйk-й фактор, принимающий значения наNобъектах;

- характерный фактор;

- факторные нагрузки, характеризующие влияниеk-го фактора наj-й признак, составляющие матрицу, гдеn- число исходных признаковm- число общих факторов,.

Такую систему линейных уравнений называют факторным отображением, а факторные нагрузки - его элементами.

Рассмотрим содержательный смысл такой модели. Пусть признак измерен наi-ом объекте, т.е..

Рассмотрим психологический эксперимент, состоящий в выполнении испытуемыми ряда тестов. Тогда совокупность тестов образует совокупность исходных признаков. Значениями таких признаков на объектах являются оценки, получаемые испытуемыми за выполнение тестов. Рабочая гипотеза состоит в том, что индивидуальная оценка теста определяется:

а) способностями, необходимыми для его выполнения;

б) степенью выраженности этих способностей у данных испытуемых.

Если предположить, что способности - это общие некоррелированные факторы, то линейная модель интерпретируется следующим образом. Согласно формуле,

- оценка человекапри выполнении тестаj;

- степень выраженности у человекаспособностиk(значениеk-го фактора наiобъекте);

- степень проявленияkспособности вj-ом тесте ( нагрузкаk-го фактора вjтесте).

Если предположить, что k способность является решающей при выполненииjтеста, то нагрузкабудет положительной и высокой. Если одновременно человекв достаточной степени наделен этой способностью, то значениебудет также положительным и большим, а произведениевнесет существенный вклад в хорошую оценку выполнения теста.

Если предположить, что kспособность совершенно не нужна при выполнении теста, то нагрузкабудет нулевой. Если даже человекiщедро одарен этой способностью (значениеположительно и велико), произведениебудет нулевым. Это означает, что для данного человека и данного теста эта способность не влияет на оценку теста.

Предположение о линейности факторной модели является сильным упрощением реальных взаимодействий. Тем не менее такая модель экономична и часто является хорошим первым приближением реальных процессов.

Рассмотрим снова факторное отображение и вычислим корреляции признакас факторамии. Получим:

;

Такая система равенств называется факторной структурой, а ее левые части - ее элементами. Если общие факторы не коррелируют между собой и с характерными факторами, то элементы факторной структуры совпадают с элементами факторного отображения,.

Выразим структуру дисперсии признака через элементы факторного отображения в предположении, что все факторы и признакистандартизированы:

Если общие факторы не коррелируют между собой и с характерными факторами, то

Величина указывает долю дисперсии признака, приходящуюся наmобщих факторов, и называется общностью. Величинаопределяет вклад характерного фактора в дисперсию признака и называется характерностью.

1 / 71 2 3 4 5 6 7 > Следующая >>>

Соседние файлы в папке Методы анализа больших массивов данных

#
01.05.201460.93 Кб92BMD.DOC
#
01.05.2014731.14 Кб103BMD1.DOC
#
01.05.20141.19 Mб110bmd2.doc
#
01.05.2014988.67 Кб84bmd3.doc
#
01.05.20141.77 Mб94bmd4.doc