Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Прикладная математика (практика)Мышкина7-27-1.doc
Скачиваний:
4
Добавлен:
22.08.2019
Размер:
1.28 Mб
Скачать

Факторный и кластерный анализ

Задача 3

Изучались отношения потребителей к посещению магазинов для покупки товаров. Маркетологи для опроса определили 6 переменных. Потребителей попросили выразить их степень согласия со следующими утверждениями по 7-ми бальной шкале (1- не согласен, 7 - согласен) (см. табл. 1):

В1- Посещение магазинов для покупки товаров-приятный процесс

В2- Посещение магазинов для покупки товаров плохо сказывается на вашем бюджете

В3- Я посещаю магазины для покупки товаров для питания вне дома

В4- Я стараюсь сделать лучшие покупки посещая магазины

В5- Мне нравится посещать магазины для покупки товаров

В6- Вы можете сэкономить много денег, сравнивая цены в разных магазинах

Таблица 1- Исходные данные

Номер р Респондента

B1

B2

B3

B4

B5

B6

FAC1_1

FAC2_1

1

6,00

4,00

7,00

3,00

2,00

3,00

1,21693

-,70013

2

2,00

3,00

1,00

4,00

5,00

4,00

-1,18257

-,39178

3

7,00

2,00

6,00

4,00

1,00

3,00

1,36679

-,91745

4

4,00

6,00

4,00

5,00

3,00

6,00

,16570

1,20031

5

1,00

3,00

2,00

2,00

6,00

4,00

-1,31820

-,97552

6

6,00

4,00

6,00

3,00

3,00

4,00

,87982

-,44608

7

5,00

3,00

6,00

3,00

3,00

4,00

,67664

-,71699

8

7,00

3,00

7,00

4,00

1,00

4,00

1,58178

-,41039

9

2,00

4,00

3,00

3,00

6,00

3,00

-1,01593

-,73939

10

3,00

5,00

3,00

6,00

4,00

6,00

-,44623

1,17737

11

1,00

3,00

2,00

3,00

5,00

3,00

-1,19238

-,94260

12

5,00

4,00

5,00

4,00

2,00

4,00

,67597

-,11963

13

2,00

2,00

1,00

5,00

4,00

4,00

-1,03883

-,36591

14

4,00

6,00

4,00

6,00

4,00

7,00

-,04123

1,68393

15

6,00

5,00

4,00

2,00

1,00

4,00

,98699

-,29756

16

3,00

5,00

4,00

6,00

4,00

7,00

-,24440

1,41302

17

4,00

4,00

7,00

2,00

2,00

5,00

,93964

-,42872

18

3,00

7,00

2,00

6,00

4,00

3,00

-,68392

,95580

19

4,00

6,00

3,00

7,00

2,00

7,00

,14240

2,04889

20

2,00

3,00

2,00

4,00

7,00

2,00

-1,46894

-1,02717

Факторный анализ

Факторный анализ-это класс методов, используемых, главным образом для сокращения числа переменных и их обобщения [166,с.718]. Этапы выполнения факторного анализа следующие:

1. Формулировка проблемы.

2. Построение корреляционной матрицы.

3. Определение метода факторного анализа.

4. Определение числа факторов.

5. Вращение факторов.

6. Интерпретация факторов, в том числе:

а) вычисление значений факторов;

б) отбор переменных имитаторов.

7. Определение подгонки модели.

Фактор представляет собой линейную комбинацию исходных переменных. Значение для i-го фактора можно вычислить по формуле

,

где Fi – оценка i – го фактора;

Xj – исходная j-я переменная;

Wij – весовой коэффициент j- ой переменной i-го фактора или коэффициент значения фактора;

В качестве переменных были взяты 6 высказываний, о которых респондентам предлагалось выразить степень своего согласия по 7-ми бальной шкале.

Факторный анализ был проведен по данным переменным и преследовал цель изучить отношение потребителей к посещению магазинов для покупки товаров.

Для проверки целесообразности проведения факторного анализа построена корреляционная матрица (табл.2). Считается, что если корреляции между всеми переменными меньше 0,5, факторный анализ бесполезен.

Факторный анализ был проведен по указанным выше переменным и преследовал две цели:

• cнизить количество переменных;

• обобщить эти переменные и использовать полученные значения факторов для интерпретации и профилирования кластеров, которые будут выделяться позднее.

Таблица 2- Корреляционная матрица

Посещение магазинов для покупки товаров приятный процесс

Посещение магазинов для покупки товаров плохо сказывается на вашем бюджете

Я посещаю магазины для покупки товаров для питания вне дома

Я стараюсь сделать лучшие покупки для посещения магазинов

Мне нравится посещать магазины для покупки товаров

Вы можете сэкономить много денег, сравнивая цены в разных магазинах

Корреляция

Посещение магазинов для покупки товаров приятный процесс

1,000

,026

,838

-,104

-,875

,019

Посещение магазинов для покупки товаров плохо сказывается на вашем бюджете

,026

1,000

-,054

,536

-,104

,556

Я посещаю магазины для покупки товаров для питания вне дома

,838

-,054

1,000

-,308

-,721

,041

Я стараюсь сделать лучшие покупки для посещения магазинов

-,104

,536

-,308

1,000

,022

,586

Мне нравится посещать магазины для покупки товаров

-,875

-,104

-,721

,022

1,000

-,203

Вы можете сэкономить много денег, сравнивая цены в разных магазинах

,019

,556

,041

,586

-,203

1,000

Знч. (односторон.)

Посещение магазинов для покупки товаров приятный процесс

,457

,000

,331

,000

,468

Посещение магазинов для покупки товаров плохо сказывается на вашем бюджете

,457

,411

,007

,332

,005

Я посещаю магазины для покупки товаров для питания вне дома

,000

,411

,093

,000

,432

Я стараюсь сделать лучшие покупки для посещения магазинов

,331

,007

,093

,464

,003

Мне нравится посещать магазины для покупки товаров

,000

,332

,000

,464

,196

Вы можете сэкономить много денег, сравнивая цены в разных магазинах

,468

,005

,432

,003

,196

Приближенное значение статистики хи квадрат равно 67,712 с 15-ю степенями свободы, она является значимой при уровне 0,05. Значение статистики КМО больше 0,5 и равно 0,554. Таким образом факторный анализ можно рассматривать как приемлемый метод для анализа корреляционной матрицы (см. табл. 3).

Таблица 3- Мера адекватности и критерий Бартлетта

Мера выборочной адекватности

Кайзера-Мейера-Олкина.

,554

Критерий сферичности Бартлетта

Приблиз. хи-квадрат

66,712

ст.св.

15

Знч.

,000

Факторный анализ реализуется посредством метода главных компонент, с использованием метода вращения варимакс.

Анализ главных компонент рекомендуется выполнять, если основная задача исследователя – определение минимального числа факторов, которые вносят максимальный вклад в дисперсию данных, чтобы в последующем использовать их в многомерном анализе. Эти факторы называют главными компонентами. Использование метода главных компонент при количественном описании микроучастков позволяет при проведении дальнейшего анализа этих данных ограничиться выделенными сжатыми факторами.

Таблица 4- Общности

Начальные

Извлеченные

Посещение магазинов для покупки товаров приятный процесс

1,000

,924

Посещение магазинов для покупки товаров плохо сказывается на вашем бюджете

1,000

,679

Я посещаю магазины для покупки товаров для питания вне дома

1,000

,858

Я стараюсь сделать лучшие покупки для посещения магазинов

1,000

,746

Мне нравится посещать магазины для покупки товаров

1,000

,873

Вы можете сэкономить много денег, сравнивая цены в разных магазинах

1,000

,735

Метод выделения: Анализ главных компонент.

Чтобы обобщить информацию, содержащуюся в исходных переменных лучше выделить небольшое число факторов. Для определения числа факторов использовалась процедура определения, основанного на собственных значениях факторов. В этом методе учитывают только факторы, собственные значения которых выше 1,0; остальные факторы в модель не включают. Собственные значения представляют значения дисперсии, обусловленные действием этого фактора. Следовательно, рассматривают факторы с дисперсией выше 1,0 (табл. 5).

Таблица 5- Полная объясненная дисперсия

Компонента

Начальные собственные

значения

Суммы квадратов нагрузок извлечения

Суммы квадратов нагрузок вращения

Всего

% дисперсии

Кумуля

тивный

%

Всего

% дисперсии

Кумуля

тивный %

Всего

% дисперсии

Кумуля

тивный %

1

2,664

44,407

44,407

2,664

44,407

44,407

2,663

44,379

44,379

2

2,150

35,831

80,238

2,150

35,831

80,238

2,152

35,859

80,238

3

,473

7,878

88,116

4

,433

7,216

95,332

5

,217

3,608

98,940

6

,064

1,060

100,000

Метод выделения: Анализ главных компонент.

В данном исследовании 6 определяющих переменных уменьшили до 2 факторов с собственными значениями выше единицы. В таблице 5 можно увидеть, что два собственных фактора имеют значения, превосходящие единицу. Следовательно, для анализа отобрано только два фактора. Первый фактор объясняет 44,407 % суммарной дисперсии, а второй фактор 35,831 %.

Строятся матрицы компонент главных и повернутых (табл.6,7). Важный результат факторного анализа – матрица факторных нагрузок, также называемая матрицей факторного отображения. Она содержит коэффициенты, используемые для выражения нормированных переменных через факторы. Эти коэффициенты, называемые факторными нагрузками, представляют корреляции между факторами и переменными. Коэффициент с высоким абсолютным значением показывает, что фактор и переменная тесно взаимосвязаны. Коэффициенты матрицы факторных нагрузок можно использовать для интерпретации факторов. Несмотря на то, что матрица исходных факторов указывает на взаимосвязь факторов и отдельных переменных, она редко приводит к факторам, которые можно интерпретировать, поскольку факторы коррелируют со многими переменными. Поэтому для устранения этого недостатка используют вращение матрицы, с помощью которого матрицу факторных коэффициентов преобразуют в более простую, которую легче интерпретировать. Самый распространенный метод вращения – метод варимакс (вращение, максимизирующее дисперсию). Это ортогональный метод вращения факторов (при вращении сохраняется прямоугольная система координат), который минимизирует число переменных с высоким значением нагрузок, усиливая тем самым интерпретируемость факторов. Повернутая матрица факторов приводится в таблице. Факторные нагрузки в ней понимаются как корреляционные коэффициенты между переменными и факторами. В данном анализе была использована матрица главных компонент для интерпретации факторов.

Таблица 6- Матрица компонент(a)

Компонента

1

2

Посещение магазинов для покупки товаров приятный процесс

,960

,042

Посещение магазинов для покупки товаров плохо сказывается на вашем бюджете

-,008

,824

Я посещаю магазины для покупки товаров для питания вне дома

,923

-,082

Я стараюсь сделать лучшие покупки для посещения магазинов

-,223

,834

Мне нравится посещать магазины для покупки товаров

-,915

-,190

Вы можете сэкономить много денег, сравнивая цены в разных магазинах

,064

,855

Метод выделения: Анализ методом главных компонент.

a Извлеченных компонент: 2

Таблица 7- Матрица повернутых компонент(a)

Компонента

1

2

Посещение магазинов для покупки товаров приятный процесс

,961

-,012

Посещение магазинов для покупки товаров плохо сказывается на вашем бюджете

,038

,823

Я посещаю магазины для покупки товаров для питания вне дома

,917

-,134

Я стараюсь сделать лучшие покупки для посещения магазинов

-,175

,845

Мне нравится посещать магазины для покупки товаров

-,924

-,138

Вы можете сэкономить много денег, сравнивая цены в разных магазинах

,112

,850

Метод вращения: Варимакс с нормализацией Кайзера.

a Вращение сошлось за 3 итераций.

Факторная нагрузка должна быть больше 0,4 для того, чтобы переменную, которой она принадлежит, можно было бы задействовать в дальнейшем анализе и интерпретации.

Для интерпретации факторов необходимо определить переменные, которые имеют высокие значения нагрузок по одному и тому же фактору. А затем этот фактор следует проанализировать с учетом этих переменных (табл.8).

Таблица 8- Интерпретация факторов

Фактор

Интерпретация (объясненный % дисперсии)

Нагрузка

Переменные, включенные в фактор

F1

44,407

0,960

Посещение магазинов для покупки товаров- это приятный процесс

0,923

Я посещаю магазины для покупки товаров для питания вне дома

F2

35,831

0,855

Вы можете сэкономить много денег, сравнивая цены в разных магазинах

0,834

Я стараюсь сделать лучшие покупки, посещая магазины

0,824

Посещение магазинов для покупки товаров плохо сказывается на вашем бюджете

Анализируя данную таблицу, видим, что переменная «Мне нравится посещать магазины для покупки товаров» никак не интерпретируется, так как факторная нагрузка данной переменной меньше 0,4.

Таким образом, можно назвать выделенные факторы:

F1- фактор любителей посещения магазинов

F2- фактор экономии