Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
lection.DOC
Скачиваний:
22
Добавлен:
23.08.2019
Размер:
2.5 Mб
Скачать

8. Дисперсионный анализ

8.1. Общие сведения. Дисперсионный анализ был разработан английским биологом и математиком Рональдом Фишером (1890-1962). Дисперсионный анализ (далее - ДА) – это статистический метод изучения влияния отдельных контролируемых факторов на изменчивость изучаемого признака. Необходимость в применении ДА возникает тогда, когда производится серия измерений какой-либо одной переменной в разных условиях, причем число условий должно быть больше двух (в противном случае данную задачу можно решить иными методами). Например, это могут быть несколько экспериментальных групп, различающихся по каким-либо признакам (возрасту, уровню образования, социальному положению и т.д.) участвующих в качестве испытуемых в одних и тех же условиях эксперимента. Это может быть одна и та же экспериментальная группа принимающая участие в эксперименте в разных экспериментальных условиях, например, простых, усложненных и очень сложных. Наконец, это могут быть несколько эксперименальных групп, принимающих участие в эксперименте с разными экспериментальными условиями, но при этом экспериментатор должен придерживаться гипотезы, что интериндивидуальные различия не оказывают влияния на вариативность результатов, которые, в свою очередь, могут зависеть только от условий эксперимента.

8.2. Виды переменных в ДА. Все переменные в ДА принято делить на два вида – независимые и зависимые переменные. Независимой переменной (фактором) называется контролируемая экспериментатором переменная. Независимыми переменными могут быть пол испытуемых, возраст, национальность, принадлежность к какой-либо социальной группе и т.д., поскольку именно по каким-либо различиям между испытуемыми будут сформированы экспериментальные группы. В качестве независимых переменных могут выступать и психологические переменные, такие как уровень развития интеллекта, свойства темперамента или характера, особенности эмоциональной сферы и т.д. Независимой переменной могут быть действия других людей, которым подвергаются испытуемые или условия проведения эксперимента. Независимую переменную принято делить на уровни. Уровни независимой переменной могут различаться как количественно, так и качественно. Уровнями независимой переменной может быть, например, уровень мотивации испытуемых (высокий, средний, низкий), уровень шума и его влияние на результативность деятельности и т.д, которые различаются лишь количественно. Уровни независимой переменной могут представлять собой не только градации какого-либо фактора. Уровнями независимой переменной могут быть, например, цвет стимулов, виды заболеваний, виды рекламы и т.д., которые различаются прежде всего качественно. В таком случае их правильнее будет называть условиями действия фактора или условиями эксперимента.

Зависимой переменной называется переменная, которая при ее измерении во время эксперимента подвергается влиянию независимой. Например, возраст испытуемых может влиять на уровень цветовой чувствительности (зависимая переменная), уровень интеллекта на скорость решения творческих задач, социальное положение на ценностные ориентации и т.д.

8.3. Виды ДА. Дисперсионный анализ принято делить на несколько видов согласно количеству независимых переменных: однофакторный ДА (одна независимая переменная), двухфакторный ДА (две независимых переменных), трехфакторный ДА (три независимых переменных) и мультифакторный ДА (больше трех независимых переменных). Обычно исследования ограничиваются применением только двух первых видов ДА, поскольку уже в трехфакторном ДА вычисления являются довольно громоздкими и часто требуют большого эмпирического материала. Но во всех видах ДА зависимая переменная остается только одна.

8.4. Структура данных в однофакторном и двухфакторном ДА. Обычная структура данных в однофакторном ДА может быть представлена в виде таблицы с J-количеством столбцов (см. рис.8.1) и n-количеством наблюдений в каждом столбце (причем их количество может быть разным), где столбцами являются условия эксперимента или уровни независимой переменной (в данном случае их четыре), а зависимая переменная представляет собой результаты измерения признака, где каждое отдельное значение обозначается как xi,j.

Независимая переменная (фактор)

1 уровень

2 уровень

3 уровень

4 уровень

X1,1

X1,2

X1,3

X1,4

X,2,1

X,2,2

X,2,3

X,2,4

X3,1

X3,2

X3,3

X3,4

X4,1

X4,2

X4,3

X4,4

X5,1

X5,2

X5,3

X5,4

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

Xn,1

Xn,2

Xn,3

Xn,4

Рис.8.1. Структура данных в однофакторном дисперсионном анализе

Структура данных в двухфакторном ДА отличается тем, что добавляется вторая независимая переменная со своими уровнями, которых также должно быть не менее двух. На рис.8.2. представлена таблица данных для двухфакторного дисперсионного анализа с I-количеством уровней фактора А (в данном случае их три), J-количеством уровней фактора Б (в данном случае их два) и k-наблюдениями в каждой ячейке, образованном сочетанием уровней переменных А и Б, причем количество наблюдений в каждой ячейке может быть различным.

ФАКТОР ''Б’’

1 УРОВЕНЬ

2 УРОВЕНЬ

X1,1,1

.

X1,2,1

.

X1,1,2

.

X1,2,2

.

1 УРОВЕНЬ

X1,1,3

.

X1,2,3

.

Ф

X1,1,4

.

X1,2,4

.

А

X1,1,5

X1,1,k

X1,2,5

X1,2,k

К

X2,1,1

.

X2,2,1

.

Т

X2,1,2

.

X2,2,2

.

О

2 УРОВЕНЬ

X2,1,3

.

X2,2,3

.

Р

X2,1,4

.

X2,2,4

.

X2,1,5

X2,1,k

X2,2,5

X2,2,k

''А''

X3,1,1

.

X3,2,1

.

X3,1,2

.

X3,2,2

.

3 УРОВЕНЬ

X3,1,3

.

X3,2,3

.

X3,1,4

.

X3,2,4

.

X3,1,5

X3,1,k

X3,2,5

X3,2,k

Рис.8.2. Структура данных в двухфакторном дисперсионном анализе

8.5. Задачи ДА. Главной задачей в однофакторном ДА является определение отношения вариативности (дисперсии), обусловленной действием независимой переменной (фактора) к случайной вариативности, обусловленной влиянием всех неизвестных факторов (т.н. F-отношение или F-критерий). Если это отношение превышает критическое значение, то тогда признается достоверным влияние независимой переменной на зависимую.

В двухфакторном ДА экспериментатор решает уже три задачи:

  1. Определение отношение вариативности обусловленной действием переменной А к случайной вариативности (Fэмп А);

  2. Определение отношение вариативности обусловленной действием переменной Б к случайной вариативности (Fэмп Б);

  3. Определение отношение вариативности обусловленной действием переменных А и Б к случайной вариативности (Fэмп АБ).

При этом может оказаться что:

  1. На вариативность результатов влияет только одна независимая переменная (т.е. либо Fэмп А, либо Fэмп Б превышает критическое значение, но Fэмп АБ не превышает);

  2. На вариативность результатов влияют обе независимые переменные, но взаимодействие переменных влияния не оказывает (т.е. они как бы ''нейтрализуют'' друг друга и следовательно: Fэмп А и Fэмп Б превышают критические значения, но Fэмп АБ не превышает);

  3. На вариативность результатов независимые переменные по отдельности не влияют, но их взаимодействие оказывает влияние (т.е. они как бы ''катализируют'' друг друга и следовательно: Fэмп А и Fэмп Б не превышают, а Fэмп АБ превышает критическое значение);

  4. На вариативность результатов влияет одна из переменных, и кроме того, обнаруживается влияние взаимодействия обеих переменных (либо Fэмп А, либо Fэмп Б превышает критическое значение, и Fэмп АБ также превышает);

  5. На вариативность результатов влияют как обе переменные, так и их взаимодействие (все три F-критерия превышают критическое значение);

  6. На вариативность результатов не влияет ни одна из переменных, и их взаимодействие также не оказывает никакого влияния (ни один из трех F-критериев не превышает критического значения).

8.6. Ограничения применения ДА. ДА можно применять только в том случае, когда переменная измерена в шкале интервалов или отношений, т.е. когда можно вычислить основные параметры распределения (средние и дисперсии). Кроме того, должно быть либо известно, либо доказано, что зависимая переменная подвержена нормальному распределению (в противном случае полученные выводы могут оказаться ложными). В двухфакторном ДА помимо перечисленнных требований обязательным условием является то, что факторы должны быть независимы друг от друга и количество их градаций также должно быть не меньше двух.

8.7. Модель для данных в ДА. Обычная линейная модель для данных в однофакторном ДА выглядит следующим образом:

, где

x – конкретное значение переменной,

– (греч. “мю”) генеральное среднее

A – доля отклонения переменной, обусловленная влиянием фактора А

e – ошибка наблюдения (случайное отклонение).

Для двухфакторного ДА эта модель будет:

, где

x – конкретное значение переменной,

– (греч. “мю”) генеральное среднее

A – доля отклонения переменной, обусловленная влиянием фактора А

B – доля отклонения переменной, обусловленная влиянием фактора B

AB – доля отклонения переменной, обусловленная взаимодействием факторов А и B

e – ошибка наблюдения (случайное отклонение)

8.8. Гипотезы в ДА. Нулевая гипотеза в однофакторном ДА будет утверждать, что средние значения исследуемого признака на всех уровнях независимой переменной одинаковы. Иначе говоря, независимая переменная не оказывает никакого влияния на зависимую и, следовательно, средние значения признака от уровня к уровню независимой переменной не меняются. Альтернативная гипотеза будет утверждать, что средние значения признака от уровня к уровню независимой переменной меняются (увеличиваются или уменьшаются), т.е. независимая переменная влияет на зависимую. Что касается двухфакторного дисперсионного анализа, то таких гипотез будет уже три: относительно влияния фактора А, фактора Б и взаимодействия факторов А и Б на зависимую переменную.

8.9. Порядок расчетов в однофакторном ДА. В однофакторном ДА необходимо найти F-критерий, который определяется по формуле:

, где

MSфакт – дисперсия, обусловленная влиянием фактора (“сумма квадратов между группами” (см. ниже) деленная на число степеней свободы между группами)

MSслуч – случайная дисперсия (“сумма квадратов внутри групп” деленная на число степеней свободы внутри групп)

и

, где

SSфакт – сумма квадратов отклонений случайной величины от общей средней (“сумма квадратов между группами”)

SSслуч – остаточная сумма квадратов (“сумма квадратов внутри групп”)

dfфакт­ – число степеней свободы между группами

dfслуч – число степеней свободы внутри групп

и

Из изложенного выше видно, что сумма квадратов между группами и сумма квадратов внутри групп составляют общую или полную сумму квадратов, которая определяется по формуле:

, т.е.

.

Однофакторный ДА, таким образом, представляет собой разложение общей суммы квадратов на две составляющие: обусловленную влиянием фактора и обусловленную случайными влияниями.

Пример вычисления F-критерия в однофакторном ДА:

Независимая переменная (фактор)

1 уровень

2 уровень

3 уровень

4 уровень

3

2

4

7

3

4

4

7

4

4

5

7

4

4

5

7

4

7

8

8

5

7

8

8

6

7

9

9

6

7

9

9

9

9

Вывод: Fэмп > Fкрит : влияние фактора достоверно

8.10. Порядок расчетов в двухфакторном ДА. В двухфакторном ДА необходимо подсчитать три F-критерия:

, , , где

MSA – дисперсия, обусловленная влиянием фактора A,

MSB – дисперсия, обусловленная влиянием фактора B,

MSAB – дисперсия, обусловленная влиянием взаимодействия факторов AB,

MSслуч – случайная дисперсия,

которые расчитываются следующим образом:

, , и , где:

SSA – сумма квадратов отклонений обусловленная фактором A,

SSB – сумма квадратов отклонений обусловленная фактором B,

SSAB – сумма квадратов отклонений обусловленная взаимодействием факторов A и B,

SSслуч – остаточная сумма квадратов.

Суммы квадратов вычисляются по следующим формулам:

Степени свободы подсчитываются по формулам:

, , ,

Пример вычисления F-критериев в двухфакторном ДА:

ФАКТОР ''Б’’

1 УРОВЕНЬ

2 УРОВЕНЬ

3

3

4

4

1 УРОВЕНЬ

4

4

Ф

4

5

А

К

4

5

4

5

Т

4

4

О

2 УРОВЕНЬ

4

4

Р

4

5

5

5

''А''

3

5

3

5

3 УРОВЕНЬ

4

5

5

5

Суммы по строкам

Суммы по столбцам

Критические значения:

Вывод: Поскольку из всех F-критериев только FB превышает критическое значение, то, следовательно, на вариативность результатов достоверно влияние только фактора ''Б''.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]