Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЧЕКАЛИН С.И. МЕТОДЫ ОБРАБОТКИ РЕЗУЛЬТАТОВ МАРКШ...doc
Скачиваний:
89
Добавлен:
20.08.2019
Размер:
14.29 Mб
Скачать

2.3. Дисперсионный анализ

Дисперсионный анализ основан на сравнении дисперсий нормально распределенных выборочных совокупностей. С помощью этого анализа проверяют т.н. гипотезу о равенстве средних исследуемых выборок. Для этого общую дисперсию Dобщ случайной величины разлагают на ряд составляющих (слагаемых), каждая из которых определяет свою долю влияния. Таким образом,

, (2.30)

где Di (i= 1, 2, ... n) – дисперсии влияющих факторов; Dост – остаточная дисперсия, которая обусловлена влиянием неучтенных факторов.

Дисперсии Di сравнивают с дисперсией Dост и устанавливают искомую степень влияния с использованием соответстсвующих критериев.

Формула (2.30) определяет т.н. многофакторный дисперсионный анализ, когда число исследуемых факторов большое. Следует заметить, что чем больше изучается факторов, тем сложнее решение задачи.

Часто решают задачу однофакторного дисперсионного анализа, когда рассматривается влияние только одного фактора. Простейшим из многофакторных анализов является двухфакторный дисперсионный анализ.

2.3.1. Однофакторный дисперсионный анализ

Предположим, что исследуются на равенство средних независимые выборки нормально распределенных случайных величин x1(i), x2(i), ... ,xj(i), ... , xk(i), где i – номер измерения (i = 1, 2, ... , n), а j – номер выборки (j = 1, 2, … , k).

По всем выборкам вычислены средние значения xo1, xo2, ... , xoj, ... , xok и стандарты σ1, σ2, … , σj, … , σk .

Необходимо проверить гипотезу о равенстве средних, т.е. проверить, что

xo1 = xo2 = ... = xoj = ... = xok = xo , где xo – общее среднее по всем выборкам (математическое ожидание среднего по группе выборок).

Для решения указанной задачи составляют статистическую таблицу (табл. 2.5).

Таблица 2.5

Статистическая таблица однофакторного дисперсионного анализа

Значение фактора xj(i)

x1(i)

x2(i)

...

xj(i)

...

xk(i)

x1(1)

x1(2)

...

x1(i)

x1(n)

x2(1)

x2(2)

x2(i)

x2(n)

...

...

...

xj(1)

xj(2)

xj(i)

xj(n)

...

...

...

xk(1)

xk(2)

xk(i)

xk(n)

xo1

xo2

...

xoj

...

xok

По каждому столбцу таблицы определяют среднее значение

. (2.31)

Оценку общей дисперсии совокупности выборок вычисляют по формуле

, (2.32)

в которой

(2.33)

является общей средней по всем выборкам.

Оценка дисперсии по факторам определяется по формуле

, (2.34)

а оценку остаточной дисперсии – по формуле

. (2.35)

Составляют отношение

, (2.36)

определяющее степень влияния Dост на Dобщ .

Указанное отношение имеет F-распределение с числом степеней свободы (nk) и k(n – 1).

Можно составить также и отношение

, (2.37)

определяющее степень влияния каждой из дисперсий Dj, для F-распределения которого число степеней свободы равно (k - 1) и k(n – 1).

Если выбрать критическую величину Fα (по уровню значимости α), то по специальным таблицам F-распределения для разных совокупностей степеней свободы можно будет сопоставить F1 и F2 с критическим значением Fα . Если F1(2) < Fα , то принимают гипотезу о равенстве средних. Если же F1(2) > Fα , то гипотезу о равенстве средних отвергают и принимают альтернативную ей гипотезу о неравенстве средних, т.е. делают заключение о том, что различия между средними исследуемых выборочных совокупностей носят несучайный характер.

Пример 2.9. Проверить гипотезу о равенстве средних для выборок, представляющих собой значения содержания полезного ископаемого по разведочным линиям РЛ№6, РЛ№7 и РЛ№8 (см. табл. 1.1).

Решение.

Составим статистическую таблицу для значений содержания выборок по указанным разведочным линиям.

Таблица 2.6

Статистическая таблица к примеру 2.9

j

i

Значение содержания, С (г/м3)

РЛ№6

РЛ№7

РЛ№8

1

64

72

136

2

264

272

226

3

487

307

243

4

371

736

511

5

652

388

441

6

781

291

393

7

578

342

468

8

848

273

385

9

524

172

238

10

217

157

106

n = 10

Coj

478,6

301,0

314,7

Co

364,72

Примечание: дальнейшая обработка приведенных выборок выполняется при условии, что все они подчиняются нормальному закону распределения.

Вычисляем по фомуле (2.31) средние значения содержания по каждой выборке и по формуле (2.33) – среднее значение содержания по всем выборкам.

По формуле (2.32) находим значение общей дисперсии:

.

Вычисляем оценку дисперсии по факторам по формуле (2.34):

.

Находим по фомуле (2.25) значение остаточной дисперсии:

.

Вычисляем по формулам (2.36) и (2.37) статистики F1 и F2:

; .

По таблице приложения 8 интерполированием определяем критические значения статистики F для соответствующих степеней свободы статистик F1кр(29;27) = 1,99 и F2кр(2;27) = 3,36.

Поскольку значения F1 и F2 меньше их критических значений, то принимаем гипотезу о равенстве средних исследуемых выборок. Следовательно, можно принять, что исследуемые выборки принадлежат одной генеральной совокупности.

Если выборки имеют разные объемы n(n1, n2, …), то задача решается аналогично, но с учетом числа степеней свободы в выражениях для Dобщ и Dост : (n1 + n2 + ...+ nn – 1) и (k – 1).

Приведем для указанного случая пример на проверку равенства средних.

Пример 2.10. При испытании пяти геодезических приборов (А, Б, В, Г, Д) одного класса точности каждым из них был измерен базис длиной 736,746 м разными числами приемов (см. табл. 2.7). Выполнить проверку гипотезы о равенстве средних, т.е. установить, что все приборы относятся к одному классу точности.

Таблица 2.7

К примеру 2.10

j→

i↓

Значение измеренного базиса 736700 мм + хi (хi в мм)

А

Б

В

Г

Д

1

56

48

54

45

44

2

47

52

42

47

54

3

43

44

54

46

48

4

50

50

47

53

49

5

53

45

48

52

50

6

48

53

47

49

7

47

45

8

44

N = 32

nA = 6

nБ = 5

nВ = 8

nГ = 7

nД = 6

xoj

49,5

47,8

48,6

47,9

49,0

Решение.

Вычисляем по формуле (2.31) средние значения по столбцам (xoj).

Вычисляем общее среднее всей совокупности выборок по формуле (2.33): хо = 48,6 мм.

Вычисляем общую дисперсию по формуле (2.32), учитывая, что в знаменателе этой формулы должно быть число (N – 1), где N = 32:

Вычисляем оценку дисперсии по факторам по формуле

. (2.38)

Получим:

.

По фомуле (2.35) получаем значение остаточной дисперсии:

знаменатель которой равен (Nk).

Вычисляем по формулам (2.36) и (2.37) статистики F1 и F2:

; .

По таблице приложения 8 интерполированием определяем критические значения статистики F для соответствующих степеней свободы статистик F1кр(31;27) = 1,92 и F2кр(4;27) = 2,74.

Поскольку значения F1 и F2 меньше их критических значений, то принимаем гипотезу о равенстве средних исследуемых выборок. Следовательно, можно принять, что исследуемые приборы соответствуют одному классу точности.