Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Планирование и обработка эксперимента / Spirin - Metodi planirovaniya i obrabotki 2004.pdf
Скачиваний:
601
Добавлен:
13.05.2017
Размер:
7.84 Mб
Скачать

4. АНАЛИЗ РЕЗУЛЬТАТОВ ПАССИВНОГО ЭКСПЕРИМЕНТА…

Таким образом, истинное значение Z лежит в пределах Z1 ≤ Z ≤ Z2, где с вероятностью, например, 90%, Z1= -1,738-0,438= -2,176 и Z2= -1,738+0,438= -

1,300. Для заданных значений вероятностей значения Z1 и Z2 составят: 90%: Z1= – 2,176, Z2= –1,300;

95%: Z1= – 2,261, Z2= –1,215;

99,7%: Z1= – 2,539, Z2= –0,937.

Этим значениям Z1 и Z2 соответствуют коэффициенты корреляции, полу-

ченные из формулы (4.22). Чтобы определить численные значения коэффициентов корреляции из формулы (4.22), можно воспользоваться инструментом

«Подбор параметра» из электронных таблиц Microsoft Excel (меню «Сервис/Подбор параметра…»). В результате получим следующее решение:

90%: r1= -0,97, r2= -0,86, т.е. -0,97≤rxy≤-0,86;

95%: r1= -0,98, r2= -0,84, т.е. -0,98≤rxy≤-0,84; 99,7%: r1= -0,99, r2= -0,73, т.е. -0,99≤rxy≤-0,73.

Следовательно, доверительные интервалы подтверждают достаточно сильную причинную связь между анализируемыми параметрами.

Таким образом, корреляционный анализ устанавливает связь между исследуемыми случайными переменными и оценивает тесноту этой связи.

4.5. Регрессионный анализ

Ниже излагаются основные положения регрессионного анализа, приме-

нение которого для обработки результатов наблюдений связано с меньшим

числом ограничений, чем при корреляционном анализе. Как и корреляционный анализ, регрессионный анализ включает в себя построение уравнения регрессии, например, методом наименьших квадратов и статистическую оценку результатов. Если в регрессионном анализе расчет коэффициентов ведется теми же методами, например наименьших квадратов, то его теоретические предпосылки требуют других способов статистической оценки результатов.

При проведении регрессионного анализа примем следующие допущения:

1) входной параметр x измеряется с пренебрежимо малой ошибкой. Появление ошибки в определении y объясняется наличием в процессе не выяв-

136

4. АНАЛИЗ РЕЗУЛЬТАТОВ ПАССИВНОГО ЭКСПЕРИМЕНТА…

ленных переменных и случайных воздействий, не вошедших в уравнение рег-

рессии;

2)результаты наблюдений y1, y2,..., yi,..., yn над выходной величиной

представляют собой независимые нормально распределенные случайные величины;

3)при проведении эксперимента с объемом выборки n при условии, что

каждый опыт повторен m* раз, выборочные дисперсии S12,..., Si2,..., Sn2 должны быть однородны. При выполнении измерений в различных условиях возникает

задача сравнения точности измерений. При этом следует подчеркнуть, что экспериментальные данные можно сравнивать только тогда, когда их дисперсии однородны. Это означает, как уже отмечалось (см. п. 3.5.1 и 3.5.2), принадлеж-

ность экспериментальных данных к одной и той же генеральной совокупности.

Напомним: однородность дисперсий свидетельствует о том, что среди сравни-

ваемых дисперсий нет таких, которые с заданной надежностью превышали бы

все остальные, т.е. была бы большая ошибка. При одинаковом числе парал-

лельных опытов однородность дисперсии, как мы уже показали, можно оценить по критерию Кохрена, а для сравнения двух дисперсий целесообразно воспользоваться F-критерием Фишера (см. примеры 3.4–3.5).

После того как уравнение регрессии найдено, необходимо провести статистический анализ результатов. Этот анализ состоит в следующем: проверяется значимость всех коэффициентов и устанавливается адекватность уравнения.

137

4. АНАЛИЗ РЕЗУЛЬТАТОВ ПАССИВНОГО ЭКСПЕРИМЕНТА…

4.5.1. Проверка адекватности модели

При моделировании приходится формализовать связи исследуемого явления (процесса), из-за чего возможна потеря некоторой информации об объекте. Иногда некоторые связи не учитываются. В то же время основное требование к математической модели заключается в ее пригодности для решения поставленной задачи и адекватности процессу. Регрессионную модель называют адекватной, если предсказанные по ней значения у согласуются с результатами наблюдений. Так, построив модель в виде линейного уравнения регрессии, мы хотим, в частности, убедиться, что никакие другие модели не дадут значительного улучшения в описании предсказания значений у. В основе процедуры проверки адекватности модели лежат предположения, что случай-

ные ошибки наблюдений являются независимыми, нормально распределенными случайными величинами с нулевыми средними значениями и одинаковыми дисперсиями.

Сформулируем нуль-гипотезу Н0: "Уравнение регрессии адекватно".

Альтернативная гипотеза Н1: "Уравнение регрессии неадекватно".

Для проверки этих гипотез принято использовать F-критерий Фишера.

При этом общую дисперсию (дисперсию выходного параметра) Sy2 сравнивают с остаточной дисперсией Sy ост2.

Напомним, что

 

 

n

 

 

 

 

 

 

 

[ yi

 

]2

 

 

 

 

y

 

S y2

=

i=1

 

 

;

 

 

 

n 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

y)i ]2

 

S y2

 

=

[ yi

 

ост

 

i=1

 

 

 

,

 

n l

 

 

 

 

 

(4.24)

где l=k+1 – число членов аппроксимирующего полинома, а k – число факторов.

Так, например, для линейной зависимости (4.5) k=1, l=2.

В дальнейшем определяется экспериментальное значение F-критерия

138

4. АНАЛИЗ РЕЗУЛЬТАТОВ ПАССИВНОГО ЭКСПЕРИМЕНТА…

F = S y2 S y2

ост ,

(4.25)

который в данном случае показывает, во сколько раз уравнение регрессии

предсказывает результаты опытов лучше, чем среднее y = 1 n yi =C = const. n i=1

Если F>Fα;m1;m2, то уравнение регрессии адекватно. Чем больше значение F превышает Fα;m1;m2 для выбранного α и числа степеней свободы m1=n-1, m2=n-l, тем эффективнее уравнение регрессии.

Рассмотрим также случай, когда в каждой i-й точке xi для повышения надежности и достоверности осуществляется не одно, а m* параллельных измерений (примем для простоты, что m* одинаково для каждого фактора). Тогда число экспериментальных значений величины у составит nΣ=n m*.

В этом случае оценка адекватности модели производится следующим образом:

m*

1) определяется yi = yij m * – среднее из серии параллельных опытов

j=1

при x=xi, где yij – значение параметра у при x=xi в j-м случае;

2) рассчитываются значения параметра y)i по уравнению регрессии при

x=xi;

3) рассчитывается дисперсия адекватности

 

n

 

 

m* [

 

i y)i ]2

 

 

y

 

Sад2 =

i=1

,

n l

 

 

где n – число значений xi; l – число членов аппроксимирующего полинома (ко-

эффициентов bi), для линейной зависимости l=2;

4) определяется выборочная дисперсия Y при x=xi:

m*

[ yij yi ]2

Si2 =

j=1

 

;

 

m* 1

 

 

 

5) определяется дисперсия воспроизводимости

139