Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Игнатенко Статистическая оценка данных екологического мониторинга 2010.pdf
Скачиваний:
131
Добавлен:
16.08.2013
Размер:
2.09 Mб
Скачать

(рис. 4.4, г). Если такую зависимость описать квадратичной моделью, то соответствующая кривая может иметь экстремум, в данном случае – минимум в точке А, внутри диапазона варьирования фактора, который совершенно не соответствует физической картине явления. Поэтому следует уменьшить диапазон варьирования фактора, исключив его правую часть.

4.2.Метод наименьших квадратов для моделей

содной переменной

Рассмотрим случай варьирования единственного фактора Х1. Предположим, что эксперимент состоит в постановке N опытов, и в этих опытах фактор Х1 принимает значения Х11 , Х12 ,…, Х1N. Здесь Х1j значение фактора Х1 в опыте за номером j ( j = 1, 2, …, N). Выходная величина у принимает в этих опытах значения у1, у2,… уN соответственно. Отложим по оси абсцисс значения фактора Х1, принимаемые им в опытах, а по оси ординат – соответствующие значения у, получим совокупность точек, которые графически представлены на рис. 4.5.

уδ3= у3

δ1

у2

у1

0

Экспериментальныезначения у

– f(Х13 )

f(Х1)

δ3

у6

у4 у5

у3

δ2

X

Х11

Х12

Х13

Х14

Х15

Х16

Рис. 4.5. Качество аппроксимации экспериментальных значений

Цель эксперимента – получение

регрессионной зависимости

y = f(Х1), которая с достаточной точностью описала бы результаты эксперимента. Пусть требуется исследовать зависимость влажности поверхностного слоя почвы от температуры окружающей сре-

57

ды. Влажность почвы определяют методом взвешивания при разных значениях температуры окружающей среды. Тогда точки у1, у2, у3,… у6 на рис. 4.5 – это значения влажности почвы, измеренные при соответствующих температурах Х1i.

Закономерность изменения влажности в зависимости от изменения температуры окружающей среды получим на графике, если проведем сглаживающую кривую, лежащую возможно ближе к экспериментальным значениям у1. Однако на глаз такую кривую можно провести разными способами и, кроме того, помимо графика, для исследования и прогноза, необходима аналитическая зависимость исследуемых факторов. Все это заставляет обратиться к аналитическим методам построения регрессионной модели.

Конкретизируем приведенное выше требование, чтобы экспериментальные точки лежали в совокупности как можно ближе к кривой, являющейся графиком искомой зависимости. Допустим, что аналитическое представление зависимости уот Х1 уже каким-то образом получено в виде уравнения регрессии у = f(Х1). График зависимости у = f(Х1) – это искомая кривая (см. рис. 4.5).

Значениям фактора Х1, равным Х11, Х12,… Х1N, соответствуют точки на кривой ŷ1, ŷ2, ŷ3…, ŷN, рассчитанные по уравнению регрессии у = f(Х1).Эти точки являются значениями выходной величины исследуемого процесса:

ŷ1 = f(Х11),

 

ŷ2 = f(Х12),

 

………….

 

ŷN = f(Х1N).

(4.5)

Найдем величину δ1 = у1 – ŷ1 (рис. 3.5), которая характеризует отклонение результата эксперимента у1 в точке Х11 от значения функции отклика ŷ1 = f(Х11) в этой же точке. Аналогично рассмотрим отклонения δ 2 = у2 – ŷ2,…, δN = уN ŷN. Согласно методу наименьших квадратов (МНК), оценки для коэффициентов регрессии определяются из условия минимума суммы квадратов отклонений

Ф, т.е.

Φ = δ12 + δ22 +... 2N = ( y1 y1 )2 +(y2 y2 )2 +... +

58

N

 

= (y j y j )2 min.

(4.6)

j

По сформулированному требованию найдем формулы для вычисления коэффициентов регрессии в простейшем случае линейной

модели с единственным фактором Х1. Это модель вида

 

y = B0 + B1 X1.

(4.7)

Формулы (4.5) для данной модели примут соответствующий вид:

ŷ1 = B0 + B1X11;

ŷ2 = B0 + B1B12;

…………….

ŷN = B0 + B1B1N.

Подставим ŷ1, ŷ2, ŷ3…, ŷN в выражение (4.6)

Ф = (y1 B0 B1X11)2 + (y2 B0 B1X12)2 +…+ (yN B0 B1X1N)2.

Чтобы найти значения В0 и В1, при которых сумма Ф минимальна, возьмем производные от Ф по В0 и по В1 и приравняем их нулю:

ФВ0 = 2(y1 B0 B1 X11 )(1)+... + 2(yn B0 B1 X1n )(1)=0;

ФВ1 = 2(y1 B0 B1 X11 )(X11 )+... + 2(yn B0 B1 X1n )(X1n )=0.

После элементарных преобразований эти уравнения примут вид:

 

 

 

NB0 + B1(X11 + X12 +... + X1N ) = y1 + y2 +... + yN ;

 

 

 

B

(X

11

+ X

12

+... + X

1N

) + B

( X 2

+

X 2

+... + X

2

) +... + y

N

X

1N

0

 

 

 

1

11

 

12

1N

 

 

или короче

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

n

 

 

 

 

 

 

 

 

 

 

 

NB0 + B1 X1i

= yi ,

 

 

 

 

(4.8)

 

 

 

 

 

 

 

 

i=1

 

i=1

 

 

 

 

 

 

 

 

 

 

n

 

 

n

 

 

n

 

 

 

 

 

 

 

 

 

 

B0 X1i + B1 X12i = yi X1i .

 

 

 

 

 

 

 

 

 

 

i=1

 

i=1

 

i=1

 

 

 

 

 

Получена система из двух линейных уравнений с двумя неизвестными В0 и В1, n = N Она называется системой нормальных уравнений. Решая ее, придем к искомым формулам:

59

 

 

 

N

y

N

X 2

 

N

 

X

 

 

y

 

N

 

X

 

 

 

 

 

 

j

1 j

j

1 j

 

B

 

 

 

 

1 j

 

 

 

 

 

 

 

=

j=1

 

j=1

 

 

 

 

 

j=1

 

 

 

 

 

 

j=1

 

 

 

,

0

 

 

 

 

 

N

 

 

 

 

 

 

 

 

N

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N X12j

 

X1 j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j=1

 

 

 

 

 

j=1

 

 

 

 

 

 

(4.9)

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

N

 

 

 

N

 

 

 

 

 

 

 

 

 

X

 

y

 

 

y

 

X

 

 

 

 

 

 

 

N

1 j

j

j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 j

 

 

B

=

 

 

j=1

 

 

 

 

 

 

 

j=1

 

 

 

j=1

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

N

 

 

 

 

 

 

 

 

N

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N X12j

 

X1 j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j=1

 

 

 

 

 

j=1

 

 

 

 

 

 

 

Для придания системе (4.8) более симметричный вид введем фиктивный фактор Х0. Этот фактор не имеет физического смысла и в каждом опыте принимает одинаковые значения, равные +1:

Х01 = Х02 = … = Х0N = 1.

Теперь регрессионную модель (4.7) можно представить следующим образом: у = В0 Х0+ В1Х1, а систему (4.8) с введенным фиктивным фактором можно переписать в виде

N

N

 

N

 

B0 X02j + B1

X01 j X1 j = X0 j y j ,

 

j=1

j=1

 

j=1

(4.10)

N

 

N

N

 

 

B0 X0 j X1 j + B1

X12j = X1 j y j .

 

j=1

 

j=1

j=1

 

Из этой симметричной записи легко усвоить принцип составления системы нормальных уравнений (4.10).

Разберемся, на какие суммы умножаются коэффициенты регрессии В0 и В1 в левых частях каждого уравнения. В первом из них они суммируются по всем опытам произведения значений фиктивного фактора Х0 поочередно на значения факторов Х0 и Х1. Во втором уравнении стоят суммы произведений значений фактора Х1 на те же факторы Х0 и Х1. В правых частях уравнений стоят суммы произведений значений факторов (Х0 – в первом уравнении и Х1 – во втором) на значения выходной величины у. Для проверки вычисле-

60

ний следует иметь в виду, что при подстановке в уравнение (4.7) среднего арифметического значений фактора Х1:

 

 

N

X

 

X =

N ,

 

 

 

i

 

 

j=1

 

 

значение y должно получиться равным среднему арифметическо-

му значению уi:

 

 

 

 

 

 

 

 

 

 

 

N

y

 

 

 

y =

N ,

 

 

 

 

 

 

 

j

 

 

 

 

 

 

j=1

 

 

 

т.е. справедливо равенство

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

1 .

 

 

= B0 + B1 X

(4.11)

Если это равенство не применяется для проверки вычислений, то им можно воспользоваться для их упрощения. В самом деле, вычитая почленно из уравнения (4.7) равенство (4.11), получим уравнение регрессии в следующем виде

y

 

= B1 (X1

 

1 ).

(4.12)

y

X

В это уравнение входит уже только один коэффициент регрессии В1, а также средние

 

 

 

 

N

X

 

N ,

X =

 

 

 

 

 

 

j

 

 

 

 

 

j=1

 

 

 

 

 

 

 

N

 

 

 

 

 

=

y

 

N .

 

y

 

 

 

j=1

 

j

 

Пример. При исследовании влияния низкоинтенсивного электромагнитного излучения (1–5 мкВт/см2 с 10 минутной экспозицией, 9–10 ГГц) на прорастание семян ржи определялась длина корешка проращиваемого зерна у см. Каждый опыт повторялся на трех образцах, один образец представлялся 15-ю семенами ржи. Результаты эксперимента сведены в табл. 4.2.

В качестве отклика для каждого опыта рассмотрим среднее значение yi, полученное по трем образцам (при этом значение y для каждого образца определяется как среднее для 15 семян), которые приведены в пятом столбце табл. 4.2.

61

 

 

 

 

 

Таблица 4.2

 

Результаты эксперимента

 

 

 

 

 

 

 

 

 

 

 

 

Номер

Интенсивность

Номер

Длина ко-

yi,

 

ŷ1, см

опыта

излучения,

образца

решка, см

см

 

 

 

 

мкВт/см2

 

 

 

 

 

 

1

1,0

1

0,12

0,11

 

0,109

 

 

 

2

0,07

 

 

 

 

 

 

3

0,14

 

 

 

 

 

 

 

 

 

 

 

 

2

1,5

1

0,19

0,16

 

0,17

 

 

 

2

0,17

 

 

 

 

 

 

3

0,12

 

 

 

 

3

2,0

1

0,22

0,215

 

0,232

 

 

 

2

0,22

 

 

 

 

 

 

3

0,20

 

 

 

 

4

2,5

1

0,31

0,33

 

0,293

 

 

 

2

0,33

 

 

 

 

 

 

3

0,35

 

 

 

 

5

3,5

1

0,39

0,34

 

0,416

 

 

 

2

0,44

 

 

 

 

 

 

3

0,37

 

 

 

 

Регрессионную модель будем искать в виде линейного уравнения (4.7). Рассчитаем суммы, входящие в формулы (4.9), а также средние Х1ср и уср.:

5

X1 j =1 +1,5 + 2 + 2,5 + 3,5 =10,5 ;

j=1

 

5

 

 

 

X1 j

5 = 2,1;

 

j=1

 

 

5

 

 

 

X12j =12 +1,52

+ 22

+ 2,52 + 3,52 = 25,75 ;

j=1

5

y j = 0,11 + 0,16 + 0,215 + 0,33 + 0,4 =1,215 ;

j=1

62

 

 

 

5

 

 

y =

 

y j 5

= 0,243;

 

 

 

j=1

 

 

5

X1 j y j =1 0,11+1,5 0,16 + 2 0,215 + 2,5 0,33 +3,5 0,4 =3,005.

j=1

Воспользовавшись формулами (4.9), получим значения коэффициентов регрессии.

B0 = (1,215 25,75 3,005 10,5)(5 25,75 10,52 )= −0,014,

B1 =(5 3,005 1,215 10,5)18,5 = 0,123.

Проверим, выполняется ли равенство (4.11): yср = 0,243 ≈ – 0,014 + 0,123 2,1.

Это убеждает в правильности вычислений. Таким образом, результаты эксперимента описываются математической моделью

у = –0,014 + 0,123 Х1.

Всегда интересно знать, насколько точно полученная зависимость описывает результаты эксперимента. Простейшая проверка состоит в подстановке в уравнение регрессии значений фактора (факторов), соответствующих условиям каждого поставленного опыта. Вычисленные значения отклика ŷi сравниваются с экспериментальными значениями. Найденные из уравнения регрессии значения ŷi приведены в последнем столбце табл. 4.2. Сравнение их с результатами опытов свидетельствует об удовлетворительной точности регрессионной модели. Полная процедура статистического анализа уравнения регрессии будет приведена в п. 4.5.

Вычисления по формулам (4.9) существенно упрощаются, если фактор Х1 принимает равноотстоящие значения, т.е. Х12 = Х11 + h, Х13 = Х12 + h и т.д., где h – константа, называемая шагом. При этом

Х1ср = (Х11 + Х1N) /2 .

Коэффициент В1 для модели (4.12) вычисляют в этом случае по одной из двух приведенных ниже формул в зависимости от того, является ли число поставленных опытов N четным или нечетным [5]. Если N нечетно, то

B1

= (1 (hH1 ))[(yM +1 yM 1 )+ 2(yM +2

yM 2 )+... +

 

+(M 1)(yM +1 yM 1 )].

(4.13)

 

 

63

В формуле (4.13) М и H1 соответственно равны

 

 

M = (N +1) 2;

H1 = N (N 2 1)

12.

(4.14)

Если N четно, то

 

 

 

 

 

 

 

 

 

 

B =

1

[(y

M +1

y

M 1

)+3(y

M +2

y

M 2

)+... +

 

 

 

1

1hH1

 

 

 

 

(4.15)

 

 

 

 

 

 

 

 

 

 

+(N 1)(yN y1 )],

где М =N/2; H1 = N(N2 1)/12.

Обратимся теперь к вычислению коэффициентов квадратичной модели с единственным фактором Х1:

у = В0 + В1Х1 + В11Х12.

Для отыскания трех неизвестных коэффициентов регрессии В0, В1 и В11 надо решить следующую систему из трех линейных уравнений с тремя неизвестными:

 

N

N

N

NB0 + B1 X1 j + B11

X12j = y j ;

j=1

j=1

j=1

N

N

N

N

B0 X1 j + B1

X12j + B11 X13j = y j X1 j ;

j=1

j=1

j=1

j=1

N

N

N

N

B0 X12j + B1

X13j + B11 X14j = y j X1 j ;

j=1

j=1

j=1

j=1

Аналогично случаю линейной модели, вычисления коэффициентов регрессии значительно упростятся при равноотстоящих значениях факторов Х1. Математическую модель в этом случае удобно представить в виде

y = B11((X1

 

1 ) h)2 + B1((X1

 

1 ) h)+ B0,

(4.16)

X

X

где h – по-прежнему шаг варьирования фактора Х1, а коэффициенты B0, B1и B11вычисляются по следующим формулам [5].

При нечетном N:

B0'' = y (H1 / N )B11' ;

B1' =1 / H1 (y1 (1M )+ y2 (2 M )+.. + yN (N M ));

64

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]