- •1.3. Расчет доверительного интервала
- •1.6. Проверка гипотезы об однородности
- •1.7. Проверка однородности нескольких дисперсий,
- •1.8. Проверка однородности нескольких дисперсий,
- •3. ОСНОВНЫЕ ПОНЯТИЯ И ЗАДАЧИ
- •ЭКСПЕРИМЕНТАЛЬНЫХ ИССЛЕДОВАНИЙ
- •3.1. Активные и пассивные, однофакторные
- •4.1. Основные виды математических моделей,
- •4.2. Метод наименьших квадратов для моделей
- •4.3. Метод наименьших квадратов для многофакторных
- •4.4. Об интервале съема данных и продолжительности
- •4.6. Пример обработки результатов экспериментальных
- •1.2. Статистические оценки результатов наблюдений
- •1.4. Определение необходимого объема выборки
- •1.5. Отбрасывание сомнительных наблюдений
- •1.9. Проверка однородности средних
- •1.10. Проверка нормальности распределения
- •1.11. Коэффициент корреляции
- •1.12. Ранговая корреляция
- •3.1. Активные и пассивные, однофакторные
- •3.2. Основные задачи планирования эксперимента
- •4.2. Метод наименьших квадратов для моделей
- •Случай линейной регрессионной модели с k варьируемыми факторами. Регрессионная модель здесь имеет вид (4.2). Значения факторов, принимаемые в каждом опыте, можно свести в табл. 4.3.
- •Обобщение МНК на случай регрессионных моделей произвольного вида, линейных по параметрам. Рассмотренное выше обобщение МНК применимо и для регрессионных моделей произвольного вида при условии, что коэффициенты регрессии входят в них линейно. Так, модель
- •4.5. Статистический анализ уравнения регрессии
- •Изучим сначала случай отсутствия дублированных опытов в основном эксперименте.
- •Последовательность действий исследователя при проведении эксперимента с целью построения регрессионной модели объекта.
- •7. КОНТРОЛЬНОЕ ЗАДАНИЕ
- •СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ
(рис. 4.4, г). Если такую зависимость описать квадратичной моделью, то соответствующая кривая может иметь экстремум, в данном случае – минимум в точке А, внутри диапазона варьирования фактора, который совершенно не соответствует физической картине явления. Поэтому следует уменьшить диапазон варьирования фактора, исключив его правую часть.
4.2.Метод наименьших квадратов для моделей
содной переменной
Рассмотрим случай варьирования единственного фактора Х1. Предположим, что эксперимент состоит в постановке N опытов, и в этих опытах фактор Х1 принимает значения Х11 , Х12 ,…, Х1N. Здесь Х1j – значение фактора Х1 в опыте за номером j ( j = 1, 2, …, N). Выходная величина у принимает в этих опытах значения у1, у2,… уN соответственно. Отложим по оси абсцисс значения фактора Х1, принимаемые им в опытах, а по оси ординат – соответствующие значения у, получим совокупность точек, которые графически представлены на рис. 4.5.
уδ3= у3
δ1 |
у2 |
у1
0
Экспериментальныезначения у
– f(Х13 )
f(Х1)
δ3
у6
у4 у5
у3
δ2
X
Х11 |
Х12 |
Х13 |
Х14 |
Х15 |
Х16 |
Рис. 4.5. Качество аппроксимации экспериментальных значений |
|||||
Цель эксперимента – получение |
регрессионной зависимости |
y = f(Х1), которая с достаточной точностью описала бы результаты эксперимента. Пусть требуется исследовать зависимость влажности поверхностного слоя почвы от температуры окружающей сре-
57
ды. Влажность почвы определяют методом взвешивания при разных значениях температуры окружающей среды. Тогда точки у1, у2, у3,… у6 на рис. 4.5 – это значения влажности почвы, измеренные при соответствующих температурах Х1i.
Закономерность изменения влажности в зависимости от изменения температуры окружающей среды получим на графике, если проведем сглаживающую кривую, лежащую возможно ближе к экспериментальным значениям у1. Однако на глаз такую кривую можно провести разными способами и, кроме того, помимо графика, для исследования и прогноза, необходима аналитическая зависимость исследуемых факторов. Все это заставляет обратиться к аналитическим методам построения регрессионной модели.
Конкретизируем приведенное выше требование, чтобы экспериментальные точки лежали в совокупности как можно ближе к кривой, являющейся графиком искомой зависимости. Допустим, что аналитическое представление зависимости уот Х1 уже каким-то образом получено в виде уравнения регрессии у = f(Х1). График зависимости у = f(Х1) – это искомая кривая (см. рис. 4.5).
Значениям фактора Х1, равным Х11, Х12,… Х1N, соответствуют точки на кривой ŷ1, ŷ2, ŷ3…, ŷN, рассчитанные по уравнению регрессии у = f(Х1).Эти точки являются значениями выходной величины исследуемого процесса:
ŷ1 = f(Х11), |
|
ŷ2 = f(Х12), |
|
…………. |
|
ŷN = f(Х1N). |
(4.5) |
Найдем величину δ1 = у1 – ŷ1 (рис. 3.5), которая характеризует отклонение результата эксперимента у1 в точке Х11 от значения функции отклика ŷ1 = f(Х11) в этой же точке. Аналогично рассмотрим отклонения δ 2 = у2 – ŷ2,…, δN = уN – ŷN. Согласно методу наименьших квадратов (МНК), оценки для коэффициентов регрессии определяются из условия минимума суммы квадратов отклонений
Ф, т.е.
Φ = δ12 + δ22 +... +δ2N = ( y1 − y1 )2 +(y2 − y2 )2 +... +
58
N |
|
= ∑(y j − y j )2 → min. |
(4.6) |
j
По сформулированному требованию найдем формулы для вычисления коэффициентов регрессии в простейшем случае линейной
модели с единственным фактором Х1. Это модель вида |
|
y = B0 + B1 X1. |
(4.7) |
Формулы (4.5) для данной модели примут соответствующий вид:
ŷ1 = B0 + B1X11;
ŷ2 = B0 + B1B12;
…………….
ŷN = B0 + B1B1N.
Подставим ŷ1, ŷ2, ŷ3…, ŷN в выражение (4.6)
Ф = (y1 – B0 – B1X11)2 + (y2 – B0 – B1X12)2 +…+ (yN – B0 – B1X1N)2.
Чтобы найти значения В0 и В1, при которых сумма Ф минимальна, возьмем производные от Ф по В0 и по В1 и приравняем их нулю:
∂Ф∂В0 = 2(y1 − B0 − B1 X11 )(−1)+... + 2(yn − B0 − B1 X1n )(−1)=0;
∂Ф∂В1 = 2(y1 − B0 − B1 X11 )(−X11 )+... + 2(yn − B0 − B1 X1n )(−X1n )=0.
После элементарных преобразований эти уравнения примут вид:
|
|
|
NB0 + B1(X11 + X12 +... + X1N ) = y1 + y2 +... + yN ; |
|
|
|
||||||||||
B |
(X |
11 |
+ X |
12 |
+... + X |
1N |
) + B |
( X 2 |
+ |
X 2 |
+... + X |
2 |
) +... + y |
N |
X |
1N |
0 |
|
|
|
1 |
11 |
|
12 |
1N |
|
|
||||||
или короче |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
n |
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
NB0 + B1 ∑X1i |
= ∑yi , |
|
|
|
|
(4.8) |
||||
|
|
|
|
|
|
|
|
i=1 |
|
i=1 |
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
n |
|
|
n |
|
|
|
|
|
|
|
|
|
|
B0 ∑X1i + B1 ∑X12i = ∑yi X1i . |
|
|
|
|
|
||||||
|
|
|
|
|
i=1 |
|
i=1 |
|
i=1 |
|
|
|
|
|
Получена система из двух линейных уравнений с двумя неизвестными В0 и В1, n = N Она называется системой нормальных уравнений. Решая ее, придем к искомым формулам:
59
|
|
|
N |
y |
N |
X 2 |
− |
|
N |
|
X |
|
|
y |
|
N |
|
X |
|
|
|
||||||
|
|
|
∑ |
j ∑ |
∑ |
1 j |
j ∑ |
1 j |
|
||||||||||||||||||
B |
|
|
|
|
1 j |
|
|
|
|
|
|
|
|||||||||||||||
= |
j=1 |
|
j=1 |
|
|
|
|
|
j=1 |
|
|
|
|
|
|
j=1 |
|
|
|
, |
|||||||
0 |
|
|
|
|
|
N |
|
|
|
|
|
|
|
|
N |
|
|
|
|
2 |
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
N ∑X12j |
− |
|
∑X1 j |
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
j=1 |
|
|
|
|
|
j=1 |
|
|
|
|
|
|
(4.9) |
||||||||
|
|
|
|
|
|
N |
|
|
|
|
|
|
|
|
N |
|
|
|
N |
|
|
|
|
||||
|
|
|
|
|
X |
|
y |
|
− |
|
y |
|
X |
|
|
|
|||||||||||
|
|
|
|
N |
∑ |
1 j |
j |
∑ |
j |
∑ |
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 j |
|
||||||||||||
|
B |
= |
|
|
j=1 |
|
|
|
|
|
|
|
j=1 |
|
|
|
j=1 |
|
|
|
|
. |
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
1 |
|
|
|
|
N |
|
|
|
|
|
|
|
|
N |
|
|
|
|
2 |
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
N ∑X12j |
− |
|
∑X1 j |
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
j=1 |
|
|
|
|
|
j=1 |
|
|
|
|
|
|
|
Для придания системе (4.8) более симметричный вид введем фиктивный фактор Х0. Этот фактор не имеет физического смысла и в каждом опыте принимает одинаковые значения, равные +1:
Х01 = Х02 = … = Х0N = 1.
Теперь регрессионную модель (4.7) можно представить следующим образом: у = В0 Х0+ В1Х1, а систему (4.8) с введенным фиктивным фактором можно переписать в виде
N |
N |
|
N |
|
B0 ∑X02j + B1 |
∑X01 j X1 j = ∑X0 j y j , |
|
||
j=1 |
j=1 |
|
j=1 |
(4.10) |
N |
|
N |
N |
|
|
|
|||
B0 ∑X0 j X1 j + B1 |
∑X12j = ∑X1 j y j . |
|
||
j=1 |
|
j=1 |
j=1 |
|
Из этой симметричной записи легко усвоить принцип составления системы нормальных уравнений (4.10).
Разберемся, на какие суммы умножаются коэффициенты регрессии В0 и В1 в левых частях каждого уравнения. В первом из них они суммируются по всем опытам произведения значений фиктивного фактора Х0 поочередно на значения факторов Х0 и Х1. Во втором уравнении стоят суммы произведений значений фактора Х1 на те же факторы Х0 и Х1. В правых частях уравнений стоят суммы произведений значений факторов (Х0 – в первом уравнении и Х1 – во втором) на значения выходной величины у. Для проверки вычисле-
60
ний следует иметь в виду, что при подстановке в уравнение (4.7) среднего арифметического значений фактора Х1:
|
|
N |
X |
|
X = |
∑ |
N , |
||
|
|
|
i |
|
|
|
j=1 |
|
|
значение y должно получиться равным среднему арифметическо-
му значению уi: |
|
|
|
|
|
|
||||
|
|
|
|
|
N |
y |
|
|
||
|
y = |
∑ |
N , |
|
||||||
|
|
|
|
|
|
j |
|
|||
|
|
|
|
|
j=1 |
|
|
|
||
т.е. справедливо равенство |
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
||||
|
|
y |
1 . |
|||||||
|
|
= B0 + B1 X |
(4.11) |
Если это равенство не применяется для проверки вычислений, то им можно воспользоваться для их упрощения. В самом деле, вычитая почленно из уравнения (4.7) равенство (4.11), получим уравнение регрессии в следующем виде
y − |
|
= B1 (X1 − |
|
1 ). |
(4.12) |
y |
X |
В это уравнение входит уже только один коэффициент регрессии В1, а также средние
|
|
|
|
N |
X |
|
N , |
X = |
∑ |
|
|||||
|
|
|
|
|
j |
|
|
|
|
|
|
j=1 |
|
|
|
|
|
|
|
N |
|
|
|
|
|
= |
∑y |
|
N . |
||
|
y |
||||||
|
|
|
j=1 |
|
j |
|
Пример. При исследовании влияния низкоинтенсивного электромагнитного излучения (1–5 мкВт/см2 с 10 минутной экспозицией, 9–10 ГГц) на прорастание семян ржи определялась длина корешка проращиваемого зерна у см. Каждый опыт повторялся на трех образцах, один образец представлялся 15-ю семенами ржи. Результаты эксперимента сведены в табл. 4.2.
В качестве отклика для каждого опыта рассмотрим среднее значение yi, полученное по трем образцам (при этом значение y для каждого образца определяется как среднее для 15 семян), которые приведены в пятом столбце табл. 4.2.
61
|
|
|
|
|
Таблица 4.2 |
||
|
Результаты эксперимента |
|
|
|
|
||
|
|
|
|
|
|
|
|
Номер |
Интенсивность |
Номер |
Длина ко- |
yi, |
|
ŷ1, см |
|
опыта |
излучения, |
образца |
решка, см |
см |
|
|
|
|
мкВт/см2 |
|
|
|
|
|
|
1 |
1,0 |
1 |
0,12 |
0,11 |
|
0,109 |
|
|
|
2 |
0,07 |
|
|
|
|
|
|
3 |
0,14 |
|
|
|
|
|
|
|
|
|
|
|
|
2 |
1,5 |
1 |
0,19 |
0,16 |
|
0,17 |
|
|
|
2 |
0,17 |
|
|
|
|
|
|
3 |
0,12 |
|
|
|
|
3 |
2,0 |
1 |
0,22 |
0,215 |
|
0,232 |
|
|
|
2 |
0,22 |
|
|
|
|
|
|
3 |
0,20 |
|
|
|
|
4 |
2,5 |
1 |
0,31 |
0,33 |
|
0,293 |
|
|
|
2 |
0,33 |
|
|
|
|
|
|
3 |
0,35 |
|
|
|
|
5 |
3,5 |
1 |
0,39 |
0,34 |
|
0,416 |
|
|
|
2 |
0,44 |
|
|
|
|
|
|
3 |
0,37 |
|
|
|
|
Регрессионную модель будем искать в виде линейного уравнения (4.7). Рассчитаем суммы, входящие в формулы (4.9), а также средние Х1ср и уср.:
5
∑X1 j =1 +1,5 + 2 + 2,5 + 3,5 =10,5 ;
j=1
|
5 |
|
|
|
∑X1 j |
5 = 2,1; |
|
|
j=1 |
|
|
5 |
|
|
|
∑X12j =12 +1,52 |
+ 22 |
+ 2,52 + 3,52 = 25,75 ; |
j=1
5
∑y j = 0,11 + 0,16 + 0,215 + 0,33 + 0,4 =1,215 ;
j=1
62
|
|
|
5 |
|
|
y = |
|
∑y j 5 |
= 0,243; |
||
|
|
|
j=1 |
|
|
5
∑X1 j y j =1 0,11+1,5 0,16 + 2 0,215 + 2,5 0,33 +3,5 0,4 =3,005.
j=1
Воспользовавшись формулами (4.9), получим значения коэффициентов регрессии.
B0 = (1,215 25,75 −3,005 10,5)(5 25,75 −10,52 )= −0,014,
B1 =(5 3,005 −1,215 10,5)18,5 = 0,123.
Проверим, выполняется ли равенство (4.11): yср = 0,243 ≈ – 0,014 + 0,123 2,1.
Это убеждает в правильности вычислений. Таким образом, результаты эксперимента описываются математической моделью
у = –0,014 + 0,123 Х1.
Всегда интересно знать, насколько точно полученная зависимость описывает результаты эксперимента. Простейшая проверка состоит в подстановке в уравнение регрессии значений фактора (факторов), соответствующих условиям каждого поставленного опыта. Вычисленные значения отклика ŷi сравниваются с экспериментальными значениями. Найденные из уравнения регрессии значения ŷi приведены в последнем столбце табл. 4.2. Сравнение их с результатами опытов свидетельствует об удовлетворительной точности регрессионной модели. Полная процедура статистического анализа уравнения регрессии будет приведена в п. 4.5.
Вычисления по формулам (4.9) существенно упрощаются, если фактор Х1 принимает равноотстоящие значения, т.е. Х12 = Х11 + h, Х13 = Х12 + h и т.д., где h – константа, называемая шагом. При этом
Х1ср = (Х11 + Х1N) /2 .
Коэффициент В1 для модели (4.12) вычисляют в этом случае по одной из двух приведенных ниже формул в зависимости от того, является ли число поставленных опытов N четным или нечетным [5]. Если N нечетно, то
B1 |
= (1 (hH1 ))[(yM +1 − yM −1 )+ 2(yM +2 |
− yM −2 )+... + |
|
+(M −1)(yM +1 − yM −1 )]. |
(4.13) |
|
|
63
В формуле (4.13) М и H1 соответственно равны |
|
|||||||||||
|
M = (N +1) 2; |
H1 = N (N 2 −1) |
12. |
(4.14) |
||||||||
Если N четно, то |
|
|
|
|
|
|
|
|
|
|
||
B = |
1 |
[(y |
M +1 |
− y |
M −1 |
)+3(y |
M +2 |
− y |
M −2 |
)+... + |
|
|
|
|
|||||||||||
1 |
1hH1 |
|
|
|
|
(4.15) |
||||||
|
|
|
|
|
|
|
|
|
|
+(N −1)(yN − y1 )],
где М =N/2; H1 = N(N2 – 1)/12.
Обратимся теперь к вычислению коэффициентов квадратичной модели с единственным фактором Х1:
у = В0 + В1Х1 + В11Х12.
Для отыскания трех неизвестных коэффициентов регрессии В0, В1 и В11 надо решить следующую систему из трех линейных уравнений с тремя неизвестными:
|
N |
N |
N |
NB0 + B1 ∑X1 j + B11 |
∑X12j = ∑y j ; |
||
j=1 |
j=1 |
j=1 |
|
N |
N |
N |
N |
B0 ∑X1 j + B1 |
∑X12j + B11 ∑X13j = ∑y j X1 j ; |
||
j=1 |
j=1 |
j=1 |
j=1 |
N |
N |
N |
N |
B0 ∑X12j + B1 |
∑X13j + B11 ∑X14j = ∑y j X1 j ; |
||
j=1 |
j=1 |
j=1 |
j=1 |
Аналогично случаю линейной модели, вычисления коэффициентов регрессии значительно упростятся при равноотстоящих значениях факторов Х1. Математическую модель в этом случае удобно представить в виде
y = B11′ ((X1 − |
|
1 ) h)2 + B1′((X1 − |
|
1 ) h)+ B0′, |
(4.16) |
X |
X |
где h – по-прежнему шаг варьирования фактора Х1, а коэффициенты B0′ , B1′ и B11′ вычисляются по следующим формулам [5].
При нечетном N:
B0'' = y −(H1 / N )B11' ;
B1' =1 / H1 (y1 (1− M )+ y2 (2 − M )+.. + yN (N − M ));
64