- •1. Понятие о математическом моделировании 3
- •2. Действия над приближенными числами 5
- •3. Применение методов статистического анализа 12
- •1. Понятие о математическом моделировании
- •2. Действия над приближенными числами
- •3. Применение методов статистического анализа
- •3.1. Теоретические основы методов
- •Установление наличия и формы связи
- •Оценка тесноты связи
- •Определение параметров уравнения регрессии
- •Проверка качества уравнения регрессии
- •Многофакторный эксперимент.
- •3.2. Примеры построения математических моделей
3.2. Примеры построения математических моделей
Задача 1. Построить и проверить математическую модель yx=a0+a1x связи между количеством вещества вступавшего в реакцию (факторный признак Х) и количеством оставшегося вещества после реакции (результативный признак Y) по результатам 22 измерений (систематизированных по увеличению Х).
№ |
X, г |
Y, г |
1 |
6,5 |
3,33 |
2 |
7,0 |
3,00 |
3 |
7,5 |
3,00 |
4 |
7,5 |
3,33 |
5 |
8,0 |
3,67 |
6 |
8,5 |
3,67 |
7 |
9,5 |
3,33 |
8 |
10,0 |
3,67 |
9 |
10,5 |
4,00 |
10 |
10,5 |
4,00 |
11 |
11,0 |
3,67 |
12 |
11,5 |
4,00 |
13 |
12,5 |
4,33 |
14 |
13,0 |
4,67 |
15 |
13,5 |
4,33 |
16 |
13,5 |
4,33 |
17 |
14,0 |
5,00 |
18 |
14,5 |
5,00 |
19 |
15,5 |
5,00 |
20 |
16,0 |
4,67 |
21 |
16,5 |
5,33 |
22 |
16,5 |
5,67 |
|
253,5 |
91,00 |
Решение.Проверим наличие связи между изучаемыми величинами.
Визуальный просмотр опытных данных показывает, что возрастание значений величины Х сопровождается в целом ростом значений Y. Это позволяет говорить о наличии связи между изучаемыми величинами.
Выберем форму связи. Для этого построим опытные точки Мi (xi,yi) в системе координат, т.е. диаграмму рассеяния опытных точек (рис.3).
Рис.3. Зависимость остатка вещества Yот количества веществаX,
вступившего в реакцию.
Графический анализ позволяет предположить о наличии прямолинейной связи между количеством оставшегося вещества Yи количеством вещества Х, вступившего в реакцию.
Таким образом, уравнение регрессии ищем в виде: yx=a0+a1x.
Для определения коэффициентов уравнения регрессии и коэффициента корреляции составим расчетную таблицу 3.
Запишем систему уравнений для нахождения коэффициентов:
Подставим в систему n=22 и итоговые суммы из таб.3, получим:
Решая систему, например, по формулам Крамера, найдем a0=1,579,a1=0,222. Запишем уравнение регрессии:yx=1,579+0,222x.
Таблица 3
Расчет коэффициентов уравнения и корреляции
i |
xi |
yi |
xi2 |
yi2 |
xiyi |
1 |
6,50 |
3,33 |
42,25 |
11,11 |
21,67 |
2 |
7,00 |
3,00 |
49,00 |
9,00 |
21,00 |
3 |
7,50 |
3,00 |
56,25 |
9,00 |
22,50 |
4 |
7,50 |
3,33 |
56,25 |
11,11 |
25,00 |
5 |
8,00 |
3,67 |
64,00 |
13,44 |
29,33 |
6 |
8,50 |
3,67 |
72,25 |
13,44 |
31,17 |
7 |
9,50 |
3,33 |
90,25 |
11,11 |
31,67 |
8 |
10,00 |
3,67 |
100,00 |
13,44 |
36,67 |
9 |
10,50 |
4,00 |
110,25 |
16,00 |
42,00 |
10 |
10,50 |
4,00 |
110,25 |
16,00 |
42,00 |
11 |
11,00 |
3,67 |
121,00 |
13,44 |
40,33 |
12 |
11,50 |
4,00 |
132,25 |
16,00 |
46,00 |
13 |
12,50 |
4,33 |
156,25 |
18,78 |
54,17 |
14 |
13,00 |
4,67 |
169,00 |
21,78 |
60,67 |
15 |
13,50 |
4,33 |
182,25 |
18,78 |
58,50 |
16 |
13,50 |
4,33 |
182,25 |
18,78 |
58,50 |
17 |
14,00 |
5,00 |
196,00 |
25,00 |
70,00 |
18 |
14,50 |
5,00 |
210,25 |
25,00 |
72,50 |
19 |
15,50 |
5,00 |
240,25 |
25,00 |
77,50 |
20 |
16,00 |
4,67 |
256,00 |
21,78 |
74,67 |
21 |
16,50 |
5,33 |
272,25 |
28,44 |
88,00 |
22 |
16,50 |
5,67 |
272,25 |
32,11 |
93,50 |
|
253,50 |
91,00 |
3140,75 |
388,56 |
1097,33 |
Выполним проверку модели разными способами.
Сначала заполним построим таблицу 4. Значения yx рассчитываем по построенной модели. Затем построим диаграмму рассеяния точекМi (xi,yi) и линию регрессии (рис.4).
Таблица 4
Проверка уравнения регрессии на точность и надежность
i |
xi |
yi |
yx |
yi-yx |
|(yi-yx)/yi| |
(yx-y)2 |
(yi-y)2 |
(yi-yx)2 |
1 |
6,5 |
3,33 |
3,02 |
0,312 |
0,093 |
1,242 |
0,645 |
0,097 |
2 |
7,0 |
3,00 |
3,13 |
-0,133 |
0,044 |
1,007 |
1,291 |
0,018 |
3 |
7,5 |
3,00 |
3,24 |
-0,244 |
0,081 |
0,797 |
1,291 |
0,059 |
4 |
7,5 |
3,33 |
3,24 |
0,090 |
0,027 |
0,797 |
0,645 |
0,008 |
5 |
8,0 |
3,67 |
3,35 |
0,312 |
0,085 |
0,611 |
0,221 |
0,097 |
6 |
8,5 |
3,67 |
3,47 |
0,201 |
0,055 |
0,450 |
0,221 |
0,040 |
7 |
9,5 |
3,33 |
3,69 |
-0,354 |
0,106 |
0,202 |
0,645 |
0,125 |
8 |
10,0 |
3,67 |
3,80 |
-0,132 |
0,036 |
0,114 |
0,221 |
0,017 |
9 |
10,5 |
4,00 |
3,91 |
0,091 |
0,023 |
0,052 |
0,019 |
0,008 |
10 |
10,5 |
4,00 |
3,91 |
0,091 |
0,023 |
0,052 |
0,019 |
0,008 |
11 |
11,0 |
3,67 |
4,02 |
-0,354 |
0,096 |
0,013 |
0,221 |
0,125 |
12 |
11,5 |
4,00 |
4,13 |
-0,131 |
0,033 |
0,000 |
0,019 |
0,017 |
13 |
12,5 |
4,33 |
4,35 |
-0,020 |
0,005 |
0,047 |
0,039 |
0,000 |
14 |
13,0 |
4,67 |
4,46 |
0,202 |
0,043 |
0,107 |
0,281 |
0,041 |
15 |
13,5 |
4,33 |
4,58 |
-0,242 |
0,056 |
0,193 |
0,039 |
0,058 |
16 |
13,5 |
4,33 |
4,58 |
-0,242 |
0,056 |
0,193 |
0,039 |
0,058 |
17 |
14,0 |
5,00 |
4,69 |
0,314 |
0,063 |
0,302 |
0,746 |
0,099 |
18 |
14,5 |
5,00 |
4,80 |
0,203 |
0,041 |
0,437 |
0,746 |
0,041 |
19 |
15,5 |
5,00 |
5,02 |
-0,019 |
0,004 |
0,779 |
0,746 |
0,000 |
20 |
16,0 |
4,67 |
5,13 |
-0,463 |
0,099 |
0,987 |
0,281 |
0,215 |
21 |
16,5 |
5,33 |
5,24 |
0,092 |
0,017 |
1,220 |
1,433 |
0,009 |
22 |
16,5 |
5,67 |
5,24 |
0,426 |
0,075 |
1,220 |
2,342 |
0,181 |
|
253,5 |
91,00 |
91,00 |
0,000 |
1,161 |
10,822 |
12,146 |
1,324 |
Рис.4. Диаграмма рассеяния и теоретическая линия регрессии остатка вещества Yот количества веществаX, вступившего в реакцию.
Визуальное сопоставление эмпирических и теоретических значений величины Y позволяет сделать предварительный вывод, что построенная модель является достаточно точной.
Применим аналитические методы.
Найдем коэффициент корреляции:
Найдем среднее значения, используя итоговые суммы табл.4 .
Найдем средние квадратические отклонения величин X, Y.
Коэффициент корреляции равен
Коэффициент детерминации или 89,1%.
Найдем корреляционное отношение:
Для линейной модели
Значение коэффициента корреляции (корреляционного отношения) говорит о том, что между величинами X и Y имеет место прямая корреляционная зависимость: увеличение значений Х приводит к возрастанию значений величины Y. Это подтверждает ранее сделанные выводы. Так как 0,9 < R < 0,99, то теснота связи является очень высокой, т.е. изменение величины вещества X, вступившему в реакцию, существенно влияет на величину остатка вещества Y.
Значение коэффициента детерминации говорит о том, что 89, 1% общей вариации Y обусловлено величиной Х, а 10,9% - влиянием неучтенных факторов.
Оценим значимость коэффициента корреляции на уровне значимости α=0,05.
Найдем значение критерия Стьюдента: Найдем tкр– табличное значение критерия. Число степеней свободы
f=n-1=21. Тогда tкр=2,08. Так как txy > tкр, то это говорит о наличии корреляционной связи между изучаемыми величинами Х и Y во всей генеральной совокупности, из которой отобраны значения xi, yi, т.е. коэффициент корреляции R является значимым с вероятностью р=1-0,05=0,95.
Найдем среднюю относительную ошибку аппроксимации:
Средняя относительная ошибка < 20%, поэтому построенная модель является точной, адекватной оригиналу, т.е. расчетные (теоретические) значения, вычисленные по уравнению регрессии, хорошо согласуются с опытными (эмпирическими) значениями y. Качество модели хорошее.
Оценим надежность, достоверность уравнения на уровне значимости 0,05 с помощью критерия Фишера.
Найдем дисперсию признакаY:
Найдем остаточную дисперсию признака Y:
Найдем значение критерия Фишера:
Найдем табличное значение критерия F(0,05;f1;f2). Число степеней свободы f1=n-1=22-1=21, f2=n-p-1=22-2-1=19. По таблице находим Fкр=2,2.
Так как F>Fкр, то уравнение регрессии является надежным, достоверным с вероятностью p=1-0,05=0,95.
Вывод:построенная модель является адекватной, статистически надежной.
Задача 2. Построить и проверить двухфакторную модель
ух=a0+a1x1+а2х2зависимости массы остатка зерен Y от массы навески Х1и температуры сушки Х2.
Масса навески - масса взятой глины. Навеску заливают водой и перемешывают. Через 1 час промывают и процеживают через сито, просушивают и взвешивают массу остатка.
Исходные данные:
Таблица 5
№ замеса |
Х1, г |
Х2, С0 |
Y, г |
1 |
500 |
100 |
8,0 |
2 |
520 |
102 |
9,3 |
3 |
540 |
104 |
8,6 |
4 |
560 |
105 |
9,0 |
5 |
580 |
105 |
10,3 |
6 |
600 |
106 |
9,6 |
7 |
620 |
107 |
10,0 |
8 |
640 |
106 |
11,3 |
9 |
660 |
110 |
10,6 |
10 |
680 |
110 |
11,0 |
Всего |
5900 |
1055 |
97,6 |
Решение.Составим расчетную таблицу 6.
Коэффициенты уравнения линейной регрессии найдем из системы:
Таблица 6
i |
Х1 |
Х2 |
Y |
Х12 |
Х22 |
Х1Х2 |
Х1Y |
Х2Y |
1 |
500 |
100 |
8,0 |
250000 |
10000 |
50000 |
3979,2 |
795,8 |
2 |
520 |
102 |
9,3 |
270400 |
10404 |
53040 |
4831,7 |
947,8 |
3 |
540 |
104 |
8,6 |
291600 |
10816 |
56160 |
4657,5 |
897,0 |
4 |
560 |
105 |
9,0 |
313600 |
11025 |
58800 |
5016,7 |
940,6 |
5 |
580 |
105 |
10,3 |
336400 |
11025 |
60900 |
5969,2 |
1080,6 |
6 |
600 |
106 |
9,6 |
360000 |
11236 |
63600 |
5775,0 |
1020,3 |
7 |
620 |
107 |
10,0 |
384400 |
11449 |
66340 |
6174,2 |
1065,5 |
8 |
640 |
106 |
11,3 |
409600 |
11236 |
67840 |
7226,7 |
1196,9 |
9 |
660 |
110 |
10,6 |
435600 |
12100 |
72600 |
7012,5 |
1168,8 |
10 |
680 |
110 |
11,0 |
462400 |
12100 |
74800 |
7451,7 |
1205,4 |
Всего |
5900 |
1055 |
97,6 |
3514000 |
111391 |
624080 |
58094,2 |
10318,7 |
Подставляя в систему n=10 и табличные суммы, получим:
Решая систему, получим: ао=19,754, а1=0,028, а2=-0,253.
Запишем уравнение регрессии: ух=19,754+0,028х1 -0,253х2.
Выполним проверку модели. Составим расчетную таблицу 7.
Таблица 7
i |
Х1 |
Х2 |
Y |
Yx |
Y-Yx |
| (Y-Yx)/Y | |
(Y-Yx)2 |
(Y-y)2 |
(Yx-y)2 |
1 |
500 |
100 |
8,0 |
8,61 |
-0,65 |
0,081 |
0,420 |
3,240 |
1,327 |
2 |
520 |
102 |
9,3 |
8,67 |
0,63 |
0,067 |
0,391 |
0,218 |
1,193 |
3 |
540 |
104 |
8,6 |
8,73 |
-0,10 |
0,012 |
0,010 |
1,284 |
1,067 |
4 |
560 |
105 |
9,0 |
9,04 |
-0,08 |
0,009 |
0,006 |
0,640 |
0,520 |
5 |
580 |
105 |
10,3 |
9,60 |
0,69 |
0,067 |
0,475 |
0,284 |
0,024 |
6 |
600 |
106 |
9,6 |
9,91 |
-0,29 |
0,030 |
0,084 |
0,018 |
0,024 |
7 |
620 |
107 |
10,0 |
10,23 |
-0,27 |
0,027 |
0,072 |
0,040 |
0,219 |
8 |
640 |
106 |
11,3 |
11,04 |
0,25 |
0,022 |
0,061 |
2,351 |
1,653 |
9 |
660 |
110 |
10,6 |
10,60 |
0,03 |
0,003 |
0,001 |
0,751 |
0,705 |
10 |
680 |
110 |
11,0 |
11,16 |
-0,20 |
0,019 |
0,042 |
1,440 |
1,972 |
|
5900 |
1055 |
97,6 |
97,58 |
0,00 |
0,336 |
1,563 |
10,267 |
8,704 |
Средняя относительная ошибка аппроксимации равна:
модель является адекватной.
Оценим надежность уравнения на уровне значимости 0,05 с помощью критерия Фишера.
Дисперсия величины Yравна:
Остаточная дисперсия равна:
Найдем значение критерия Фишера
Найдем табличное значение критерия F(0,05;f1;f2).
f1 = n-1 = 10-1 = 9, f2 = n-p-1 = 10-3-1 = 6. По таблице находим Fкр=3,37.
Так как F>Fкр, то уравнение регрессии является статистически надежным, достоверным с вероятностью p=1-0,05=0,95.
Вывод:построенная модель является адекватной, статистически надежной.