Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Игнатенко Статистическая оценка данных екологического мониторинга 2010.pdf
Скачиваний:
131
Добавлен:
16.08.2013
Размер:
2.09 Mб
Скачать

2.

Рассчитывают остаточную дисперсию:

 

 

N

 

 

 

 

sост2 = (y j y j )2 (N p).

(4.42)

 

j=1

 

 

 

3.

Вычисляют отношение

 

 

 

 

F

= s2

/ s2 .

(4.43)

 

u

с

ост

 

Величина Fu показывает, во сколько раз уравнение регрессии описывает результаты эксперимента точнее, чем простое среднее арифметическое, взятое по всем опытам. Регрессионная модель считается эффективной, если Fu > (3 – 5).

Для экспериментов с дублированными опытами формула (4.43)

остается в силе, а выражения для дисперсий s2

и s2

примут вид:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с

 

ост

 

с

N n j

 

ju

 

 

 

)

2

 

 

N

 

j

 

 

 

 

∑∑(

y

y

 

 

 

n

 

 

 

 

s2 =

 

 

 

 

 

 

 

 

 

1 ;

 

 

j=1 u=1

 

 

 

 

 

 

 

 

j=1

 

 

 

 

 

 

ост

 

N n j

 

 

ju

 

 

 

j )

2

 

 

N

 

 

j

 

 

=

∑∑(

y

 

 

 

 

 

n

 

 

s2

 

 

 

y

 

 

 

 

 

 

p ,

 

 

 

j=1 u=1

 

 

 

 

 

 

 

 

j=1

 

 

 

 

где yju – значение отклика в u-м дублированном опыте j-й серии; N

– число серий дублированных опытов;

 

N n j

N

y

= ∑∑y ju

nj .

 

j=1 u=1

j=1

Последовательность действий исследователя при проведении эксперимента с целью построения регрессионной модели объекта.

1.Выбор варьируемых и стабилизируемых факторов, а также выходных величин эксперимента.

2.Выбор регрессионной модели.

3.Определение диапазона варьируемых факторов.

4.Выбор плана эксперимента.

5.Составление методики проведения эксперимента.

6.Постановка разведывательных опытов. Проверка нормальности распределения выходной величины. Определение числа дублированных опытов.

86

7.Проведение основного эксперимента.

8.Отбрасывание грубых наблюдений. Проверка однородности дисперсий опытов. Расчет дисперсии воспроизводимости (при отсутствии дублированных опытов дисперсия воспроизводимости определяется по результатам отдельной серии опытов).

9.Расчет коэффициентов регрессии математической модели.

10.Оценка значимости коэффициентов регрессии. Отбрасывание незначимых членов и повторный расчет коэффициентов регрессии (последнее – для неортогональных планов).

11.Проверка адекватности и эффективности регрессионной

модели.

12.Интерпретация результатов.

Приведенный перечень этапов только приблизительно отражает реальную последовательность действий экспериментатора, поскольку многие этапы оказываются взаимосвязанными. Таковы, например, выбор математической модели и определение диапазона варьирования факторов. При выборе диапазона варьирования факторов существенны, прежде всего, соображения экспериментатора, связанные с возможностью применения полученных им результатов и рекомендаций в исследуемой сфере. Поэтому диапазоны варьирования факторов в эксперименте обычно соответствуют ре- ально-возможным условиям. Кроме того, необходимо отметить, что диапазоны варьирования факторов следует выбирать тем больше, чем ниже точность фиксирования факторов и чем меньше диапазон изменения выходной величины [7].

4.6. Пример обработки результатов экспериментальных исследований

Проиллюстрируем методику обработки экспериментальных данных на примере исследования влияния низкоинтенсивного высокочастотного излучения 9–10 ГГц и влажности на прорастание семян ржи. Были выбраны следующие диапазоны варьирования факторов: интенсивности излучения в зоне размещения семян 0 < I <10 мкВт/см2; изменение влажности 35 < W < 55 %. По техно-

87

логическим причинам были выбраны пять уровней варьирования для каждого из факторов и рассматривались всевозможные их комбинации. Один исследуемый образец представлялся 50 семенами ржи. В качестве функции отклика принимались значения размера корешка, проращиваемых семян ржи y.

Матрица плана данного эксперимента в натуральных обозначениях факторов приведена во втором и третьем столбцах табл. 4.10.

 

 

 

 

 

Таблица 4.10

 

 

Результаты эксперимента

 

 

 

Влаж-

 

 

 

 

 

Номер

Интенсив-

Средний

Диспер-

Значение,

опыта

ность

ность потока

размер

2

полученные

 

j

семян W,

I, мкВт/см2

корешка

сия s j

по уравнению

 

 

%

 

проростка

 

регрессии yˆ j

 

 

 

 

семени,

 

 

 

 

50

 

×10 мм

 

 

 

1

7,5

475

290

468

 

2

40

7,5

364

475

375

 

3

50

2,5

498

300

485,5

 

4

40

2,5

389

320

392,5

 

5

50

10

475

527

459

 

6

40

10

365

234

366,3

 

7

50

0

501

327

494

 

8

40

0

393

399

401

 

9

55

7,5

534

334

534,8

 

10

35

2,5

371

337

366,2

 

11

55

10

516

632

526

 

12

35

0

383

332

374,9

 

13

45

7,5

417

217

414,8

 

14

45

2,5

417

385

432,3

 

15

45

10

409

309

406

 

16

45

0

441

370

441,9

 

17

50

5

479

254

476,8

 

18

40

5

384

296

383,7

 

19

55

5

535

235

543,6

 

20

35

5

359

367

357,5

 

21

45

5

418

431

423,5

 

88

В пятый столбец таблицы вписаны значения дисперсий опытов, вычисленные по формуле (4.24). По критерию Кохрена G проверена гипотеза об однородности этих дисперсий.

 

 

 

s2

632

 

Gрасч=

 

 

11

=

 

= 0,086 .

s2

+ s2

+... + s2

290 + 475 +... + 431

1

1

21

 

 

 

Из таблиц критерия G (см. приложение 3) при уровне значимости q = 0,05 для числа степеней свободы каждой выборки f = n – 1 =

= 50 – 1 = 49 и для числа выборок m = 21 получим Gтабл = 0,09. Это соотношение Gрасч < Gтабл позволяет принять гипотезу об однород-

ности дисперсий опытов.

Далее определяем дисперсию воспроизводимости опытов (эксперимента)

s{b

}= C s2

{y}

i

ii

 

с числом степеней свободы

f = N(n – 1) = 21 (50 – 1).

Расчет коэффициентов регрессии проводился для математической модели в нормализованных обозначениях факторов. Значения нормализованных факторов вычисляются из выражений:

x =

W 45

; x

2

=

J 5

.

 

 

1

10

 

5

 

 

 

 

 

Для расчета коэффициентов регрессии необходимо построить матрицу базисных функций в нормализованных обозначениях факторов. Уравнение регрессии выбрано второго порядка, вида:

y = b0 = b1x1 +b2 x2 +b11x12 +b22 x22 +b12 x1x2 ,

для которого матрица базисных функций этой модели должна содержать столбцы:

x0 , x1, x2 , x12 , x22 , x1x2 .

Матрица базисных функций в нормализованных обозначениях факторов приведена в табл. 4.11.

Коэффициенты регрессионной модели рассчитываются по формуле (4.20). Полученные значения коэффициентов представлены в табл. 4.12.

89

Таблица 4.11

Матрица базисных функций в нормализованных обозначениях факторов

 

Номер

 

х0

х1

х2

x2

 

x2

 

х1х2

 

 

 

опыта

 

1

 

 

 

1

2

 

 

 

 

1

 

 

0,5

0,5

0,25

0,25

 

0,25

 

 

2

 

1

 

–0,5

0,5

0,25

0,25

 

–0,25

 

 

3

 

1

 

0,5

–0,5

0,25

0,25

 

–0,25

 

 

4

 

1

 

–0,5

–0,5

0,25

0,25

 

0,25

 

 

5

 

1

 

0,5

1

0,25

1

 

0,5

 

 

6

 

1

 

–0,5

1

0,25

1

 

–0,5

 

 

7

 

1

 

0,5

–1

0,25

1

 

–0,5

 

 

8

 

1

 

–0,5

–1

0,25

1

 

0,5

 

 

9

 

1

 

1

0,5

1

0,25

 

0,5

 

 

10

 

1

 

–1

–0,5

1

0,25

 

0,5

 

 

11

 

1

 

1

1

1

1

 

1

 

 

12

 

1

 

–1

–1

1

1

 

1

 

 

13

 

1

 

0

0,5

0

0,25

 

0

 

 

14

 

1

 

0

–0,5

0

0,25

 

0

 

 

15

 

1

 

0

1

0

1

 

0

 

 

16

 

1

 

0

–1

0

1

 

0

 

 

17

 

1

 

0,5

0

0,25

0

 

0

 

 

18

 

1

 

–0,5

0

0,25

0

 

0

 

 

19

 

1

 

1

0

1

0

 

0

 

 

20

 

1

 

–1

0

1

0

 

0

 

 

21

 

1

 

0

0

0

0

 

0

 

 

 

 

 

 

 

 

 

 

 

Таблица 4.12

 

 

 

Коэффициенты регрессионной модели

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Индекс

 

 

bi

Cii

s{bi }

 

Tтаблs{bi}

bi

 

 

коэффициента

 

 

 

 

0

 

 

421,5

0,194

8,24

 

16,10

 

423,5

 

 

 

1

 

 

93,05

0,132

6,80

 

13,30

 

93,05

 

 

 

2

 

 

– 17,46

0,112

6,30

 

12,25

 

–17,46

 

 

11

 

 

27,94

0,483

13,02

 

25,52

 

27,04

 

 

 

22

 

 

3,8

0,304

10,32

 

20,22

 

-

 

 

 

12

 

 

–0,99

0,486

13,05

 

25,60

 

-

 

 

90

Для оценки значимости найденных коэффициентов регрессии проверяем выполнение неравенства (4.32). Предварительно необходимо вычислить элементы Cii матрицы (ХТХ)–1, где Х – матрица

базисных функций.

Для выбранного уровня значимости q = 0,05

и числа степеней

свободы f = N(n – 1) = 21 (50 – 1), связанного

с дисперсией воспроизводимости, из таблицы 1 найдем значение tтабл = 1,96. Тогда значения дисперсии коэффициентов вычисляется по формуле

s{bi }= Cii s2 {y}.

Сопоставляя элементы второго и пятого столбцов табл. 4.12, проверяем выполнение неравенства (4.32). Как видно, незначимыми оказались коэффициенты регрессии b22 и b12. Как отмечалось, после отбрасывания незначимых коэффициентов величины остальные коэффициенты регрессии изменяются. Это заставляет вторично проводить расчет оставшихся коэффициентов регрессии. Матрица базисных функций в данном случае содержит уже только

столбцы х0, х1, х2, x22 .

Вновь рассчитанные коэффициенты регрессии приведены в шестом столбце табл. 4.12. Таким образом, окончательно, регрессионная модель будет иметь вид

y = 423,5 +93,05x1 17,5x2 + 27,04x12.

Проверим адекватность полученной модели согласно методике, изложенной в п. 3.5. Вначале определяют значения отклика ŷj, по полученной модели для каждого j опыта. С этой целью в уравнение регрессии подставляют значения факторов x1 и x2, соответствующие каждому из опытов плана. Результаты расчетов значений функции отклика приведены в шестом столбце табл. 4.10. Далее по формуле (4.35) вычисляем сумму квадратов, характеризующую адекватность модели

S= nN (y j yˆ )2 =

j=1

=50((475 468,03)2 +(364 374,99)2 +... +(418 423,48)2 )=

=50 1245,33 6626,5.

91

Затем рассчитываем: число степеней свободы fад = N – p = 17 (где p – количество коэффициентов уравнения регрессии); дисперсию адекватности по формуле

sa2д s66266,5 38980,29. f17

Расчетное значение критерия Фишера

Fрасч=sa2д / s2 y =1,88.

Зададимся уровнем значимости q = 0,01. Из таблицы значений

критерия Фишера для значений fад = 17 и fy = 168 Fрасч = 1,95. Полученное соотношение Fрасч<Fтаб позволяет принять гипотезу об

адекватности регрессионной модели.

92

5. ПОСТРОЕНИЕ МНОГОФАКТОРНОЙ ЛИНЕЙНОЙ РЕГРЕССИОННОЙ МОДЕЛИ В EXCEL

Представленный алгоритм построения регрессионной модели практично реализован программно в многофункциональной программе EXCEL. Для практического освоения этой программы построения многофакторного линейного уравнения регрессии рассмотрим пример.

Построение линейной функции выполняется с помощью метода наименьших квадратов (МНК). Основные параметры диалогового окна: входной интервал y – массив анализируемых зависимых данных (массив должен состоять из одного столбца числовых значений); входной массив Х – числовые значения независимых данных (представленные соседними столбцами), подлежащих анализу, Excel располагает независимые переменные этого массива чисел слева направо в порядке возрастания. Программный продукт позволяет сформировать и нелинейную функцию. Например, для случая двух переменных

у(X1, X2) = B0 + B1 X1 + B2 X2 + B3 X12 + B4 X22 + B5 X1, X2

формируется массив (столбцы), содержащий числовые значения X12 , X22 , X1, X2, рядом с массивом значений X1, X2.

Пример. Необходимо построить уравнение регрессии между исходной концентрацией микроорганизмов X1, плотностью потока лазерного излучения X2, концентрацией фотосенсибилизатора X3 и количеством выживших микроорганизмов y (задача оптимизации режима фотодинамической терапии).

Для решения этой задачи в меню Excel, в разделе «Регрессия» введем исходные данные, представленные графически на рис. 5.1.

Проводимые в работе экспериментальные исследования влияния физико-химических факторов на гибель четырех видов микроорганизмов с различной исходной их концентрацией с целью выбора оптимального физиотерапевтического режима при фотодинамической терапии показали в интервале их варьирования ярко выраженную экспоненциальную кинетику, а также наличие экстремального значения концентрации ФС.

93

 

Кинетика гибели микроорганизмов синегнойной палочки от плотности

 

потока лазерного излучения для трех значений исходной концентрации

 

 

(С1,С2,С3) и четырех значений ФС

 

 

 

40000000

 

 

 

 

 

 

 

 

35000000

 

 

 

 

 

 

 

 

30000000

 

 

 

 

 

 

 

 

 

 

 

 

 

С1

 

 

 

25000000

 

 

 

 

С2

 

 

 

 

 

 

 

С3

 

 

КОЕ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Значение

20000000

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

15000000

 

 

 

 

 

 

 

 

10000000

 

 

 

 

 

 

 

 

5000000

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

5

10 15 20 25 30

5

10 15 20 25 30

5

10 15 20 25 30

5

10 15 20 25 30

 

 

Плотность потока лазерного излучения, Дж/см2

Рис. 5.1. График изменения КОЕ от плотности лазерного излучения при различных значения ФС

Отмеченные особенности явились причиной поиска функциональной зависимости КОЕ от варьируемых факторов и исходной концентрации микроорганизмов с целью получения математического выражения для количественного определения фотодинамических параметров, обеспечивающие заданный режим терапии (безопасный). Применение факторного анализа – построение трехфакторной регрессионной – модели показали недостаточно высо-

94

кую ее адекватность. Потребовалась априорная информация о кинетике протекающих процессов.

Кинетика гибели микроорганизмов при воздействии на них внешних физико-химических факторов в общем виде может быть представлена экспоненциальным законом:

N = N0exp(–Kτ),

где N – количество микроорганизмов в момент времени τ; K – удельная скорость гибели микроорганизмов; N0 исходное значение количества микроорганизмов.

Особенности вида микроорганизмов и влияния различных факторов на характер их гибели должны быть «возложены» на пара- метр-функцию K.

Предварительный анализ экспериментальных значений КОЕпредставления их в графическом виде КОЕ с аппроксимацией экспонентой (линия тренда) подтвердил экспоненциальный характер кинетического процесса гибели микроорганизмов от мощности лазерного потока:

КОЕ = С0exp(–FW),

где С0 исходная концентрация микроорганизма; мощность лазерного потка; Е – облученность Дж/м-2, F – кинетический параметр, учитывающий природу микроорганизма и концентрацию фотосенсибилизатора в среде микроорганизма.

Проведенный численный анализ данного выражения для КОЕ применительно к полученным экспериментальным данным показал, что характерные особенности микроорганизма и концентрация фотосенсибилизатора должны функционально входить в критерии F и С0, т.е. данные параметры здесь приобретают роль функционалов и являются функциями исходной концентрации микроорганизма и фотосенсибилизатора.

Построение кинетических уравнений для исследуемых микроорганизмов проводилось с группированием экспериментальных данных для одного вида микроорганизма при трех исходных концентраций для одной концентрации фотосенсибилизатора. Здесь применялся двухфакторный анализ и строилась двухфакторная

регрессионная модель вида

 

ln KOE = B0 + B1lnC0 – B2W,

(5.1)

95

где B0, B1, B2 коэффициенты уравнения регрессии; С0 исходная концентрация микроорганизма; W – плотность лазерного потока; KOE количество выживших микроорганизмов.

Данная регрессионная модель строилась для одной концентрации фотосенсибилизатора и трех значений исходной концентрации рассматриваемого микроорганизма. Согласно экспериментальным данным, на каждый микроорганизм получали четыре регрессионные уравнения, коэффициенты которых отражали роль концентрации фотосенсибилизатора.

Графический анализ численных значений КОЕ в зависимости от концентрации фотосенсибилизатора показал параболическую их зависимость с наличием экстремальной точки КОЕ. Роль изменения концентрации фотосенсибилизатора была включена в коэф-

фициенты B0, B1, B2 как

Bi= A0 + A1lnFS + A2(ln FS)2 + A3(lnFS)3,

где A0, A1, A2, A3 – коэффициенты аппроксимации; FS – концентрация фотосенсибилизатора.

Обобщенные коэффициенты B0, B1, B2, подставленные в уравнение (5.1), и представляли кинетическую зависимость исследуемого микроорганизма от исходной их концентрации, мощности лазерного потока и концентрации фотосенсибилизатора в исследуемых интервалах варьирования факторов.

Кинетические уравнения для исследуемых микроорганизмов:

ln KOE = B0 + B1lnC0 – B2W,

для которого

B0 = A1 (lnFS)3 + A2(lnFS)2 + A3(lnFS) + A4;

B1 = K1(lnFS)3 + K2(lnFS)2 + K3(lnFs) + K4;

B2 = D1(lnFS)3 + D2(lnFS)2 + D3(lnFs) + D4.

96

6. КУЛЬТУРА ПРЕДСТАВЛЕНИЯ ЧИСЛОВЫХ ЗНАЧЕНИЙ ИЗМЕРЕНИЙ И ВЫЧИСЛЕНИЙ

Основой всего естествознания являются наблюдения и эксперименты. Особое значение имеют наблюдения и эксперименты, дающие числа – результаты измерений.

Все результаты измерений содержат ошибки различного происхождения. Поэтому результаты вычислений с числами, результаты измерений, также содержат ошибки. Очень существенно для практики уметь оценивать как ошибки самих результатов измерений, так и результатов действий над ними, ибо только в этом случае можно с достаточной уверенностью пользоваться выводами из наблюдений. Не менее важна такая организация вычислений и наблюдений, которая обеспечивает по возможности малую ошибку результата. Из этих замечаний ясно, что обработка результатов наблюдений не может выполняться любым способом. Чтобы результаты содержали как можно меньшие ошибки, должны быть применены оптимальные методы оценок ошибок, методы вычислительных работ, обеспечивающие возможно более точные результаты.

Обычные результаты измерений всегда являются приближенными и, прежде всего, вследствие ограниченной точности измерительных приборов.

Точное числовое значение измеряемой величины существует как объективная реальность, не зависящая от нас, а измерение дает какое-то другое значение с ограниченной ошибкой (модуль ошибки).

Типичные составляющие погрешности измерений:

А.1. Методические составляющие погрешности измерений. А.1.1. Неадекватность контролируемому объекту модели, па-

раметры которой принимаются в качестве измеряемых величин.

А.1.2. Отклонения от принятых значений аргументов функции, связывающей измеряемую величину с величиной на «входе» средства измерений (первичного измерительного преобразователя).

97

А.1.3. Отклонения от принятых значений разницы между значениями измеряемой величины на входе средства измерений и в точке отбора.

А.1.4. Погрешность из-за эффектов квантования.

А.1.5. Отличие алгоритма вычислений от функции, строго связывающей результаты наблюдений с измеряемой величиной.

А.1.6. Погрешности, возникающие при отборе и приготовлении проб.

А.1.7. Погрешности, вызываемые мешающим влиянием факторов пробы (мешающие компоненты пробы, дисперсность, пористость и т.п.).

А.2. Инструментальные составляющие погрешности измерений.

А.2.1. Основные погрешности и дополнительные статические погрешности средств измерений, вызываемые медленно меняющимися внешними влияющими величинами.

А.2.2. Погрешности, вызываемые ограниченной разрешающей способностью средств измерений.

А.2.3. Динамические погрешности средств измерений (погрешности, вызываемые инерционными свойствами средств измерений).

А.2.4. Погрешности, вызываемые взаимодействием средства измерений с объектом измерений и подключаемыми на его вход или выход средствами измерений.

А.2.5. Погрешности передачи измерительной информации. А.3. Погрешности, вносимые оператором (субъективные по-

грешности).

А.3.1. Погрешности считывания значений измеряемой величины со шкал и диаграмм.

А.3.2. Погрешности обработки диаграмм без применения технических средств (при усреднении, суммировании измеренных значений и т.п.).

А.3.3. Погрешности, вызванные воздействием оператора на объект и средства измерений (искажения температурного поля, механические воздействия и т.п.).

98

Анализ составляющих погрешности измерений может быть выполнен по рекомендациям (МИ 1967-89 ГСИ).

Рассчитывая перечисленные погрешности измерений по формулам, их значения можно получать с огромным «хвостом» числа знаков. Однако исходными данными для расчета являются нормируемые значения погрешности средств измерения, которые указываются всего с одной или двумя значащими цифрами. Вследствие этого и в окончательном значении рассчитанной погрешности должны быть оставлены только первые одна–две значащие цифры. При этом приходится учитывать, что если полученное число начинается с цифр 1 или 2, то отбрасывание второго знака приводит к очень большой ошибке (до 30–50 %), что недопустимо. Если же полученное число начинается, например, с цифры 9, то сохранение второго знака, т.е. указание погрешности, например 0,94 вместо 0,9, является дезинформацией, так как исходные данные не обеспечивают такой точности. Исходя из этого на практике установилось следующее правило: если полученное число начинается с цифры,

равной или большей, чем 10 ~ 3, то в нем сохраняется лишь один знак; если же оно начинается с цифр, меньших 3, т.е. с цифр 1 и 2, то в нем сохраняют два знака. В соответствии с этим правилом установлены и нормируемые значения погрешностей средств измерений: в числах 1,5 и 2,5 % указываются два знака, но в числах 0,5; 4; 6 % указывается лишь один знак.

В итоге можно сформулировать следующие три правила округления рассчитанного значения погрешности и полученного экспериментального результата измерения.

1.Погрешность результата измерения указывается двумя значащими цифрами, если первая из них равна 1 или 2, и одной – если первая есть 3 и более.

2.Результат измерения округляется до того же десятичного разряда, которым оканчивается округленное значение абсолютной погрешности.

3.Округление производится лишь в окончательном ответе, а все предварительные вычисления проводят с одним – двумя лишними знаками.

99

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]