Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Файл 15..docx
Скачиваний:
12
Добавлен:
26.03.2016
Размер:
593.26 Кб
Скачать

7. Дисперсионный анализ

7.1 Основные понятия

Дисперсионный анализ – это информационная технология технология работ на начальном этапеэкспериментального исследования заинтересовавшей субъект системы или ситуации. На этом этапе у субъекта об этой системе имеются лишьсамые общиепредставления, сложившиеся на базе обыденного (иногда – случайного) с нею (системой или ситуацией) общения. С этих представлений, воплощённых в простейшую исходную модель, которую принятоящиком» (см. модель-схему ниже.), и начинается дисперсионный анализ.

х1 y1 Прямоугольник изображает систему,

х2 yr = f(x1,x2,..,y2 стрелки справа – её проявления, эффек-

. ..xr-1,xr…..xL) … ….. ты, которыми система обнаруживает

х L yR себя вовне, т.е.внешние эффектыеё

Рис. 7.1 деятельности (функционирования).

Количественной мерой каждого из этих эффектов является значение yr)значение того параметра, которым этот эффект характеризуется. Субъект (исследователь) обычно интересуетсяоднимтаким параметром, количественно оценивающим потенциально полезный (или опасный) для него эффект системы (исход ситуации), интересуется, чтобы научиться управлять системой (овладеть ситуацией). Стрелки слева от прямоугольника изображают внешние причины (воздействия), которые, по первым впечатлениям субъекта, способны оказать влияние на выходные параметры (yr) системы. Эти стрелки тоже помечены символами – символамихi – численными значениями соответствующих параметров.

Схема предполагает, что при изменениях любого из параметров хi хотя бы один из параметровyrсистемы определённым образом изменится. При наличии причинно-следственной связи между входными воздействиями и внешними проявлениями системы взаимозависимость между характеризующими их параметрами могла бы быть описана некой функцией. Однако,при первомзнакомстве с системой конкретный вид этой функции и даже её характернеизвестны. Поэтому на фоне прямоугольника, изображающего собой систему на этом этапе знакомства с нею, эта (пока гипотетическая потому, что совсем неизвестная) зависимость представлена в общем виде – в формепроизвольнойфункцииyr= f(x1,… xi,…,xL), где индексами i=1,2,3…. L помечены нарастающие значения параметров, характеризующих уровеньвходныхвоздействий (в теории эксперимента их обычно называютфакторами), аyr (приr=1,2,3….R) соответствующие значения параметров, характеризующих уровеньвыходныхэффектов системы (в теории эксперимента их обычно называютоткликами).

Здесь L – количество факторов, влияющих на поведении системы иRколичество параметров (откликов), которыми характеризуется (полностью описывается) это поведение.

Отклики, следовательно, в этой модели выглядят набором из Rмногомерных функций типа yr= f(x1,… xi,…,xL), где i=1,2,3…. Lиr=1,2,3. ….,R.

Их (эти функций) ещё называют операторамисистемы.

Субъект, как отмечалось выше, обычно интересуется одним определённым откликом иликонструируетдля себя некийобобщенныйотклик, адекватно отображающий поведение системыв целом. Например, вместо таких нескольких привлекательных для человека выходных параметров злаковой культуры как количество стеблей у одного растения, количество колосков на каждом стебле, количество зёрен в каждом колосе и вес зернышка, можно рассматриватьодинобобщённый параметр: вес урожая с единицы засеянной культурой площади. Поэтому в начале знакомства с теорией дисперсионного анализа мы будем рассматривать приведённый ниже предельно упрощенный вариант «чёрного ящика».

Исследуемая

материальная система

x1 …… y=f(x1,…, xL).

…..

xL

Рис. 7.2

Цель дисперсионного анализа состоит:

- в выявлении среди множества xi,…, xL ,первоначально заподозренных в способности повлиять на величинуy, (выходных) факторов-откликов, техxl, xn и xm , которые наверняка на неё (на величинуy) влияют, и

- в уточнении диапазона изменений каждого выявленного фактора, в пределах которого такие влияния наиболее заметны (например, для xn: влияние обнаружено при его значениях отminx3доmax5).

Подходы к достижению этих целей начнём с упоминания о том, что у любой системы естественного происхождения параметры, характеризующие её внутренние состояния и внешние проявления, чаще всего представляют собой непрерывныенормально распределённые случайные величины.

Интересующий нас единственный отклик yодна из таких величин, множество{y} её возможных (в разные моменты «истории» системы) значенийyjобразуютГенеральную совокупность. Она исчерпывающим образом определяется (характеризуются)Математическим ожиданием М{y}случайной величиныyи теми отклонениями от него (отМ{y}) отдельных значений (yj), мерой которых (отклонений) являетсяГенеральная дисперсия σ2. Конкретизация этих двух (М{y}иσ2)параметровнормального распределения однозначно определяет Генеральную совокупность. Однако, такая конкретизация принципиальноневозможна. Судить о значениях этих параметров можнотолько приблизительнопо результатам наблюдения за поведением системы, например, по полученным экспериментально (измеренным прибором) нескольким значениям откликаyj . Подмножество{yj} таких случайных величинyjприj =1,2,3, …,mобразуютвыборкуиз Генеральной совокупности{y}объёмом (или мощностьюm) и должно быть помечено этим индексом{yjm . ВеличинаY(m)Ср, которую вычисляют по формулеY(m)Ср= yj, называетсявыборочной среднейдля Генеральной совокупности{y}и придостаточно большихm является практически терпимо точнойвыборочной оценкойматематического ожидания М{y}(YСр ~ М{y}). Символ «~» далее будет всегда обозначать: «является выборочной оценкой», а символ Ym будет обозначать: Y(m)Ср. На базе этой же выборки{ym} с объёмомmмогут быть вычислены

выборочная дисперсияs2m =(yj Ym)2и

исправленнаявыборочная дисперсия s2иm =(yj Y)2.

Последняя является несмещённой выборочной оценкойдисперсииσ2Генеральной совокупности{y}: (s2 ~σ2) .

В более общей форме, пригодной для вычисления любойисправленной выборочной дисперсииs2иm и вудобной при использовании компьютерав ходе планировании эксперимента) это выглядит так:

- s2 = s2иm= (Σs):fs, где сложным символом(Σs) m обозначена (обычно предварительно вычисляемая) сумма квадратов отклонений типа(yj Ym), то есть в примере выше

s)m = (yj Ym)2, , аfsпараметр исправленной дисперсииs2, который характеризует количество её степеней свободы (здесьfsm= m1).

Практически для суммы квадратов отклонений удобнее (для компьютерного планирования эксперимента) пользоваться другим выражением (Σs) m =(yj Ym)2=

= [(yj) 2–2(yj)Y + Y2] =[(yj) 2– 2(yj)(yj) +(y) 2] =

= (yj)2[2(y )(yj) +(yj)2] =СКmКЧm, гдеСКm=(yj)2 есть сумма квадратов откликов, аКЧm корректирующий член (так в вычислениях подобного рода принято называть поделённый на общее количество измеренийквадрат суммыоткликов КЧm =(yj)2.

Действительно: [– 2(yj)(yj) +[(yj)2] =

= [–2(yj)2 + (yj)21] =

= [–2(yj)2 +(yj)2m] =(yj)2 =КЧm.

Корректирующий член всегдапредставляет собойквадрат суммывсех значений выборки,поделённыйна объём этой выборки (здесь m).

Величины СКm иКЧm интегральные параметры выборки объёмm.Они здесьвспомогательные промежуточные величины, а выделены и особо обозначеныв связи с возникающими при таких выделениях удобствами технологического характера, которые проявляются при компьютерном планировании эксперимента.

Далее везде любуюисправленную выборочную дисперсию s2илюбмы будем считать по такой «стилизованной» формуле:

s2илюб =(Σилюб):fилюб=[СКилюбКЧилюб]:fилюб, заменяя индекс«люб»конкретным (соответствующим объёму выборки) индексом.

Смысл и удобства введения в рассмотрение и специального обозначения промежуточных величин выявятся позже при рассмотрениипланирования экспериментапри дисперсионном анализе.