Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
часть 3.doc
Скачиваний:
120
Добавлен:
18.02.2016
Размер:
2.26 Mб
Скачать

§ 6. Линейная функция регрессии

В части 1 главы 2, параграфа 3.6. был рассмотрен коэффициент корреляции случайных величин .

где

называется корреляционным моментом. Доказано было одно из основных свойств:

коэффициент корреляции с.в. x и y равен , тогда с.в.x и y и линейно зависимы.

Допустим, что при изменении значений х переменной условное математическое ожиданиеизменятся по линейному закону. Предполагаетсялинейность функции регрессии:

Параметры k и b находятся из условия минимальности математического ожидания квадрата разности случайных величин и. При

достигается

Если функция регрессии линейна, то .

Определим генеральный коэффициент детерминации при условии линейности уравнения регрессии:

Если функция регрессии линейна, то генеральный коэффициент детерминации с точностью до знака совпадает с коэффициентом корреляции.

Пример 3. По данным примера 2 вычислить коэффициент корреляции и сравнить его с генеральным коэффициентом детерминации.

По закону распределения случайной величины найдем ее основные характеристики:

По данным совместного закона распределения иопределим корреляционный момент:

Определим коэффициент корреляции случайных величин :

Сравним генеральный коэффициент детерминации и коэффициент корреляции:

.

Тогда функция регрессии в пример 2 не является линейной.

§ 7. Однофакторный дисперсионный анализ

Дисперсионным анализом называется статистический метод анализа результатов от действия качественных факторов.

Пусть - случайная величина, представляющаярезультативный признак. Изучается действие фактора Ф на результативный признак. Фактор Ф не поддается количественному измерению, он является неизучаемым показателем. Данный фактор можно разделить на ряд уровней. (группу уровней).

Приведем примеры:

Пример 1. Интересуемся зависимостью объема выполненной работы за смену от работающей бригады. Результативным признаком будет объем выполненной работы за смену. Работающая бригада является фактором Ф, а номерработающей бригады является уровнемфактора Ф.

Пример 2. Изучаем влияние упаковки товара на объем реализации. Рассматривается несколько разных видов упаковки одного и того же товара. Результативным признаком будет объем проданного за день товара. Все виды упаковок перенумерованы. Упаковка является фактором Ф. Вид упаковки с номером будет-м уровнем фактора Ф.

В однофакторном дисперсионном анализе исследуется влияние или отсутствие влияния на результатирующий признак одного качественного фактора.

Случайной величиной будем обозначать результативный признак, в ходе эксперимента мы получаем значения этой случайной величины.

Пусть - уровни фактора Ф. При каждом уровне фактора Ф производятся наблюдения. Обозначим черезрезультатнаблюдения при-м уровне фактора Ф. Может быть проведено различное число наблюдений при разных уровнях фактора Ф. Предположим, что приуровня фактора Ф произведенонаблюдений, тогдазначения результативного признака при этих наблюдениях. Всего произведенонаблюдений при различных уровнях Ф. Эксперимент может проводиться сколько угодно раз, поэтомурассматриваются как случайные величины.

По данным эксперимента находятся групповые средние и групповые выборочные дисперсии

Результаты эксперимента, групповые математические ожидания и групповые выборочные дисперсии удобно расположить в таблице 7.1.

Таблица 7.1.

1

2

Уровень фактора Ф

Номер наблюдения

в столбце

1

2

Число наблюдений в группе

Групповое среднее

Групповая выборочная дисперсия

Предварительные суждения о том, зависит ли результативный признак от фактора Ф, можно вынести сравнив групповые средние: если различие между ними существенно, то, по-видимому, такая зависимость имеется. Однако, мы имеем результаты одного эксперимента, а ответ на вопрос, существует ли зависимость результативного признака от фактора, должен быть дан применительно к генеральной совокупности.

Пусть - математическое ожидание результативного признака при уровне,. Если при изменении уровня фактора групповые математические ожидания не меняются, то считаем, что результативный признак не зависит от фактора Ф. Мы имеем только выборку из генеральной совокупности, сами значения, нам не известны. Поэтому возникает задача проверки гипотезы:

(7.1)

Эта гипотеза проверяется только при выполнении ряда требований:

  1. При каждом уровне фактора наблюдения независимы и проводятся в одинаковых условиях. Наблюдения независимы при разных уровнях фактора.

  2. При каждом уровне фактора результативный признак имеет нормальный закон распределения с постоянной для каждого уровня дисперсий.

Итак, независимы и нормально распределены, причем,

Условия проведения эксперимента дают нам условие независимости случайных величин, представляющих результативный признак.

Используя критерий Пирсона, можно выяснить, приемлема ли гипотеза о нормальности распределения.

Проверку гипотезы равенства дисперсий результативного признака при разных уровнях фактора можно осуществить при помощи критерии Барлетта. Перейдем к описанию проверки гипотезы равенства дисперсий результативного признака при разных уровнях фактора.

Обозначим генеральную дисперсию результативного признака при-м уровне фактора,Сами значениянам не известны. Требуется проверить гипотезу

(7.2)

с заданным уровнем значимости .

Перейдем к построению критерия.

Находим несмещенные оценки групповых дисперсий:

Вычисляем промежуточные величины:

Определяем наблюдаемые значения критерия:

Величина называетсякритерием Барлетта. При условии и гипотезе равенства дисперсий результативного признака при разных уровнях фактора величинаимеет распределение, близкое к- распределению сстепенью свободы.

Определим критическую область. Используем таблицу 3:определяются значения , при которых выполняется соотношениегдеявляется случайной величиной, распределенной по законусстепенями свободы.

Дано ипо таблице 3 определяем критическую точкуКритической областью является интервал

Если то гипотезу(7.2) отвергаем. Если, то гипотеза о равенстве дисперсий результативного признака при разных уровнях фактора не противоречит результатам наблюдений с заданным уровнем значимости

Допустим, что требования 1 и 2 выполнены. Приступим к рассмотрению гипотезы (7.1).

Вычислим среднее всех наблюдаемых значений результативного признака:

Величину называютобщим средним признака .Разброс наблюдаемых значений результативного признака может быть вызван изменением уровня фактора Ф и изменчивостью значений случайных неконтролируемых факторов, влияющих на ,которые называются остаточными.

Чем сильнее влияние фактора Ф не результативный признак , тем сильнее изменчивость групповых средних и тем больше разброс их около общего среднего. Показателем этого разброса служит величина

Величина называетсявыборочной взвешенной дисперсией групповых средних.

При зафиксированном уровне фактора , разброс наблюдений вызывается влиянием остаточного фактора, этот разброс измеряется групповой дисперсиейНаходитсясреднее значение групповых дисперсий:

Общая вариация результативного признака измеряетсяобщей выборочной дисперсией Рассматривается среднее квадратов отклонений всех наблюдаемых значений от выборочного среднего

Общая выборочная дисперсия равна сумме выборочной взвешенной дисперсии групповых средних и средней групповых дисперсий:

.

Проверка гипотезы (7.1) о равенстве групповых математических ожиданий основывается на сравнении величини

Если гипотеза о равенстве групповых математических ожиданий верна, то величина

имеет F – распределение с числом степенной свободы и

Случайная величина подчиняется распределению Фишера сстепенями свободы. Это распределение называют ещеF – распределение с степенями свободы. В таблице 4 приводятся правосторонние критические границы этого распределения для разных значений степеней свободы:

Для разных значений нужно приводить соответствующие таблицы. В таблице 4 приводятся правосторонние критические значения при .

По данным наблюдений вычислено значение величины

Будем считать, что уровень значимости Используя таблицу 4, по степеням свободынаходим критическое значение

Если то гипотезуо равенстве групповых математических ожиданий отвергаем.

Если же то гипотезао равенстве групповых математических ожиданий не отвергаем с уровнем значимости

В этом случае говорят, что влияние фактора Ф на результативный признак не подтвердилось выборочными наблюдениями.

Допустим, что фактор Ф влияет на результативный признак. Для измерения степени влияния используют выборочный коэффициент детерминации

который показывает, какую долю выборочной дисперсии составляет выборочная дисперсия групповых средних. Итак, выборочный коэффициент детерминации показывает, какая доля общей выборочной дисперсии объясняется зависимостью результативного признака от фактора Ф.

Пример 1. Проведено 15 испытаний, из них 4 – на первом уровне фактора, 6 – на втором и 5 – на третьем. Методом дисперсионного анализа при уровне значимости 0,05 проверить нулевую гипотезу о равенстве групповых средних. Предполагается, что выборки извлечены из нормальных генеральных совокупностей с одинаковыми дисперсиями.

Номер испытаний

Уровни фактора

1

36

60

70

2

47

85

100

3

41

68

97

4

60

93

90

5

94

82

6

98

Находим групповые средние.

При первом уровне фактора произведено испытаний.

При втором уровне фактора произведено испытаний.

При третьем уровне фактора произведено 5 испытаний.

Всего проведено испытаний.

Найдем общее среднее результативного признака

.

Определим выборочную взвешенную дисперсию групповых средних:

Определим групповые выборочные дисперсии:

Найдем среднее значение групповых дисперсий:

.

Определим наблюдаемое значение критерия F:

Находим число степеней свободы:

Используем таблицу 4. При уровне значимости и по степенямнаходим критическое значение

Так как то гипотенузу о равенстве групповых математических ожиданий не отвергаем с уровнем значимости; влияние фактора Ф на результативный признакне подтвердилось.

Пример 2. Проведено 25 испытаний, из них 7 – на первом уровне фактора, 5- на втором, 7 –на третьем и 6 – на четвертом. Методом дисперсионного анализа при уровне значимости 0,05 проверить гипотезу о равенстве групповых дисперсий. Предполагается, что выборки извлечены из нормальных генеральных совокупностей.

Номер опыта

Уровени фактора

1

1600

1580

1450

1500

2

1610

1650

1550

1520

3

1650

1630

1600

1530

4

1680

1700

1620

1570

5

1700

1750

1650

1600

6

1700

1740

1640

7

1800

1820

Определим средние значения результативного признака при разных уровнях фактора:

Определим групповые выборочные дисперсии:

,

;

,

Найдем несмещенные оценки групповых дисперсий:

Вычислим промежуточные величины:

Определим наблюдаемое значение критерия:

Для нахождения критической точки используем таблицу 3. Число степеней свободы вероятностьтогда

Так как то гипотеза о равенстве дисперсий результативного признака при разных уровнях фактора не противоречит результатам наблюдений с уровнем значимости

В примере 2 имеется утверждение о том, что выборки извлечены из нормальных генеральных совокупностей, мы доказали, что эти совокупности имеют одинаковые дисперсии. Теперь мы можем проверить гипотезу о равенстве групповых средних.

Найдем общее среднее результативного признака

Определим взвешенную дисперсию групповых средних:

Найдем среднее значение групповых дисперсий:

Определим наблюдаемое значение критерия F:

Для нахождения критического значения используем таблицу 4. При уровне значимости 0,05 и степенях свободы Находим критическое значение:

Так как то гипотезу о равенстве групповых математических ожиданий не отвергаем с уровнем значимостиВлияние фактора Ф на результативный признакне подтвердилось.