Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции по теории вероятностей20101.doc
Скачиваний:
32
Добавлен:
26.08.2019
Размер:
1.75 Mб
Скачать

Двухвыборочный f-тест для дисперсий.

Для того, чтобы определить на основе выборочных данных равны ли дисперсии или нет, мы рассмотрим процедуру проверки гипотезы о равенстве дисперсий двух независимых нормально распределённых случайных величин. Эта задача имеет также самостоятельное значение, поскольку дисперсия характеризует точность работы приборов или технологических процессов, обработки данных и т.п. Убедившись в равенстве двух дисперсий, мы тем самым убеждаемся, например, в том, что два прибора обеспечивают одинаковую точность.

В математической статистике доказывается, что если гипотеза о равенстве дисперсий двух случайных величин выполняется: H0: = , то величина распределена в соответствии с законом распределения Фишера.

Это отношение F называют дисперсионным отношением Фишера и используют в качестве критерия проверки нулевой гипотезы.

Распределение Фишера характеризуется наличием степеней свободы, которые вычисляются по формулам:

Поскольку величина F - неотрицательная, то критическая область данной величины будет принадлежать интервалу (0;+).

Альтернативными гипотезами являются гипотезы:

Н1: > при >

Н1: < при <

Последовательность проверки гипотезы:

  1. Производится расчёт F-статистики Фишера.

  2. Pадаёмся уровнем значимости , который находится в пределах от 0,01 до 0,05.

  3. Вычисляется число степеней свободы: df1 , df2 .

  4. Находим критическое значение Fкр равное F ,df1,df2, используя таблицы, либо с помощью функции FРАСПОБР.

  5. Сравниваем рассчитанное значение значения F-статистики и критическое: если Fрасч >Fкр , то гипотеза отвергается.

Инструмент анализа «двухвыборочный F-тест для дисперсий»

Служит для проверки нулевой гипотезы.

Последовательность действий:

- задаются интервалы Х и У;

- задаётся уровень значимости.

Выдаются:

- средние значения для случайной переменной Х и У,

-дисперсии для Х и У,

-число наблюдений,

-число степеней свободы,

-значение F-критерия,

- критическое значение.

Кроме инструмента анализа «двухвыборочный F-тест для дисперсий» можно использовать функции:

  1. =ФТЕСТ (аналогичен режиму «двухвыборочный F-тест для дисперсий»).

  2. =FРАСПОБР (для нахождения критического значения) ).

  3. =FРАСП (вычисляет p-уровень для расчетного значения F-статистики, и этот p-уровень сравнивается с уровнем значимости . Для того, чтобы принять гипотезу о равенстве дисперсий p - уровень должен быть больше уровня значимости ).

Парный двухвыборочный t-тест для средних значений.

Рассмотренные нами процедуры использовались для сравнения средних величин для двух независимых генеральных совокупностей на основе извлеченных из них выборок. Парный двухвыборочный t-тест для средних значений позволяет оценить разность между математическими ожиданиями двух генеральных совокупностей, связанных между собой, когда показатели первой группы зависят от показателей другой. Использование этого теста часто применяются для того, чтобы обнаружить результат какого-либо воздействия или, наоборот, доказать отсутствие этого воздействия. Чем более однородными окажутся выбранные для эксперимента объекты, чем меньше их различия, тем точнее будет ответ на вопрос о том, имеет ли место какое либо воздействие на результат или нет.

Различия между объектами, выбранными для обнаружения воздействия некоторого фактора на результат, будет меньше, если для воздействия и контроля выступает один и тот же объект.

Например, необходимо проверить, влияет ли разность температур на величину растяжения металлической проволоки. Каждый из n образцов проволоки разламывается на два одинаковых куска, для одного измеряется нагрузка на растяжение при низкой температуре, а для другого при высокой температуре. Составляют группы экспериментальных объектов. Для каждого объекта измеряют два значения интересующей нас величины (при двух разных воздействиях), т.е.возникают пары наблюдения (парные длины).

1

2

3

4

5

6

7

8

9

10

Низкая температура

10,40

10,36

10,38

10,41

10,43

10,42

10,39

10,41

10,38

10,40

Высокая температура

10,41

10,38

10,38

10,43

10,44

10,42

10,40

10,42

10,38

10,41

Пусть хi и уi - результаты измерения для объекта i, где 1 i n, тогда совокупность случайных величин: {(х11), …, (хn,yn)} образует парные данные. Все наблюдения считаются реализациями случайных величин X, Y. При этом предполагается, что для двух разных объектов они независимы. Однако наблюдения, входящие в одну пару нельзя считать независимыми, т.к. они относятся к одному объекту и, следовательно, они отражают свойства общего объекта и могут зависеть друг от друга. Поэтому, для того, чтобы характеризовать пару наблюдений (хi , уi ) вводится новая случайная переменная . Эту переменную можно считать независимой и нормально распределённой случайной величиной.

Таким образом, задача о парных данных сводится к задаче об одной нормальной выборке при неизвестной дисперсии .

При неизвестной дисперсии гипотеза выглядит следующим образом:

Н0: md=a0 , где md = mx – my –это математическое ожидание случайной величины d, a0 –заранее заданное число - гипотетическая разность, равная в данном случае нулю.

Для проверки этой гипотезы используется t-критерий, который вычисляется по формуле:

,

где

.

t-критерий имеет распределение Стьюдента с числом степеней свободы df=n-1.

Для проверки гипотезы о различиях между средними используется инструмент анализа «Парный двухвыборочный t-тест для средних» на основе парных выборочных данных. При этом равенства дисперсий генеральных совокупностей не предполагается. В диалоговом окне задаются интервалы переменной 1 и переменной 2, гипотетическая разность, равная нулю.

Если дисперсия случайной величины D известна, то можно использовать аналог z – критерия

который имеет нормальное распределение.

Результат применения инструмента анализа «Парный двухвыборочный t-тест для средних» к данным испытания по растяжению проволоки приведены в таблице.

Парный двухвыборочный t-тест для средних

 

Переменная 1

Переменная 2

Среднее

10,398

10,407

Дисперсия

0,00044

0,000467778

Наблюдения

10

10

Корреляция Пирсона

0,940464883

Гипотетическая разность средних

0

df

9

t-статистика

-3,857142857

P(T<=t) одностороннее

0,001931949

t критическое одностороннее

1,833113856

P(T<=t) двухстороннее

0,003863898

t критическое двухстороннее

2,262158887

 

Поскольку альтернативная гипотеза состоит в том, что md ≠ a0, необходимо использовать двухсторонний критерий. Поскольку p – уровень имеет маленькое значение (0,003863898), то гипотезу о равенстве средних значений можно отвергнуть при уровне значимости α = 0,01. Следовательно можно утверждать, что температура влияет на величину растяжения проволоки.