- •Пример.
- •Определение случайного события.
- •Несовместные события.
- •Вероятность случайного события.
- •Свойства вероятности
- •Классическое определение вероятности события
- •Пример.
- •Основные формулы теории вероятностей Независимость случайных событий.
- •Правило умножения вероятностей
- •Вероятность суммы событий.
- •Некоторые формулы комбинаторики. Правило сложения.
- •Правило умножения.
- •Пример.
- •Размещения и перестановки
- •Сочетания
- •Формула Пуассона
- •Формула полной вероятности.
- •Случайная величина.
- •Пример.
- •Дискретные случайные величины.
- •Непрерывные случайные величины.
- •Числовые характеристики случайных величин.
- •Свойства дисперсии.
- •Некоторые законы распределения. Биномиальный закон распределения.
- •Закон распределения Пуассона.
- •Полиномиальное распределение
- •Пример.
- •Равномерный закон распределения случайной величины.
- •Нормальный закон распределения случайной величины (закон Гаусса).
- •Стандартная форма нормального закона распределения.
- •Распределение «хи-квадрат».
- •График распределения.
- •Показательный (экспоненциальный) закон распределения.
- •Структурные характеристики распределения случайной величины.
- •Медиана.
- •Квантиль.
- •Системы случайных величин.
- •Свойства функции распределения.
- •Свойства плотности вероятности.
- •Математическое ожидание и дисперсия системы случайных величин.
- •Дисперсия двумерной случайной величины.
- •Условное математическое ожидание.
- •Свойства коэффициента корреляции.
- •Функции случайных величин. Функции одной случайной величины.
- •Функция двух случайных величин.
- •Случайные функции.
- •Свойства математического ожидания случайной функции.
- •Свойства дисперсии случайной функции.
- •Свойства корреляционной функции.
- •Свойства взаимной корреляционной функции.
- •Свойства корреляционной функции стационарной случайной функции.
- •Математическая статистика. Выборочный метод.
- •Свойства эмпирической функции распределения.
- •Статистические оценки параметров распределения. Точечные оценки.
- •Метод моментов.
- •Метод наибольшего правдоподобия.
- •Распределение дискретной случайной величины.
- •Распределение непрерывной случайной величины.
- •Распределение выборочных характеристик.
- •Пример 1.
- •Пример 2.
- •3.Распределение выборочной дисперсии.
- •Доверительные интервалы.
- •Проверка статистических гипотез.
- •1.Понятие статистической гипотезы.
- •Проверкa гипотезы о равенствt средних двух нормальных распределений с известными дисперсиями.
- •Двухвыборочный t-тест с одинаковыми и различными дисперсиями.
- •Двухвыборочный f-тест для дисперсий.
- •Парный двухвыборочный t-тест для средних значений.
- •Дисперсионный анализ.
- •Двухфакторный дисперсионный анализ без повторений и с повторениями
Двухвыборочный f-тест для дисперсий.
Для того, чтобы определить на основе выборочных данных равны ли дисперсии или нет, мы рассмотрим процедуру проверки гипотезы о равенстве дисперсий двух независимых нормально распределённых случайных величин. Эта задача имеет также самостоятельное значение, поскольку дисперсия характеризует точность работы приборов или технологических процессов, обработки данных и т.п. Убедившись в равенстве двух дисперсий, мы тем самым убеждаемся, например, в том, что два прибора обеспечивают одинаковую точность.
В математической статистике доказывается, что если гипотеза о равенстве дисперсий двух случайных величин выполняется: H0: = , то величина распределена в соответствии с законом распределения Фишера.
Это отношение F называют дисперсионным отношением Фишера и используют в качестве критерия проверки нулевой гипотезы.
Распределение Фишера характеризуется наличием степеней свободы, которые вычисляются по формулам:
Поскольку величина F - неотрицательная, то критическая область данной величины будет принадлежать интервалу (0;+).
Альтернативными гипотезами являются гипотезы:
Н1: > при >
Н1: < при <
Последовательность проверки гипотезы:
Производится расчёт F-статистики Фишера.
Pадаёмся уровнем значимости , который находится в пределах от 0,01 до 0,05.
Вычисляется число степеней свободы: df1 , df2 .
Находим критическое значение Fкр равное F ,df1,df2, используя таблицы, либо с помощью функции FРАСПОБР.
Сравниваем рассчитанное значение значения F-статистики и критическое: если Fрасч >Fкр , то гипотеза отвергается.
Инструмент анализа «двухвыборочный F-тест для дисперсий»
Служит для проверки нулевой гипотезы.
Последовательность действий:
- задаются интервалы Х и У;
- задаётся уровень значимости.
Выдаются:
- средние значения для случайной переменной Х и У,
-дисперсии для Х и У,
-число наблюдений,
-число степеней свободы,
-значение F-критерия,
- критическое значение.
Кроме инструмента анализа «двухвыборочный F-тест для дисперсий» можно использовать функции:
=ФТЕСТ (аналогичен режиму «двухвыборочный F-тест для дисперсий»).
=FРАСПОБР (для нахождения критического значения) ).
=FРАСП (вычисляет p-уровень для расчетного значения F-статистики, и этот p-уровень сравнивается с уровнем значимости . Для того, чтобы принять гипотезу о равенстве дисперсий p - уровень должен быть больше уровня значимости ).
Парный двухвыборочный t-тест для средних значений.
Рассмотренные нами процедуры использовались для сравнения средних величин для двух независимых генеральных совокупностей на основе извлеченных из них выборок. Парный двухвыборочный t-тест для средних значений позволяет оценить разность между математическими ожиданиями двух генеральных совокупностей, связанных между собой, когда показатели первой группы зависят от показателей другой. Использование этого теста часто применяются для того, чтобы обнаружить результат какого-либо воздействия или, наоборот, доказать отсутствие этого воздействия. Чем более однородными окажутся выбранные для эксперимента объекты, чем меньше их различия, тем точнее будет ответ на вопрос о том, имеет ли место какое либо воздействие на результат или нет.
Различия между объектами, выбранными для обнаружения воздействия некоторого фактора на результат, будет меньше, если для воздействия и контроля выступает один и тот же объект.
Например, необходимо проверить, влияет ли разность температур на величину растяжения металлической проволоки. Каждый из n образцов проволоки разламывается на два одинаковых куска, для одного измеряется нагрузка на растяжение при низкой температуре, а для другого при высокой температуре. Составляют группы экспериментальных объектов. Для каждого объекта измеряют два значения интересующей нас величины (при двух разных воздействиях), т.е.возникают пары наблюдения (парные длины).
№ |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Низкая температура |
10,40 |
10,36 |
10,38 |
10,41 |
10,43 |
10,42 |
10,39 |
10,41 |
10,38 |
10,40 |
Высокая температура |
10,41 |
10,38 |
10,38 |
10,43 |
10,44 |
10,42 |
10,40 |
10,42 |
10,38 |
10,41 |
Пусть хi и уi - результаты измерения для объекта i, где 1 i n, тогда совокупность случайных величин: {(х1,у1), …, (хn,yn)} образует парные данные. Все наблюдения считаются реализациями случайных величин X, Y. При этом предполагается, что для двух разных объектов они независимы. Однако наблюдения, входящие в одну пару нельзя считать независимыми, т.к. они относятся к одному объекту и, следовательно, они отражают свойства общего объекта и могут зависеть друг от друга. Поэтому, для того, чтобы характеризовать пару наблюдений (хi , уi ) вводится новая случайная переменная . Эту переменную можно считать независимой и нормально распределённой случайной величиной.
Таким образом, задача о парных данных сводится к задаче об одной нормальной выборке при неизвестной дисперсии .
При неизвестной дисперсии гипотеза выглядит следующим образом:
Н0: md=a0 , где md = mx – my –это математическое ожидание случайной величины d, a0 –заранее заданное число - гипотетическая разность, равная в данном случае нулю.
Для проверки этой гипотезы используется t-критерий, который вычисляется по формуле:
,
где
.
t-критерий имеет распределение Стьюдента с числом степеней свободы df=n-1.
Для проверки гипотезы о различиях между средними используется инструмент анализа «Парный двухвыборочный t-тест для средних» на основе парных выборочных данных. При этом равенства дисперсий генеральных совокупностей не предполагается. В диалоговом окне задаются интервалы переменной 1 и переменной 2, гипотетическая разность, равная нулю.
Если дисперсия случайной величины D известна, то можно использовать аналог z – критерия
который имеет нормальное распределение.
Результат применения инструмента анализа «Парный двухвыборочный t-тест для средних» к данным испытания по растяжению проволоки приведены в таблице.
Парный двухвыборочный t-тест для средних |
|
|
|
|
|
|
Переменная 1 |
Переменная 2 |
Среднее |
10,398 |
10,407 |
Дисперсия |
0,00044 |
0,000467778 |
Наблюдения |
10 |
10 |
Корреляция Пирсона |
0,940464883 |
|
Гипотетическая разность средних |
0 |
|
df |
9 |
|
t-статистика |
-3,857142857 |
|
P(T<=t) одностороннее |
0,001931949 |
|
t критическое одностороннее |
1,833113856 |
|
P(T<=t) двухстороннее |
0,003863898 |
|
t критическое двухстороннее |
2,262158887 |
|
Поскольку альтернативная гипотеза состоит в том, что md ≠ a0, необходимо использовать двухсторонний критерий. Поскольку p – уровень имеет маленькое значение (0,003863898), то гипотезу о равенстве средних значений можно отвергнуть при уровне значимости α = 0,01. Следовательно можно утверждать, что температура влияет на величину растяжения проволоки.