- •И математической статистике
- •Часть II основные методы математической статистики
- •Владивосток
- •Раздел I основные методы математической статистики
- •1. Генеральная совокупность и выборка
- •1.1 Выборочный метод. Первичная обработка выборочных (экспериментальных) данных.
- •1.2 Выборочные числовые характеристики.
- •Которая называется выборочным средним.
- •2. Точечное оценивание параметров распределений
- •2.1 Свойства оценок; неравенство Крамера – Рао.
- •2.2 Методы получения оценок.
- •3. Интервальное оценивание параметров
- •3.1. Необходимые понятия и функции распределения
- •1) 2) 3)Независимы.
- •3.2 Интервальное оценивание параметров.
- •3.3 Оценки параметров нормального распределения.
- •3.4 Интервальное оценивание параметров распределений, отличных от нормального
- •4.1. Основные определения и используемые понятия.
- •4.2. Критерии согласия
- •1). Критерий Колмогорова
- •2). Критерий хи-квадрат Пирсона
- •3). Критерий Смирнова – Мизеса (критерий ω2)
- •4.3. Проверка гипотез относительно двух выборок
- •4.4. Непараметрические ранговые критерии.
- •5. Дисперсионный анализ: однофакторная модель.
- •6. Элементы прикладного корреляционного анализа
- •6.1. Введение: основные задачи, понятия и терминология.
- •6.2. Корреляция
- •6.3. Ранговая корреляция и сопряжённость
- •6.4.* Выборочные методы частного и множественного
- •Заключение
- •Разлел II вариаты практических заданий
- •1. Общие положения.
- •2. Алгоритмы – формулы расчёта выборок и предлагаемое их
- •Раздел III
- •1. Табулирование данных
- •2. Построение интервального вариационного ряда
- •3. Эмпирическая функция распределения и графическое преставление распеделения частот
- •4. Расчёт числовых характеристик вариационных рядов
- •Приложения Приложение I
- •Приложение II
- •Приложение III
- •Приложение IV Cтатистические таблицы
- •Примечания:1) функция Лапласа и интеграл ошибоксвязаны соотношением; 2)и.
- •Раздел I. Основные методы математической статистики
- •2.2. Методы получения оценок. . . . . . . . 12
- •3. Интервальное оценивание параметров. . . . 15
- •4.3. Проверка гипотез относительно двух выборок. . . . 25
- •4.4. Непараметрические ранговые критерии. . . . . 27
- •5. Основы дисперсионного анализа: однофакторная
- •6.2. Корреляция. . . . . . . . . . 34
- •6.4. Выборочные методы частного и множественного корреляционного
- •1. Общие положения . . . . . . . . . 67
- •2. Алгоритм – формулы расчёта выборок и предлагаемое их
- •Раздел 3. Комментарии и указания к решение типового
- •Часть II
5. Дисперсионный анализ: однофакторная модель.
Дисперсионный анализ объединяет значительное число задач математической статистики, в которых анализируется влияние тех или иных факторов на конечный результат. Предлагается к рассмотрению простейшая модель, в которой проверяется гипотеза о влиянии одного фактора.
Пусть имеется k независимых выборок
(5.1)
Все параметры m1; m2; …; mk; σ2 – неизвестны.
Проверяются гипотезы – H0 : m1 = m2 = … = mk = т ,
альтернативы – H1 : i ≠ j, такие, что ≠. .(5.2)
Такая задача возникает, например, в следующей ситуации. Пусть на k однотипных станках производятся или обрабатываются одинаковые детали. На выходе у каждой детали замеряется некоторый параметр (например, диаметр). Он является случайной величиной вследствие неизбежных отклонений от стандарта. Получаются те самые k выборок, причём индекс i = 1 ÷ k нумерует станки, а индекс j= 1 ÷ перечисляет детали, прошедшие через конкретный станок.
Гипотеза H0 утверждает, что неважно через какой станок прошла конкретная деталь – фактор станка не играет роли. Это соответствует тому, что средние значения всех выборок совпадают. Конкурирующая же гипотеза утверждает о наличии систематических отклонений для некоторых станков.
В более общем случае, можно трактовать рассмотренные выборки как отдельные группы в общем множестве наблюдений. Тогда гипотеза H0 утверждает, что это множество однородно – точнее, все наблюдения извлечены из одной генеральной совокупности, распределённой нормально с Φ(m, σ2). Альтернативная гипотеза говорит о том, что на множестве наблюдений действует хотя бы один посторонний фактор, что и вызывает расслоение множество наблюдений на неоднородные группы.
Для решения поставленной задачи рассмотрим следующие величины:
–выборочные средние; – общее среднее, гдеN = ; Q1 = – сумма квадратов отклонений между выборками (группами) – характеризует степень расхождения систематических ошибок, т. е. рассеивание по факторам ; Q2 = – внутригрупповая (выборочная) сумма квадратов отклонений – характеризует остаточное рассеяние, т. е. погрешности отдельных опытов; Q = – полная сумма квадратов отклонений наблюдений от общего среднего.
С помощью простых преобразований можно показать: Q = Q1 + Q2.
Если верна гипотеза H0, то Q /(N – 1) является несмещённой оценкой для σ2, а величина Q /σ2 χ2N – 1 , т. е. имеет хи-квадрат распределение с N – 1 степенью свободы. Также в предположении верности нулевой гипотезы все независимы и распределены нормальноN(m, σ2/). Тогда их среднее арифметическое (т. е. общее среднее) имеет оценку дисперсии /(k – 1) = kQ1/N(k – 1), т. е. величина Q1 /σ2 . Но и величинаQ2 /σ2 = Q /σ2 – Q1 /σ2 = /σ2 =–
Нетрудно доказать, что Q2 и Q2 – независимы. Тогда справедлива теорема.
Теорема 5.1. Если верна гипотеза H0, то приведённая ниже величина имеет распределение Фишера с (k – 1) и (N – k) степенями свободы, т. е.
. (5.3)
Соотношение (5.3) задаёт критерий для проверки гипотезы H0 для однофакторного дисперсионного анализа. Задаваясь уровнем значимости гипотезы 1 – ε = 1 – q/100, по таблице распределения Фишера находим q – процентное критическое значение Fq . Гипотеза H0 принимается с вероятностью 1 – ε, если выполняется неравенство F ≤ Fq. Критическая область для данной гипотезы соответствует области решений уравнения P{ F > Fq} = ε = q/100.