- •1. Основные сведения из теории вероятностей и математической статистики
- •1.1. Основные понятия
- •1.2. Законы распределения случайных величин при малом объеме выборки
- •2. Дисперсионный анализ данных наблюдений
- •2.1. Однофакторный дисперсионный анализ
- •Контрольный расчет
- •Оценка влияния отдельных факторов
- •Однофакторный дисперсионный анализ
- •2.2. Двухфакторный дисперсионный анализ
- •Дисперсионный анализ без повторений
- •Дисперсионный анализ с повторениями
- •2.3. Дисперсионный анализ в материаловедении
- •2.4. Дисперсионный анализ в геодезии
- •3. Формирование выборки из выборок малого объема
- •3.1. Проверка однородности независимых выборок
- •3.2. Проверка однородности парных наблюдений
1.2. Законы распределения случайных величин при малом объеме выборки
Классическая теория, основанная на нормальном законе распределения, при малых выборках неприменима. В этом случае используются другие законы распределения, разработанные микростатистикой: распределения Стьюдента и Фишера.
- распределение Стьюдента. Известно, что если из нормально распределенной совокупности значений случайной величины путем - кратного независимого выбора взять выборки объемом, то средние значения этих выборок будут тоже распределены нормально с тем же средним значением, но с меньшей дисперсией, т.е.
.
Отношение отклонения выборочного среднего значения от его математического ожидания(среднее значение генеральной совокупности) к основной ошибкеназываетсястатистикой. Эта статистика имеет нормальное распределение с равным нулю средним значением и равной 1 дисперсией
.
При научных исследованиях дисперсия генеральной совокупности почти всегда неизвестна и поэтому нельзя выполнить нормирование. По выборке можно определить несмещенную оценкудисперсии
.
Отклонение выборочного среднего значения от среднего значения генеральной совокупности, нормированное при помощи этой оценки, называется статистикой:
.
При =30- распределение практически мало отличается от нормального распределения. При малых значениях- распределение заметно отличается от нормального распределения. Оно более островершинное.
- распределение Фишера. Рассмотрим распределение статистики . Имеются две независимые выборки разных объемов, средние значения которыхи. По данным этих выборок получены оценкиидисперсий генеральных совокупностей с числами свободыи.
Требуется выяснить, являются ли эти оценки существенно различными, или данные выборки можно рассматривать как взятые наудачу из нормальных генеральных совокупностей, имеющих равные дисперсии .
Для решения этой задачи применяется статистика , называемая дисперсионным отношением. Статистикапредставляет отношение оценоки, полученных из независимых выборок, взятых наудачу из нормальных генеральных совокупностей с одинаковой дисперсией:
при >.
- распределение Фишера выражает вероятность того, что некоторое значение будет больше или равно:
- распределение не зависит от дисперсии генеральной совокупности, а зависит от чисел степеней свободы. График плотности распределения приведен на рис. 1.8.
Рис. 1.8. - распределение Фишера
Статистика чаще всего применяется при дисперсионном анализе, в котором требуется только односторонний критерий значимости. Нулевая гипотеза, которая проверяется при помощи статистики, состоит в том, что выборки взяты из одной нормальной генеральной совокупности или из разных нормальных генеральных совокупностей, имеющих равные дисперсии.
Распределения Фишера и Стьюдента используются при формировании выборки из выборок малого объема и установлении статистической значимости случайных величин, параметров и уравнений.
Малая выборка содержит мало информации об интересующем свойстве. Для получения более надежных выводов требуется объединить малые выборки в одну, но при этом необходимо установить их однородность. Совокупности однородны, если их математические ожидания равны.
Критериями для сравнения выборок служат: равенство двух выборочных дисперсий, равенство двух выборочных средних и однородность ряда выборочных дисперсий.
Критерий однородности ряда дисперсий. Однородность дисперсий ошибок измерений случайной величины в случае равного объема выборок оценивают по критерию Кохрена, расчетное значение которого определяют по формуле
,
где - дисперсия ошибок измерения СВ- й выборки;- число выборок.
Критическое значение критерия определяют по таблице (приложение 1) при заданных значениях уровня значимости и степенях свободы:;, где- число измерений (объем выборки).
Пример 1.3. При определении предела прочности получены следующие значения дисперсий ошибок измерений пяти партий бетона: 2,5; 2,8; 3,2; 2,4; 2,7. Ошибки во всех случаях подсчитывались по 17 – ти измерениям.
Оценить однородность дисперсий ошибок измерений прочности, т.е. возможность проведения дисперсионного анализа.
Определяем расчетное значение критерия
==0,235.
Критическое значение критерия при иравно 0,3645. Таким образом,, гипотеза об однородности дисперсий ошибок измерений подтверждается с вероятностью 95 % и можно проводить дисперсионный анализ. Результаты расчета в среде ЭТ приведены в таблице 1.5.
Т а б л и ц а 1.5
Расчет в среде ЭТ
Критерий равенства двух дисперсий. Для сравнения дисперсий двух выборок используют - критерий Фишера. Определяют расчетное значение- критерия в виде отношения большей дисперсии к меньшей
.
Так как проверяется гипотеза о равенстве генеральных дисперсий, то желательно, чтобы это отношение было как можно ближе к единице. Критическое значение - критерия вычисляем с помощью статистической функцииРАСПОБР. Число степеней свободы принимают соответственно, где- объем выборки. Гипотеза о равенстве дисперсий подтверждается, если.
Критерий равенства двух средних. Для сравнения двух выборочных средних используют - статистику. После проверки гипотезы о равенстве двух выборочных дисперсий, вычисляют общую дисперсию двух выборок и расчетное значение- статистики по формулам:
.
Критическое значение - статистики определяем с помощью статистической функции СТЬЮДРАСПОБР. Число степеней свободы. Гипотеза о равенстве средних значений подтверждается, если.
Пример 1.4. Сравним результаты испытаний двух выборок образцов бетона. В первой выборке объемом 29 образцов средний предел прочности =40,1 МПа, дисперсия=8,2. Во второй выборке объемом 13 образцов средний предел прочности=40,9 МПа, дисперсия=7,1.
Расчетное значение - критерия:
=8,2/7,1=1,155.
Диалоговое окно функции РАСПОБР представлено на рис. 1.9.
Степени свободы
=28+12=40. Критические значения - критерия при различных значениях уровня значимости приведены в таблице 1.6.
Рис. 1.9. Диалоговое окно функции FРАСПОБР
Т а б л и ц а 1.6
Результаты расчета в среде ЭТ
Так как расчетное значение - критерия меньше критических значений при всех уровнях значимости, то гипотеза о равенстве дисперсий подтверждается.
Определим общую дисперсию
Вычислим расчетное значение - статистики.
Критические значения - статистики при различных значениях уровня значимости приведены в таблице 1.6.
.
Расчетное значение - статистики при всех уровнях значимости меньше критического значения. Следовательно, между средними значениями прочности бетона двух выборок нет существенного различия.
Для установления статистической значимости случайной величины определяют расчетное значение - статистики по формуле
и сравнивают его с критическим значением . Если, то СВ статистически значима.
Пусть при испытании 5 – ти образцов оказалось, что среднее значение прочности на сжатие равно МПа, а стандартное отклонениеМПа.
Расчетное значение
.
Критическое значение при равно. Так как, то данное среднее значение прочности на сжатие статистически значимо.