- •Основные условные обозначения в математической статистике
- •Содержание
- •Введение
- •Основы теории вероятностей
- •1Предмет и метод математической статистики
- •2Понятие случайного события
- •3Вероятность случайного события
- •4Основные теоремы теории вероятностей
- •4.1Сложение вероятностей
- •4.2Умножение вероятностей
- •4.3Вычисление вероятностей
- •Случайные переменные
- •5Понятие случайной переменной
- •5.1Дискретные случайные переменные
- •5.2Непрерывные случайные переменные
- •6Математическое ожидание и дисперсия
- •7Моменты
- •Дискретные распределения
- •8Биномиальное распределение и измерение вероятностей
- •9Распределение редких событий (Пуассона)
- •Основные модели теоретических распределений
- •10Прямоугольное (равномерное) распределение
- •11Нормальное распределение
- •12Логарифмически нормальное распределение
- •Распределения параметров выборки
- •13.1Проблема Беренса–Фишера
- •15Χ2–распределение
- •Основы математической статистики
- •16Средние величины
- •16.1Общие свойства средних величин
- •17Средняя арифметическая
- •17.1Средний ранг (непараметрическая средняя)
- •17.2Взвешенная средняя арифметическая
- •17.3Средняя квадратическая
- •17.4Мода
- •17.5Медиана
- •18Средняя геометрическая
- •19Средняя гармоническая
- •Разнообразие значений признака
- •20Стандартное (среднеквадратическое) отклонение
- •20.1Число степеней свободы
- •20.2Коэффициент вариации
- •20.3Лимиты и размах
- •20.4Приближенные значения μ и
- •20.5Нормированное отклонение
- •21Проверка выпадов (артефактов)
- •22Средняя и сигма суммарной группы
- •23Скошенность (асимметрия) и крутизна (эксцесс) кривой распределения
- •Графическое представление распределений
- •24Вариационный ряд
- •25Гистограмма и вариационная кривая
- •26Кумулята
- •27Достоверность различия распределений
- •27.1Критерий χ2 (хи квадрат)
- •27.2Критерий λ (лямбда)
- •27.3Критерий по асимметрии и эксцессу
- •Нормальное распределение
- •28Генеральная совокупность и выборка
- •29Репрезентативность
- •30Ошибки репрезентативности и другие ошибки исследований
- •31Доверительные границы
- •Оценка генеральных параметров
- •32Общий порядок оценки
- •32.1Оценка средней арифметической
- •32.2Оценка средней разности
- •32.3Недостоверная и достоверная оценка средней разности
- •32.4Оценка разности генеральных средних
- •33Критерий достоверности разности
- •34Репрезентативность при изучении качественных признаков
- •35Достоверность разности долей
- •Парная корреляция
- •36Коэффициент корреляции
- •37Ошибка коэффициента корреляции
- •37.1Достоверность выборочного коэффициента корреляции
- •37.2Доверительные границы коэффициента корреляции
- •37.3Достоверность разности двух коэффициентов корреляции
- •38Уравнение прямолинейной регрессии
- •39Ошибки элементов уравнения прямолинейной регрессии
- •Частная и множественная линейные корреляции и регрессии
- •40Частный коэффициент корреляции
- •41Множественный коэффициент корреляции
- •42Линейное уравнение множественной регрессии
- •Криволинейная корреляция и регрессия
- •43Корреляционное отношение
- •44Свойства корреляционного отношения
- •45Ошибка репрезентативности корреляционного отношения
- •46Критерий линейности корреляции
- •Однофакторный дисперсионный анализ
- •47Сущность и метод дисперсионного анализа
- •47.1Результативный признак
- •47.2Фактор
- •47.3Градации факторов
- •47.4Градации комплекса
- •47.5Дисперсионный комплекс
- •47.6Статистические влияния
- •47.7Факториальное влияние
- •47.8Случайное влияние
- •47.9Общее влияние
- •48Однофакторный дисперсионный комплекс
- •Многофакторный дисперсионный анализ
- •49Многофакторный дисперсионный комплекс
- •50Преобразования
- •51Универсальное использование дисперсий
- •51.1Показатели силы влияний
- •51.2Ошибка репрезентативности основного показателя силы влияния
- •51.3Предельные значения показателей силы влияния
- •51.4Достоверность влияний
- •Классификация
- •52Дискриминантный анализ
- •52.1Постановка задачи, методы решения, ограничения
- •52.2Предположения и ограничения
- •52.3Алгоритм дискриминантного анализа
- •53Кластерный анализ
- •53.1Методы кластерного анализа
- •53.2Алгоритм кластерного анализа
- •Литература
- •Приложение. Основные формулы и определения
- •2 46019, Г. Гомель, ул. Советская, 104
33Критерий достоверности разности
При том большом значении, которое имеет для исследователей получение достоверных разностей, появляется необходимость овладеть методами, позволяющими определить – достоверна ли полученная, реально существующая выборочная разность или, при всей ее материальной действительности, она не достоверна в описанном правильном понимании.
Достоверность выборочной разности измеряется особым показателем, который можно назвать критерием достоверности разности.
Критерий достоверности разности равен отношению выборочной разности к ее ошибке репрезентативности и определяется по формуле:
(10.20)
В этой формуле – разность выборочных средних, – ошибка выборочной разности, s1, s2 – ошибки репрезентативности сравниваемых выборочных показателей, tst – стандартное значение критерия, определяемое по таблице критериев Стьюдента, для заданного порога вероятности безошибочных прогнозов (0,95, 0,99, 0,999), в зависимости от числа степеней свободы, n1, n2 – численности сравниваемых выборок, – число степеней свободы для разности двух средних.
При использовании критерия достоверности разности возможны два основных случая:
td ≥ tst – полученный в исследовании критерий достоверности разности равен или превышает стандартное значение критерия, найденное по Стьюденту. В этом случае разность достоверна с определенной надежностью, т. е. соответствует по знаку генеральной разности.
td < tst – полученный в исследовании критерий достоверности разности меньше стандартного значения для минимального или требуемого порога вероятности. В этом случае разность недостоверна, что значит:
по выборочной разности нельзя сделать никакой оценки генеральной разности;
осталось невыясненным, какая из двух генеральных средних больше;
осталось недоказанным как наличие, так и отсутствие различия между генеральными средними.
За минимальный порог достоверности в подавляющем большинстве исследований принимается первый порог, соответствующий вероятности безошибочных прогнозов i = 0,95.
Техника определения достоверности разности показана на следующих примерах.
Пример
Сравнивался вес взрослых индеек двух пород после одинакового откорма по двум выборкам. Получены следующие сводные показатели:
n1 = 20, μ1±s1 = 4,0 ± 0,3 кг;
n2 = 25, μ2±s2 = 4,6 ± 0,4 кг.
Вторая порода в выборке показала больший вес:
d2-1 = μ2–μ1 = 4,6–4,0 = + 0,6.
Определение достоверности этой разности проведено следующим образом:
d = 0.6;
; = 20 + 25 – 2 = 43; tst = {2,0 – 2,7 – 3,5}.
Выводы
Полученные результаты (d2-1 = + 0,6) свидетельствуют, что в некоторых группах вторая порода может оказаться в среднем тяжелее первой.
Так как полученная разность оказалась недостоверной, то ничего нельзя заключить о всех представителях обеих пород; осталось невыясненным, какая порода (вся) может иметь больший средний вес; нельзя считать доказанным, что разницы в среднем весе между породами нет и что эти породы в среднем одинаковы по весу.
Пример
Предыдущее исследование было повторено на более обширном материале. Получены новые сводные показатели:
n1 = 100, μ1±s1 = 4,1 ± 0,1 кг;
n2 = 100, μ2±s2 = 4,7 ± 0,1 кг;
d2-1 = μ2 – μ1 = 4,7 – 4,1 = + 0,6 кг.
Определение достоверности разности дало следующие результаты:
d = 0,6;
; = 100 + 100 – 2 = 198;
tst = {2,0 – 2,6 – 3,4}.
Выводы
Полученная разность оказалась достоверна с высшей надежностью (р > 0,999); можно с уверенностью заключить, что вся вторая порода, а не только ее изученная часть, в среднем имеет больший вес взрослых индеек.
Если нужен прогноз среднего превышения второй породы над первой, например для того, чтобы запланировать экономическим эффект от перемены породы, то это можно сделать обычным методом доверительных границ:
= tstsd = 2,00,14 = 0,28 0,3;
= +0,60,3 – [не более +0,6+0,3 = 0,9 кг;
не менее +0,6–0,3 = 0,3 кг;
Гарантированный минимум превосходства второй породы: = +0,3 в среднем на голову.
В последнем примере та же по величине разность (0,6), что и в предыдущем, оказалась достоверной вследствие увеличения численности изученных выборок, так как уменьшились ошибки средних.
Так бывает не всегда. Может случиться, что с увеличением численности выборок уменьшается выборочная разность и вследствие этого достоверность ее не повышается; разность остается недостоверной и при большем объеме выборок.
В таких случаях при 2 – 3 повторениях исследования с увеличением численности выборок недостоверная разность уже может считаться доказательством того, что между сравниваемыми генеральными совокупностями не обнаружено различия по изучаемому признаку.
Пример
Изучалось число ядрышек в ядрах соматических клеток серебряного карася у однополых (1) и двуполых (2) особей. Получены следующие сводные показатели:
число исследованных клеток: n1 = 1602, n2 = 1601;
среднее число ядрышек на одну клетку:
μ1 s1 = 3.9 0,03; μ2 s2 = 2,3 0,02;
разность: d1-2 = 3,9 – 2,3 = +1,6;
Ошибка разности: ;
Критерий достоверности:
.
Разность оказалась в высшей степени достоверной: однополые и двуполые серебряные караси различаются по числу ядрышек на одно ядро в соматических клетках. У однополых число ядрышек в ядрах явно больше.