- •Основные условные обозначения в математической статистике
- •Содержание
- •Введение
- •Основы теории вероятностей
- •1Предмет и метод математической статистики
- •2Понятие случайного события
- •3Вероятность случайного события
- •4Основные теоремы теории вероятностей
- •4.1Сложение вероятностей
- •4.2Умножение вероятностей
- •4.3Вычисление вероятностей
- •Случайные переменные
- •5Понятие случайной переменной
- •5.1Дискретные случайные переменные
- •5.2Непрерывные случайные переменные
- •6Математическое ожидание и дисперсия
- •7Моменты
- •Дискретные распределения
- •8Биномиальное распределение и измерение вероятностей
- •9Распределение редких событий (Пуассона)
- •Основные модели теоретических распределений
- •10Прямоугольное (равномерное) распределение
- •11Нормальное распределение
- •12Логарифмически нормальное распределение
- •Распределения параметров выборки
- •13.1Проблема Беренса–Фишера
- •15Χ2–распределение
- •Основы математической статистики
- •16Средние величины
- •16.1Общие свойства средних величин
- •17Средняя арифметическая
- •17.1Средний ранг (непараметрическая средняя)
- •17.2Взвешенная средняя арифметическая
- •17.3Средняя квадратическая
- •17.4Мода
- •17.5Медиана
- •18Средняя геометрическая
- •19Средняя гармоническая
- •Разнообразие значений признака
- •20Стандартное (среднеквадратическое) отклонение
- •20.1Число степеней свободы
- •20.2Коэффициент вариации
- •20.3Лимиты и размах
- •20.4Приближенные значения μ и
- •20.5Нормированное отклонение
- •21Проверка выпадов (артефактов)
- •22Средняя и сигма суммарной группы
- •23Скошенность (асимметрия) и крутизна (эксцесс) кривой распределения
- •Графическое представление распределений
- •24Вариационный ряд
- •25Гистограмма и вариационная кривая
- •26Кумулята
- •27Достоверность различия распределений
- •27.1Критерий χ2 (хи квадрат)
- •27.2Критерий λ (лямбда)
- •27.3Критерий по асимметрии и эксцессу
- •Нормальное распределение
- •28Генеральная совокупность и выборка
- •29Репрезентативность
- •30Ошибки репрезентативности и другие ошибки исследований
- •31Доверительные границы
- •Оценка генеральных параметров
- •32Общий порядок оценки
- •32.1Оценка средней арифметической
- •32.2Оценка средней разности
- •32.3Недостоверная и достоверная оценка средней разности
- •32.4Оценка разности генеральных средних
- •33Критерий достоверности разности
- •34Репрезентативность при изучении качественных признаков
- •35Достоверность разности долей
- •Парная корреляция
- •36Коэффициент корреляции
- •37Ошибка коэффициента корреляции
- •37.1Достоверность выборочного коэффициента корреляции
- •37.2Доверительные границы коэффициента корреляции
- •37.3Достоверность разности двух коэффициентов корреляции
- •38Уравнение прямолинейной регрессии
- •39Ошибки элементов уравнения прямолинейной регрессии
- •Частная и множественная линейные корреляции и регрессии
- •40Частный коэффициент корреляции
- •41Множественный коэффициент корреляции
- •42Линейное уравнение множественной регрессии
- •Криволинейная корреляция и регрессия
- •43Корреляционное отношение
- •44Свойства корреляционного отношения
- •45Ошибка репрезентативности корреляционного отношения
- •46Критерий линейности корреляции
- •Однофакторный дисперсионный анализ
- •47Сущность и метод дисперсионного анализа
- •47.1Результативный признак
- •47.2Фактор
- •47.3Градации факторов
- •47.4Градации комплекса
- •47.5Дисперсионный комплекс
- •47.6Статистические влияния
- •47.7Факториальное влияние
- •47.8Случайное влияние
- •47.9Общее влияние
- •48Однофакторный дисперсионный комплекс
- •Многофакторный дисперсионный анализ
- •49Многофакторный дисперсионный комплекс
- •50Преобразования
- •51Универсальное использование дисперсий
- •51.1Показатели силы влияний
- •51.2Ошибка репрезентативности основного показателя силы влияния
- •51.3Предельные значения показателей силы влияния
- •51.4Достоверность влияний
- •Классификация
- •52Дискриминантный анализ
- •52.1Постановка задачи, методы решения, ограничения
- •52.2Предположения и ограничения
- •52.3Алгоритм дискриминантного анализа
- •53Кластерный анализ
- •53.1Методы кластерного анализа
- •53.2Алгоритм кластерного анализа
- •Литература
- •Приложение. Основные формулы и определения
- •2 46019, Г. Гомель, ул. Советская, 104
25Гистограмма и вариационная кривая
Гистограмма – это вариационный ряд, представленный в виде диаграммы, в которой различная величина частот изображается различной высотой столбиков. Гистограмма распределения данных представлена на рисунке 8.1 (а).
|
|
а) |
б) |
Рисунок 8.1 – Графическое представление выборки: а– гистограмма, б – вариационная кривая |
На гистограмме наглядно проявляются особенности распределения. При помощи гистограмм затруднено сравнение нескольких распределений. Поэтому разработаны другие способы графической иллюстрации особенностей распределения.
Вариационная кривая – это изображение вариационного ряда в виде кривой, ординаты которой пропорциональны частотам вариационного ряда. Вариационная кривая того же распределения данных представлена на рисунке 8.1 (б). Вариационная кривая – очень удобный и наглядный способ иллюстрации, особенно в тех случаях, когда на одном графике желательно изобразить несколько распределений.
На рисунке 8.2 показаны результаты опыта, в котором семена помидоров, подвергались облучению различными дозами рентгеновских лучей 2, 4 и 8 р. На контрольной и трех опытных делянках на случайно выбранных 100 кустах подсчитывалось число завязавшихся плодов. Распределение кустов по числу завязавшихся плодов (2 – 4 – 6... 20 – 22) для трех доз облучения (2, 4, 8 р) и для контроля показаны в нижней части рисунка в форме вариационных рядов, а в верхней – в форме вариационных кривых. Сопоставление четырех вариационных кривых позволяет сделать вывод:
доза 2 р не увеличивает против контроля ни среднего числа плодов, ни разнообразия этого признака;
доза 4 р оказывает явно повышающее действие и на средний уровень, и на разнообразие;
доза 8 р угнетает образование плодов.
Рисунок 8.2 – Сопоставление вариационных кривых
26Кумулята
Кумулята – это изображение распределения в виде кривой, ординаты которой пропорциональны накопленным частотам вариационного ряда. Чтобы составить ряд накопленных частот, нужно к частоте первого, наименьшего класса, прибавить частоту второго класса ( f2 для второго класса), затем прибавить частоту третьего класса ( f3 для третьего класса) и т. д. Кумулята для распределений веса показана на рисунке 8.3. Кумулята иногда имеет преимущество перед вариационной кривой.
Рисунок 8.3 – Кумулята
Некоторые методы математической статистики основаны на использовании кумуляты. К ним относятся, например, критерий лямбда и χ2, определяющие достоверность различия двух распределений.
27Достоверность различия распределений
Статистическая гипотеза – это определённое предположение о распределении вероятностей, лежащем в основе наблюдаемой выборки данных.
Проверка статистической гипотезы – это процесс принятия решения о том, противоречит ли рассматриваемая статистическая гипотеза наблюдаемой выборке данных.
Статистический тест или статистический критерий – строгое математическое правило, по которому принимается или отвергается статистическая гипотеза.
Наряду с нулевой гипотезой, которая принимается или отвергается по результату анализа выборки, статистические критерии могут опираться на дополнительные предположения, которые априори предполагаются выполненными.
Параметрические критерии предполагают, что выборка порождена распределением из заданного параметрического семейства. В частности, существует много критериев, предназначенных для анализа выборок из нормального распределения. Преимущество этих критериев в том, что они более мощные. Гипотезы о виде распределения проверяются с помощью критериев согласия.
Не всегда эмпирическое распределение хорошо соответствует нормальному. Для практических и научных работ часто требуется выяснить, сильно или слабо расходятся эмпирический и теоретический ряды. Для этого необходимо установить такой предел, недостижение которого означает, что расхождение между эмпирическим и нормальным распределениями еще не настолько велико, чтобы с ним считаться, и что данный эмпирический ряд еще можно практически принять за нормальный. Для этой цели применяются особые показатели, из которых в биологических исследованиях используются критерий χ2 и критерий λ.