- •Основные условные обозначения в математической статистике
- •Содержание
- •Введение
- •Основы теории вероятностей
- •1Предмет и метод математической статистики
- •2Понятие случайного события
- •3Вероятность случайного события
- •4Основные теоремы теории вероятностей
- •4.1Сложение вероятностей
- •4.2Умножение вероятностей
- •4.3Вычисление вероятностей
- •Случайные переменные
- •5Понятие случайной переменной
- •5.1Дискретные случайные переменные
- •5.2Непрерывные случайные переменные
- •6Математическое ожидание и дисперсия
- •7Моменты
- •Дискретные распределения
- •8Биномиальное распределение и измерение вероятностей
- •9Распределение редких событий (Пуассона)
- •Основные модели теоретических распределений
- •10Прямоугольное (равномерное) распределение
- •11Нормальное распределение
- •12Логарифмически нормальное распределение
- •Распределения параметров выборки
- •13.1Проблема Беренса–Фишера
- •15Χ2–распределение
- •Основы математической статистики
- •16Средние величины
- •16.1Общие свойства средних величин
- •17Средняя арифметическая
- •17.1Средний ранг (непараметрическая средняя)
- •17.2Взвешенная средняя арифметическая
- •17.3Средняя квадратическая
- •17.4Мода
- •17.5Медиана
- •18Средняя геометрическая
- •19Средняя гармоническая
- •Разнообразие значений признака
- •20Стандартное (среднеквадратическое) отклонение
- •20.1Число степеней свободы
- •20.2Коэффициент вариации
- •20.3Лимиты и размах
- •20.4Приближенные значения μ и
- •20.5Нормированное отклонение
- •21Проверка выпадов (артефактов)
- •22Средняя и сигма суммарной группы
- •23Скошенность (асимметрия) и крутизна (эксцесс) кривой распределения
- •Графическое представление распределений
- •24Вариационный ряд
- •25Гистограмма и вариационная кривая
- •26Кумулята
- •27Достоверность различия распределений
- •27.1Критерий χ2 (хи квадрат)
- •27.2Критерий λ (лямбда)
- •27.3Критерий по асимметрии и эксцессу
- •Нормальное распределение
- •28Генеральная совокупность и выборка
- •29Репрезентативность
- •30Ошибки репрезентативности и другие ошибки исследований
- •31Доверительные границы
- •Оценка генеральных параметров
- •32Общий порядок оценки
- •32.1Оценка средней арифметической
- •32.2Оценка средней разности
- •32.3Недостоверная и достоверная оценка средней разности
- •32.4Оценка разности генеральных средних
- •33Критерий достоверности разности
- •34Репрезентативность при изучении качественных признаков
- •35Достоверность разности долей
- •Парная корреляция
- •36Коэффициент корреляции
- •37Ошибка коэффициента корреляции
- •37.1Достоверность выборочного коэффициента корреляции
- •37.2Доверительные границы коэффициента корреляции
- •37.3Достоверность разности двух коэффициентов корреляции
- •38Уравнение прямолинейной регрессии
- •39Ошибки элементов уравнения прямолинейной регрессии
- •Частная и множественная линейные корреляции и регрессии
- •40Частный коэффициент корреляции
- •41Множественный коэффициент корреляции
- •42Линейное уравнение множественной регрессии
- •Криволинейная корреляция и регрессия
- •43Корреляционное отношение
- •44Свойства корреляционного отношения
- •45Ошибка репрезентативности корреляционного отношения
- •46Критерий линейности корреляции
- •Однофакторный дисперсионный анализ
- •47Сущность и метод дисперсионного анализа
- •47.1Результативный признак
- •47.2Фактор
- •47.3Градации факторов
- •47.4Градации комплекса
- •47.5Дисперсионный комплекс
- •47.6Статистические влияния
- •47.7Факториальное влияние
- •47.8Случайное влияние
- •47.9Общее влияние
- •48Однофакторный дисперсионный комплекс
- •Многофакторный дисперсионный анализ
- •49Многофакторный дисперсионный комплекс
- •50Преобразования
- •51Универсальное использование дисперсий
- •51.1Показатели силы влияний
- •51.2Ошибка репрезентативности основного показателя силы влияния
- •51.3Предельные значения показателей силы влияния
- •51.4Достоверность влияний
- •Классификация
- •52Дискриминантный анализ
- •52.1Постановка задачи, методы решения, ограничения
- •52.2Предположения и ограничения
- •52.3Алгоритм дискриминантного анализа
- •53Кластерный анализ
- •53.1Методы кластерного анализа
- •53.2Алгоритм кластерного анализа
- •Литература
- •Приложение. Основные формулы и определения
- •2 46019, Г. Гомель, ул. Советская, 104
Графическое представление распределений
8.1 Вариационный ряд
8.2 Гистограмма и вариационная кривая
8.3 Кумулята
8.4 Достоверность различия распределений
24Вариационный ряд
По мере увеличения численности изучаемых групп все более и более проявляется та закономерность в разнообразии, которая в малочисленных группах была скрыта случайной формой своего проявления.
В больших группах эта закономерность проявляется уже достаточно ясно в самой форме распределения значений признака в группе.
Если имеется многочисленная группа особей, то различные значения признака встречаются в этой группе неодинаковое число раз: одни значения встречаются чаще, другие реже. Это явление называется распределением признака. Закономерности распределения заключаются в том, что в группе особей наблюдается преимущественное появление определенных значений признака. Обычно на протяжении всего распределения от максимума до минимума бывает одна группа близких значений, которая появляется заметно чаще других значений. Но и в некоторых распределениях наблюдаются две или три такие группы.
В процессе изучения многих совокупностей по различным признакам наметилось несколько типов распределения признака в группе, получивших математическое оформление.
При исследовании биологических объектов наибольшее значение имеют: нормальное распределение, биномиальное распределение и распределение Пуассона.
Изобразить распределение признака можно различными способами: вариационным рядом, гистограммой, вариационной кривой, кумулятой.
Вариационный ряд – это упорядоченное отражение реально существующего распределения значений признака по отдельным особям изученной группы.
Вариационный ряд – это двойной ряд чисел, состоящий из обозначения классов и соответствующих частот.
Для корректной статистической обработки необходимо определить величину класса по формуле:
k=(Xmax–Xmin)/n,
n=1+3,322lgN,
где N–число наблюдений.
Пример
Распределение 1000 данных по 11 классам (через 20, начиная со 110 до 310) показано в таблице 8.1.
Таблица 8.1 – Вариационный ряд
Средины классов |
W |
110 |
130 |
150 |
170 |
190 |
210 |
230 |
250 |
270 |
290 |
310 |
|
Частоты |
f |
2 |
20 |
60 |
160 |
250 |
240 |
180 |
70 |
15 |
2 |
1 |
n=1000 |
В этом распределении имеются следующие элементы:
Классы признака, т. е. выделенные из общей группы части, в которые собраны объекты, сходные по своей величине.
Вариации или средины классов, обозначаемые символом W: 110 –130 – 150 и т. д. В каждый класс занесены объекты, у которых величина признака близка к средине этого класса.
Классовые промежутки или величина классов, обозначаемые символом k, одинаковые для всех классов распределения. Классовый промежуток равен разности вариаций соседних классов (в таблице 3.5, k = 20).
Частоты f – число объектов в классах.
Объем распределения – общее число объектов в группе, обозначаемое символом n.
Вариационный ряд включает в себя весь первичный материал по измерению одного признака у всех представителей изучаемой группы. Этот материал в вариационном ряду приведен в определенный порядок таким образом, что становится возможным даже для очень многочисленных групп достаточно легко определить все показатели, характеризующие признак, как по среднему уровню развития, так и по различным деталям разнообразия.
Рассмотрение вариационного ряда без вычислений позволяет определить величину основных показателей среднего уровня и разнообразия с таким приближением, которое вполне достаточно для первого ознакомления с признаком. В некоторых случаях внимательное рассмотрение вариационного ряда избавляет от необходимости расчета точных показателей. Но даже и при наличии рассчитанных средней арифметической и среднего стандартного отклонения вариационный ряд не теряет своего значения, так как наглядно показывает все детали распределения признака в данной группе.
Если взять вариационный ряд, приведенный в примере, то без вычислений можно видеть, что:
средняя арифметическая признака находится между 190 и 210, вероятно, недалеко от 200;
мода признака (наиболее часто встречающееся значение) равна 190;
лимиты (минимум и максимум) и размах признака примерно равны 110 – 310;
стандартное отклонение признака, судя по лимитам, равно 200:6,5 = 31, так как в группе объемом 1000 сигма укладывается в размахе примерно 6,5 раз.
Точный расчет показателей в этом примере дал очень близкие результаты: М = 201 кг, =30 кг, мода = 198 кг.