- •Основные условные обозначения в математической статистике
- •Содержание
- •Введение
- •Основы теории вероятностей
- •1Предмет и метод математической статистики
- •2Понятие случайного события
- •3Вероятность случайного события
- •4Основные теоремы теории вероятностей
- •4.1Сложение вероятностей
- •4.2Умножение вероятностей
- •4.3Вычисление вероятностей
- •Случайные переменные
- •5Понятие случайной переменной
- •5.1Дискретные случайные переменные
- •5.2Непрерывные случайные переменные
- •6Математическое ожидание и дисперсия
- •7Моменты
- •Дискретные распределения
- •8Биномиальное распределение и измерение вероятностей
- •9Распределение редких событий (Пуассона)
- •Основные модели теоретических распределений
- •10Прямоугольное (равномерное) распределение
- •11Нормальное распределение
- •12Логарифмически нормальное распределение
- •Распределения параметров выборки
- •13.1Проблема Беренса–Фишера
- •15Χ2–распределение
- •Основы математической статистики
- •16Средние величины
- •16.1Общие свойства средних величин
- •17Средняя арифметическая
- •17.1Средний ранг (непараметрическая средняя)
- •17.2Взвешенная средняя арифметическая
- •17.3Средняя квадратическая
- •17.4Мода
- •17.5Медиана
- •18Средняя геометрическая
- •19Средняя гармоническая
- •Разнообразие значений признака
- •20Стандартное (среднеквадратическое) отклонение
- •20.1Число степеней свободы
- •20.2Коэффициент вариации
- •20.3Лимиты и размах
- •20.4Приближенные значения μ и
- •20.5Нормированное отклонение
- •21Проверка выпадов (артефактов)
- •22Средняя и сигма суммарной группы
- •23Скошенность (асимметрия) и крутизна (эксцесс) кривой распределения
- •Графическое представление распределений
- •24Вариационный ряд
- •25Гистограмма и вариационная кривая
- •26Кумулята
- •27Достоверность различия распределений
- •27.1Критерий χ2 (хи квадрат)
- •27.2Критерий λ (лямбда)
- •27.3Критерий по асимметрии и эксцессу
- •Нормальное распределение
- •28Генеральная совокупность и выборка
- •29Репрезентативность
- •30Ошибки репрезентативности и другие ошибки исследований
- •31Доверительные границы
- •Оценка генеральных параметров
- •32Общий порядок оценки
- •32.1Оценка средней арифметической
- •32.2Оценка средней разности
- •32.3Недостоверная и достоверная оценка средней разности
- •32.4Оценка разности генеральных средних
- •33Критерий достоверности разности
- •34Репрезентативность при изучении качественных признаков
- •35Достоверность разности долей
- •Парная корреляция
- •36Коэффициент корреляции
- •37Ошибка коэффициента корреляции
- •37.1Достоверность выборочного коэффициента корреляции
- •37.2Доверительные границы коэффициента корреляции
- •37.3Достоверность разности двух коэффициентов корреляции
- •38Уравнение прямолинейной регрессии
- •39Ошибки элементов уравнения прямолинейной регрессии
- •Частная и множественная линейные корреляции и регрессии
- •40Частный коэффициент корреляции
- •41Множественный коэффициент корреляции
- •42Линейное уравнение множественной регрессии
- •Криволинейная корреляция и регрессия
- •43Корреляционное отношение
- •44Свойства корреляционного отношения
- •45Ошибка репрезентативности корреляционного отношения
- •46Критерий линейности корреляции
- •Однофакторный дисперсионный анализ
- •47Сущность и метод дисперсионного анализа
- •47.1Результативный признак
- •47.2Фактор
- •47.3Градации факторов
- •47.4Градации комплекса
- •47.5Дисперсионный комплекс
- •47.6Статистические влияния
- •47.7Факториальное влияние
- •47.8Случайное влияние
- •47.9Общее влияние
- •48Однофакторный дисперсионный комплекс
- •Многофакторный дисперсионный анализ
- •49Многофакторный дисперсионный комплекс
- •50Преобразования
- •51Универсальное использование дисперсий
- •51.1Показатели силы влияний
- •51.2Ошибка репрезентативности основного показателя силы влияния
- •51.3Предельные значения показателей силы влияния
- •51.4Достоверность влияний
- •Классификация
- •52Дискриминантный анализ
- •52.1Постановка задачи, методы решения, ограничения
- •52.2Предположения и ограничения
- •52.3Алгоритм дискриминантного анализа
- •53Кластерный анализ
- •53.1Методы кластерного анализа
- •53.2Алгоритм кластерного анализа
- •Литература
- •Приложение. Основные формулы и определения
- •2 46019, Г. Гомель, ул. Советская, 104
17.1Средний ранг (непараметрическая средняя)
Средний ранг определяется для таких признаков, для которых еще не найдены способы количественного измерения. По степени проявления таких признаков объекты могут быть ранжированы, т. е. расположены в порядке усиления (или ослабления) выраженности признака. Порядковый номер объекта в таком ряду называется его рангом.
Пример
В зверосовхозе, разводящем голубых норок, получено от двух самцов и одной и той же группы самок 20 щенков с различной окраской меха: от почти белого до темно-голубого. Требовалось выяснить, какой из производителей дает в потомстве более темную окраску меха. Затруднением при этом служит то обстоятельство, что нет способа числового измерения интенсивности окраски волоса у норок. Все потомки оцениваемых производителей были распределены в ранжированный ряд в порядке усиления серого цвета, причем при каждом порядковом номере (ранге) такого ряда был поставлен номер отца (I, II; таблица 6.1).
Таблица 6.1 – Ранжированный ряд
Ранг |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
Отец |
I |
II |
I |
II |
I |
I |
II |
I |
I |
I |
II |
I |
II |
II |
II |
II |
I |
II |
II |
II |
На основе такого ряда можно рассчитать средние ранги окраски в потомстве каждого производителя и по этим показателям сравнить их:
;
Вывод
Второй производитель дает в потомстве более темную окраску меха.
17.2Взвешенная средняя арифметическая
Обычно, чтобы рассчитать среднюю арифметическую, складывают все значения признака и полученную сумму делят на число вариантов. В этом случае каждое значение, входя в сумму, увеличивает ее на полную свою величину. Но не всегда это возможно. Иногда значения признака должны входить в сумму с неодинаковой поправкой. Эта поправка, выраженная определенным множителем, называется математическим весом значения.
Средняя, рассчитанная для значений признака с неодинаковыми весами, называется взвешенной средней. Взвешенная средняя арифметическая рассчитывается по следующей формуле:
, (6.4)
где:
Xi – значение признака, варианта;
p – математический вес усредняемого значения.
Чтобы рассчитать взвешенную среднюю арифметическую, необходимо каждое значение признака помножить на его вес, все эти произведения сложить и полученную сумму разделить на сумму весов.
Пример
Имеются результаты двух исследований длины хоботка пчел: в одном случае получена средняя длина хоботка 6,6 мм, в другом – 6,0 мм. Требуется получить общую среднюю, причем известно, что в первом исследовании были измерены хоботки у 100 пчел, во втором – у 20.
В данном случае значениями признака являются средние μ1 = 6,6 и μ2 = 6,0 мм; их весами – численности групп n1 = 100 и n2 = 20. Взвешенная средняя арифметическая рассчитывается следующим образом:
.
Пример
В 100 кг кормовой смеси содержатся следующие количества отдельных кормов:
сена 50 кг, с содержанием белка 3%
молотой овсяной соломы 10 кг, с содержанием белка 1%
жмыха подсолнечного 20 кг, с содержанием белка 33%
отрубей пшеничных грубых 20 кг, с содержанием белка 11%
Требуется определить содержание белка в данной смеси.
Для решения этой задачи необходимо рассчитать взвешенную среднюю арифметическую. Значениями признака будет содержание белка в отдельных кормах: 3; 1; 33 и 11%, а их математическими весами — физические веса кормов, входящих в смесь: 50; 10; 20 и 20 кг. Содержание в смеси переваримого белка:
,
т. е. в каждом килограмме смеси содержится 104 г переваримого белка.
Таким же способом рассчитываются среднее выхода продукта по нескольким партиям сырья.
Пример
Проведены три независимых наблюдения числа сокращений пульсирующей вакуоли у амебы в определенной среде. В первом наблюдении зарегистрировано 24 сокращения в 1 час, во втором – 16 и в третьем – 23, причем первое наблюдение длилось 2, второе – 6 и третье –1 час. Для определения среднего числа сокращений в час необходимо найти взвешенную среднюю арифметическую. Значениями признака будут наблюдавшиеся количества сокращений в час (24, 16 и 23), их весами – продолжительность отдельных наблюдений (2, 6 и 1 час). Следовательно,
.
Простая средняя в данном случае: даст завышенную характеристику.