- •Основные условные обозначения в математической статистике
- •Содержание
- •Введение
- •Основы теории вероятностей
- •1Предмет и метод математической статистики
- •2Понятие случайного события
- •3Вероятность случайного события
- •4Основные теоремы теории вероятностей
- •4.1Сложение вероятностей
- •4.2Умножение вероятностей
- •4.3Вычисление вероятностей
- •Случайные переменные
- •5Понятие случайной переменной
- •5.1Дискретные случайные переменные
- •5.2Непрерывные случайные переменные
- •6Математическое ожидание и дисперсия
- •7Моменты
- •Дискретные распределения
- •8Биномиальное распределение и измерение вероятностей
- •9Распределение редких событий (Пуассона)
- •Основные модели теоретических распределений
- •10Прямоугольное (равномерное) распределение
- •11Нормальное распределение
- •12Логарифмически нормальное распределение
- •Распределения параметров выборки
- •13.1Проблема Беренса–Фишера
- •15Χ2–распределение
- •Основы математической статистики
- •16Средние величины
- •16.1Общие свойства средних величин
- •17Средняя арифметическая
- •17.1Средний ранг (непараметрическая средняя)
- •17.2Взвешенная средняя арифметическая
- •17.3Средняя квадратическая
- •17.4Мода
- •17.5Медиана
- •18Средняя геометрическая
- •19Средняя гармоническая
- •Разнообразие значений признака
- •20Стандартное (среднеквадратическое) отклонение
- •20.1Число степеней свободы
- •20.2Коэффициент вариации
- •20.3Лимиты и размах
- •20.4Приближенные значения μ и
- •20.5Нормированное отклонение
- •21Проверка выпадов (артефактов)
- •22Средняя и сигма суммарной группы
- •23Скошенность (асимметрия) и крутизна (эксцесс) кривой распределения
- •Графическое представление распределений
- •24Вариационный ряд
- •25Гистограмма и вариационная кривая
- •26Кумулята
- •27Достоверность различия распределений
- •27.1Критерий χ2 (хи квадрат)
- •27.2Критерий λ (лямбда)
- •27.3Критерий по асимметрии и эксцессу
- •Нормальное распределение
- •28Генеральная совокупность и выборка
- •29Репрезентативность
- •30Ошибки репрезентативности и другие ошибки исследований
- •31Доверительные границы
- •Оценка генеральных параметров
- •32Общий порядок оценки
- •32.1Оценка средней арифметической
- •32.2Оценка средней разности
- •32.3Недостоверная и достоверная оценка средней разности
- •32.4Оценка разности генеральных средних
- •33Критерий достоверности разности
- •34Репрезентативность при изучении качественных признаков
- •35Достоверность разности долей
- •Парная корреляция
- •36Коэффициент корреляции
- •37Ошибка коэффициента корреляции
- •37.1Достоверность выборочного коэффициента корреляции
- •37.2Доверительные границы коэффициента корреляции
- •37.3Достоверность разности двух коэффициентов корреляции
- •38Уравнение прямолинейной регрессии
- •39Ошибки элементов уравнения прямолинейной регрессии
- •Частная и множественная линейные корреляции и регрессии
- •40Частный коэффициент корреляции
- •41Множественный коэффициент корреляции
- •42Линейное уравнение множественной регрессии
- •Криволинейная корреляция и регрессия
- •43Корреляционное отношение
- •44Свойства корреляционного отношения
- •45Ошибка репрезентативности корреляционного отношения
- •46Критерий линейности корреляции
- •Однофакторный дисперсионный анализ
- •47Сущность и метод дисперсионного анализа
- •47.1Результативный признак
- •47.2Фактор
- •47.3Градации факторов
- •47.4Градации комплекса
- •47.5Дисперсионный комплекс
- •47.6Статистические влияния
- •47.7Факториальное влияние
- •47.8Случайное влияние
- •47.9Общее влияние
- •48Однофакторный дисперсионный комплекс
- •Многофакторный дисперсионный анализ
- •49Многофакторный дисперсионный комплекс
- •50Преобразования
- •51Универсальное использование дисперсий
- •51.1Показатели силы влияний
- •51.2Ошибка репрезентативности основного показателя силы влияния
- •51.3Предельные значения показателей силы влияния
- •51.4Достоверность влияний
- •Классификация
- •52Дискриминантный анализ
- •52.1Постановка задачи, методы решения, ограничения
- •52.2Предположения и ограничения
- •52.3Алгоритм дискриминантного анализа
- •53Кластерный анализ
- •53.1Методы кластерного анализа
- •53.2Алгоритм кластерного анализа
- •Литература
- •Приложение. Основные формулы и определения
- •2 46019, Г. Гомель, ул. Советская, 104
20.5Нормированное отклонение
Обычно степень развития признака определяется путем его измерения и выражается определенным именованным числом: 3 кг веса, 15 см длины, 20 зацепок на крыле у пчел, 4% жира в молоке, 15 кг настрига шерсти, 700 г привеса в сутки и др. Этот основной способ характеристики признаков оказывается недостаточным, когда требуется еще и оценить полученное значение, т. е. определить, можно ли его считать значительным или, наоборот, недостаточным, или находящимся в норме.
Задачи подобного рода возникают очень часто как в научных работах, так и в производственных условиях.
Для решения таких задач применяется общий принцип: ценность особи определяется ее отношением к группе, что может быть измерено особым – показателем – нормированнным отклонением, вычисляемым по формуле:
, (7.8)
где:
– нормированное отклонение;
Xi – результат непосредственного измерения признака;
μ – средняя арифметическая соответствующей группы, из которой взята изучаемая особь;
– стандартное отклонение этого признака в группе.
Нормированное отклонение показывает, на сколько сигм отклоняется значение признака от средней для соответствующей группы.
Нормированное отклонение – величина неименованная, что представляет большое удобство при сравнении развития различных признаков.
Пример
Если мальчик 14 лет имеет длину тела 159 см, обхват груди 64 см емкость легких 2070 см3, обхват головы 52 см и вес 40 кг, то по этим цифрам невозможно дать сравнительную характеристику развития разных частей тела и определить общий тип физического развития ученика.
Для этой цели необходимо сравнить индивидуальные показатели со средними характеристиками мальчиков этого возраста по среднему уровню каждого признака и его разнообразию в форме нормированного отклонения, что показано в таблице 7.2.
Таблица 7.2 – Оценка телосложения
Показатели |
Мальчик 14 лет |
Все мальчики 14 лет |
Нормированное отклонение
|
|
Xi |
μ |
|
||
Длина тела Обхват груди Емкость легких Обхват головы Вес |
159 64 2070 52 40 |
142 66 2300 50 40 |
8,5 4,0 460 2,0 6,0 |
(+17) / 8,5= + 2,0 (–2) / 4,0 = – 0,5 (–230) / 460 = – 0,5 (+2) / 2 = + 1,0 0 / 6 = 0,0 |
Выяснилось, что рост мальчика на две сигмы, а обхват головы на одну сигму превышают средние показатели, вес – на среднем уровне, а емкость легких и обхват груди ниже среднего уровня на полсигмы. Очевидно, это – высокий, узкогрудый, большеголовый мальчик астенического типа.
21Проверка выпадов (артефактов)
Нормированное отклонение помогает определить выпады, или артефакты, т. е. такие записанные значения признака, которые резко отличаются от всех других значений признака в группе. Проверка артефактов должна проводиться всегда перед началом обработки полученных первичных данных. Если подтвердится, что резко выделяющееся значение действительно не может относиться к объектам данной группы, и попало в записи вследствие ошибок внимания, следует такой артефакт исключить из обработки.
Проверка артефактов может производиться по критерию, равному нормированному отклонению выпада:
, (7.9)
где:
Т – критерий выпада;
– выделяющееся значение признака (или очень большое или очень малое);
μ, – средняя и сигма, рассчитанные для группы, включающей артефакт;
Tst – стандартные значения критерия выпадов, определяемых по таблице 7.3.
Таблица 7.3 – Стандартные значения критерия выпадов (Tst)
n |
Tst |
n |
Tst |
n |
Tst |
n |
Tst |
2 |
2,0 |
16 – 20 |
2,4 |
47 – 66 |
2,8 |
125 – 174 |
3,2 |
3 – 4 |
2,1 |
21 – 28 |
2,5 |
67 – 84 |
2,9 |
175 – 349 |
3,3 |
5 – 9 |
2,2 |
29 – 34 |
2,6 |
85 – 104 |
3,0 |
350 – 599 |
3,4 |
10 – 15 |
2,3 |
35 – 46 |
2,7 |
105 – 124 |
3,1 |
600 – 1500 |
3,5 |
Если Т ≥ Tst, то анализируемое значение признака является артефактом. Альтернатива Т < Tst не позволяет исключить из анализа значение признака.
Табулированные данные таблицы 7.3 можно аппроксимировать следующей функцией: Tst = 0,287ln(n) + 1,714
Пример
Данные: 1, 2, 3, 10; n = 4, μ = 4, = 4, ; 10 еще не может считаться выпадом.
Данные: 1, 2, 2, 3, 3, 4, 4, 5, 21; n = 9, μ = 5, = 6,1, ;
21 может считаться выпадом и должна быть исключена из обработки.