- •Основные условные обозначения в математической статистике
- •Содержание
- •Введение
- •Основы теории вероятностей
- •1Предмет и метод математической статистики
- •2Понятие случайного события
- •3Вероятность случайного события
- •4Основные теоремы теории вероятностей
- •4.1Сложение вероятностей
- •4.2Умножение вероятностей
- •4.3Вычисление вероятностей
- •Случайные переменные
- •5Понятие случайной переменной
- •5.1Дискретные случайные переменные
- •5.2Непрерывные случайные переменные
- •6Математическое ожидание и дисперсия
- •7Моменты
- •Дискретные распределения
- •8Биномиальное распределение и измерение вероятностей
- •9Распределение редких событий (Пуассона)
- •Основные модели теоретических распределений
- •10Прямоугольное (равномерное) распределение
- •11Нормальное распределение
- •12Логарифмически нормальное распределение
- •Распределения параметров выборки
- •13.1Проблема Беренса–Фишера
- •15Χ2–распределение
- •Основы математической статистики
- •16Средние величины
- •16.1Общие свойства средних величин
- •17Средняя арифметическая
- •17.1Средний ранг (непараметрическая средняя)
- •17.2Взвешенная средняя арифметическая
- •17.3Средняя квадратическая
- •17.4Мода
- •17.5Медиана
- •18Средняя геометрическая
- •19Средняя гармоническая
- •Разнообразие значений признака
- •20Стандартное (среднеквадратическое) отклонение
- •20.1Число степеней свободы
- •20.2Коэффициент вариации
- •20.3Лимиты и размах
- •20.4Приближенные значения μ и
- •20.5Нормированное отклонение
- •21Проверка выпадов (артефактов)
- •22Средняя и сигма суммарной группы
- •23Скошенность (асимметрия) и крутизна (эксцесс) кривой распределения
- •Графическое представление распределений
- •24Вариационный ряд
- •25Гистограмма и вариационная кривая
- •26Кумулята
- •27Достоверность различия распределений
- •27.1Критерий χ2 (хи квадрат)
- •27.2Критерий λ (лямбда)
- •27.3Критерий по асимметрии и эксцессу
- •Нормальное распределение
- •28Генеральная совокупность и выборка
- •29Репрезентативность
- •30Ошибки репрезентативности и другие ошибки исследований
- •31Доверительные границы
- •Оценка генеральных параметров
- •32Общий порядок оценки
- •32.1Оценка средней арифметической
- •32.2Оценка средней разности
- •32.3Недостоверная и достоверная оценка средней разности
- •32.4Оценка разности генеральных средних
- •33Критерий достоверности разности
- •34Репрезентативность при изучении качественных признаков
- •35Достоверность разности долей
- •Парная корреляция
- •36Коэффициент корреляции
- •37Ошибка коэффициента корреляции
- •37.1Достоверность выборочного коэффициента корреляции
- •37.2Доверительные границы коэффициента корреляции
- •37.3Достоверность разности двух коэффициентов корреляции
- •38Уравнение прямолинейной регрессии
- •39Ошибки элементов уравнения прямолинейной регрессии
- •Частная и множественная линейные корреляции и регрессии
- •40Частный коэффициент корреляции
- •41Множественный коэффициент корреляции
- •42Линейное уравнение множественной регрессии
- •Криволинейная корреляция и регрессия
- •43Корреляционное отношение
- •44Свойства корреляционного отношения
- •45Ошибка репрезентативности корреляционного отношения
- •46Критерий линейности корреляции
- •Однофакторный дисперсионный анализ
- •47Сущность и метод дисперсионного анализа
- •47.1Результативный признак
- •47.2Фактор
- •47.3Градации факторов
- •47.4Градации комплекса
- •47.5Дисперсионный комплекс
- •47.6Статистические влияния
- •47.7Факториальное влияние
- •47.8Случайное влияние
- •47.9Общее влияние
- •48Однофакторный дисперсионный комплекс
- •Многофакторный дисперсионный анализ
- •49Многофакторный дисперсионный комплекс
- •50Преобразования
- •51Универсальное использование дисперсий
- •51.1Показатели силы влияний
- •51.2Ошибка репрезентативности основного показателя силы влияния
- •51.3Предельные значения показателей силы влияния
- •51.4Достоверность влияний
- •Классификация
- •52Дискриминантный анализ
- •52.1Постановка задачи, методы решения, ограничения
- •52.2Предположения и ограничения
- •52.3Алгоритм дискриминантного анализа
- •53Кластерный анализ
- •53.1Методы кластерного анализа
- •53.2Алгоритм кластерного анализа
- •Литература
- •Приложение. Основные формулы и определения
- •2 46019, Г. Гомель, ул. Советская, 104
16.1Общие свойства средних величин
Для правильного использования средних величин необходимо знать свойства этих показателей: срединное расположение, абстрактность и единство суммарного действия.
По своему численному значению все средние величины занимают промежуточное положение между минимальным и максимальным значениями признака. При этом наименьшую величину имеет средняя гармоническая (H), а наибольшую – средняя квадратическая (S), что можно представить следующей схемой:
Средняя признака показывает, какую величину имел бы каждый из представителей изучаемой группы, если бы все они были одинаковыми и суммарное их действие было такое же, как и фактических неусредненных значений этой группы. При использовании средних величин предполагается, что пока они применяются, разнородная группа заменена однородной группой, в которой все значения признака одинаковы и равны средней величине.
Например, если имеется пять значений признака: 1; 4; 5; 5; 5 со средней величиной = 4, то при использовании этой средней предполагается, что разнородная группа заменена на однородную с одинаковыми значениями: 4; 4; 4; 4; 4. Эта особенность средних величин лежит в основе таких обычных производственных выражений, как «от каждой коровы получено по 3000 л молока», «с каждого гектара получено по 500 ц свеклы», «с каждого улья получено по 80 кг меда», «при откорме получено по 100 кг привеса на каждую голову» и т. п. Коровы дают, конечно, различные удои, на разных участках получен разный урожай и т. д. И все же для производственной характеристики хозяйства и, особенно, для плановых расчетов оказалось удобным условно принять, что все коровы дали или будут давать одинаковый удой, равный средней величине этого признака для данного стада и года («от каждой коровы»), или, что с каждого гектара получен один и тот же урожай, равный среднему урожаю с общей площади («с каждого гектара»).
Заменить разнородную группу однородной можно только путем отвлечения от тех различий, которые существуют в действительности. Только абстрагируясь от имеющихся индивидуальных разнообразных значений, можно дать требуемую характеристику группы одним числом – средней величиной признака. В этом смысле всякая средняя величина есть, прежде всего, абстрактная величина, которая часто в действительности не существует, а иногда и не может существовать.
Если средний вес особей какого-нибудь вида в определенных условиях равен 40,57 кг, то существование такого экземпляра возможно, но крайне мала вероятность того, что какая-нибудь определенная особь будет весить точно 40,57 кг.
Если в совхозе среднее количество деловых ягнят, полученных на одну овцематку, равнялось 1,7 ягненка, то такое число живых ягнят вообще не может существовать в действительности, тем не менее, эта средняя имеет вполне определенное производственное значение, например при сравнении этого совхоза с другим, где аналогичная средняя равна 1,2.
Абстрактность средних величин вызывает необходимость при вычислении их определять, от какого разнообразия следует отвлечься в данном случае. Самая полная абстракция получается в тех случаях, когда средняя рассчитывается для всех особей изучаемой совокупности. Если требуется учитывать какое–нибудь одно или несколько условий, например пол, возраст особей, сезон года, ареал распространения, физиологическое состояние, принадлежность к опытным и контрольным группам, происхождение от определенных родителей и т. д., то необходимо в той ил иной степени освобождаться от полной абстракции и определять среднюю величину для отдельных частных групп. Чем больше таких частных групп и чем они мельче, тем менее абстрактными становятся средние величины.
Не всякое выравнивание различий в группе может привести к правильной средней величине. Вычисление средних величин необходимо вести таким образом, чтобы суммарное действие выровненных значений признака было бы равно суммарному действию первоначальных неусредненных значений. Например, если четыре взрослых особи какой-нибудь промысловой птицы имели массу 2, 3, 3, 4 кг, то средняя масса этих птиц . Суммарная масса четырех усредненных значений 3+3+3+3 = 12 кг. Такая же суммарная масса имеется и в действительности: 2+3+3+4 = 12 кг. В данном случае выбор средней величины – средней арифметической сделан правильно. Но так бывает не всегда. Например, требуется рассчитать среднегодовой прирост популяции какого-нибудь вида за два года, если известно, что за первый год прирост составил 20%, а за второй – 60% (от начала второго года). Используя способ средней арифметической, получаем:
.
В данном случае применение этой средней не будет правильным, так как два усредненных значения в своем суммарном действии не дадут того же результата, какой дали два фактических неусредненных значения. Фактический общий суммарный прирост популяции за два года определяется следующим образом.
К концу первого года популяция составляет:
;
концу второго года ;
Прирост за два года равен .
Если же принять за средний прирост 40%, то к концу первого года популяция составит: ;
к концу второго года: ;
а прирост за два года: .
Ошибка в данном случае заключалась в неправильном выборе средней величины: взята средняя арифметическая, а для вычисления среднего прироста надо пользоваться средней геометрической.
Если использовать среднюю геометрическую, то средний прирост определится следующим образом:
.
При этом суммарный результат будет равен фактическому:
;
;
Прирост за два года составляет
Единство суммарного действия служит проверкой правильности выбора той или иной средней. Если суммарный результат усредненных значений не равен результату, полученному по первоначальным фактическим значениям, это значит, что или средняя выбрана неправильно, или вычисления проведены с ошибками.