- •Лабораторная работа №1 Вариационный ряд. Его основные показатели
- •Основные показатели вариационного ряда (вариации)
- •Практическое задание
- •Лабораторная работа №2 Числовые характеристики и законы распределения случайных величин
- •Числовые характеристики распределения случайной величины
- •Форма распределения
- •Практическое задание
- •Формулы расчета средней ошибки выборки для различных способов формирования выборочной совокупности
- •Постановка задачи
- •Результаты выборочного обследования жилищных условий жителей города
- •Практическое задание
- •Результаты обследования рабочих предприятия.
- •Распределение урожайности по хозяйствам региона, имеющим различную форму собственности.
- •Определение оптимального объема выборки
- •Задачи для самостоятельного решения
- •Лабораторная работа №4 Нормальное распределение. Критерии согласия
- •Построение нормального распределения по эмпирическим данным
- •Критерии согласия
- •- Критерий Пирсона
- •Критерий Романовского
- •Критерий Колмогорова
- •Практическое задание Задача 1
- •Указания к решению
- •Задача 2
- •Указания к решению
- •Задача 3
- •Указания к решению
- •Задача 4
- •Задача 5
- •Темы для самостоятельного изучения Задачи математической статистики
- •Сравнение характеристик областей применения аппарата теории вероятностей и математической статистики
- •Этапы решения задачи описания эмпирических (полученных в результате опыта) данных вероятностными моделями
- •Оценки неизвестных параметров
- •Точечные оценки
- •Метод Монте - Карло
- •Вычисление определенного интеграла методом статистических испытаний (методом Монте - Карло)
- •Элементы теории случайных процессов
- •Уравнения Колмогорова – Чемпена
Лабораторная работа №1 Вариационный ряд. Его основные показатели
Задача математической статистики состоит в создании методов сбора и обработки статистических данных для получения научных и практических выводов.
Статистические данные (т. е. полученные из наблюдений или опытов числа, отражающие значения изучаемого признака) записываются в форме вариационного ряда.
Примеры вариационных рядов:
-
Опыт – измерение роста 10 человек (изучаемый признак - рост)
152
160
156
156
167
170
155
152
167
165
-
Опыт – подсчет максимально возможного количества станков, которое может обслужить один ткач (изучаемый признак – число станков)
Количество станков
2
4
6
Число ткачей
2
64
154
-
Опыт – взвешивание телят (изучаемый признак - вес)
Вес |
100-119 |
120-139 |
140-159 |
160-179 |
Число телят |
2 |
20 |
60 |
18 |
Значение изучаемого признака в вариационном ряде называют вариантой и обозначают xi. В примере №1 вариационный ряд состоит только из вариант, в примере №2 вариантами является количество станков, в примере №3 – вес (варианты могут задаваться в виде интервалов, при этом для расчетов берут среднее значение интервала).
Число единиц наблюдения, обладающих одинаковым значением изучаемого признака, в вариационном ряде называют частотой (весом) и обозначают fi. В примере №1 все веса равны 1 () и поэтому они не указываются, в примере №2 весами являются число ткачей, в примере №3 – число телят.
Общее число единиц наблюдения называют объемом изучаемой совокупности и обозначают n. Для примера №1 n=10, для примера №2 n=220, для примера №3 n=100.
Для обработки данных часто используют среднее значение признака, т. е. среднее арифметическое чисел xi. Если в вариационном ряде не указаны веса (), то находят простое среднее (). Если веса указаны, находят взвешенное среднее (вз.).
()
(n – число изучаемых в совокупности единиц, k – число интервалов или отдельных различных значений изучаемого признака в вариационном ряду, образовавшихся после группировки статистических данных)
Вариация – колеблемость, многообразие, изменяемость величины признака у отдельных единиц совокупности.
Основные показатели вариационного ряда (вариации)
- обобщенные характеристики степени колеблемости (вариации) признака в совокупности.
абсолютные |
относительные |
|
|
|
|
|
|
|
|
Размах вариации (R) – разность между наибольшим и наименьшим значениями изучаемого признака.
Среднее линейное отклонение () – среднее арифметическое абсолютных значений отклонений вариант признака от средней величины признака. Как и среднее может быть простым и взвешенным.
()
Дисперсия () - средняя величина квадратов отклонений индивидуальных значений признака от средней величины признака.
()
Если все единицы наблюдения в изучаемой совокупности разбиты на группы, то появляются понятия групповой, межгрупповой и внутригрупповой дисперсий.
Групповой дисперсией называют дисперсию значений признака, принадлежащих данной группе, относительно среднего значения признака внутри этой группы.
- групповая дисперсия j-ой группы.
(где i – номера лишь тех единиц совокупности, которые содержатся в j-ой группе; nj гр. – объем j-ой группы, - среднее значение признака внутри j-ой группы)
Внутригрупповой дисперсией называют среднее арифметическое всех групповых дисперсий данной совокупности.
(где n – объем всей совокупности, - групповая дисперсия j-ой группы, j – номера групп)
Межгрупповой дисперсией называют дисперсию средних значений признака в каждой группе относительно среднего значения признака во всей совокупности.
(где n – объем всей совокупности, j – номера групп, - среднее значение признака внутри j-ой группы, nj гр. – объем j-ой группы)
Общей дисперсией называют дисперсию значений признака всей совокупности относительно среднего значения признака во всей совокупности.
Теорема
Если совокупность состоит из нескольких групп, то общая дисперсия равна сумме внутригрупповой и межгрупповой дисперсий:
= вн.гр.+ межгр.
Среднее квадратическое отклонение () – квадратный корень из дисперсии. Оно выражается в тех же единицах измерения, что и сам признак (дисперсия же выражается в квадратных единицах измерения признака). Найдя , все единицы наблюдения можно разбить на три группы:
-
Со средним значением признака
-
Со значением признака выше среднего
-
Со значением признака ниже среднего
Относительные признаки вариации используются при сравнении колеблемости различных признаков в одной совокупности или одного признака в нескольких совокупностях.
Коэффициент осцилляции (VR) – процентное отношение размаха вариации к средней величине признака.
Коэффициент вариации (V) - процентное отношение среднего квадратического отклонения к средней величине признака. Если коэффициент вариации не превышает 33%, то совокупность считается однородной.
Линейный коэффициент вариации () - процентное отношение среднего линейного отклонения к средней величине признака.
Анализ рядов распределения наглядно можно проводить на основе их графического изображения. Для этой цели строят графики - полигон, гистограмма, огива, кумулята.
Полигон – ломаная линия, отрезки которой соединяют точки (x1,f1), (x2,f2), . . .,(xn,fn), где xi – варианты, fi – частоты. Используется для изображения дискретных вариационных рядов (варианты принимают только целые значения).
Полигоном относительных частот называют ломаную, отрезки которой соединяют точки (x1,w1), (x2,w2), . . .,(xn,wn), где xi – варианты, wi – относительные частоты ().
Гистограммой называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат интервалы значений признака длиною h, а высоты пропорциональны частотам соответствующих интервалов значений. Используется для изображения интервальных вариационных рядов (варианты заданы интервалами). При построении гистограммы вариационного ряда с равными интервалами по оси ординат наносят частоты, с неравными интервалами - плотность распределения (частота интервала, деленная на длину интервала).
Если середины верхних сторон прямоугольников соединить ломаной, то получим полигон.
Пример:
xi |
fi/h |
|
5-10 |
1 |
|
10-15 |
1,2 |
|
15-20 |
3,2 |
|
20-25 |
7,2 |
|
25-30 |
4,8 |
|
h= |
5 |
При помощи кумуляты изображается ряд накопленных частот (). Это ломаная линия, отрезки которой соединяют точки (x1,m1), (x2,m2), . . .,(xn,mn), где xi – варианты, mi – накопленные частоты.
Если при графическом изображении вариационного ряда в виде кумуляты оси поменять местами, получим огиву.