- •Рабочая тетрадь
- •По дисциплине
- •«Статистика»
- •Оглавление
- •I. Задания для аудиторной работы
- •График решения задач для аудиторной и домашней работы
- •Тема 1. «Выборочный метод»
- •Тема 2. «Проверка статистических гипотез»
- •Тема 3. «Корреляционно – регрессионный анализ»
- •Тема 4. «Ряды динамики»
- •Тема 5. «Экономические индексы»
- •II. Задания для самостоятельной работы
- •Статистика. Самостоятельные работы.
- •Самостоятельная работа 1.
- •Самостоятельная работа 6.
- •Самостоятельная работа 7.
- •Самостоятельная работа 8.
- •Самостоятельная работа 9.
- •Самостоятельная работа 10.
- •Самостоятельная работа 11.
- •Самостоятельная работа 12.
- •Самостоятельная работа 13.
- •Самостоятельная работа 14.
- •III. Типовой расчет
- •Статистика. Типовой расчет.
- •IV. Примеры решения задач
- •Тема 1. «Выборочный метод»
- •1. Определяем размах выборки как разность между ее максимальным и
- •2. Определяем длину b и количество интервалов группировки k; b и k нужно подобрать так, чтобы
- •3. Для каждого интервала группировки (α;β) находим:
- •4. Дополнительно вводим колонку
- •1. Полигон частот есть ломаная с вершинами в точках с координатами .
- •3. Кумулятивная кривая (или полигон относительных накопленных частот или кумулята) определяется как ломаная с вершинами в точках с координатами .
- •4. Вероятность попадания случайной величины в интервал (α;β) находится следующим образом:
- •1. Среднее значение (средняя арифметическая)
- •1. Находим шаг варьирования , то есть разность между любыми двумя соседними значениями случайной величины. Предполагается, что выборочной совокупности- постоянная величина.
- •- Если отбор случайный – повторный, - если отбор случайный – бесповторный.
- •- Если отбор случайный – повторный, - если отбор случайный – бесповторный.
- •Для заметок
- •Для заметок
- •Тема 3. «Корреляционно – регрессионный анализ»
- •1. Эмпирические данные принято записывать в виде корреляционной таблицы (если группировочный признак представлен в виде интервала, то необходимо найти его середину):
- •2. Эмпирической линией регрессии у на х называется ломаная с вершинами в точках с координатами
- •3. Коэффициент линейной корреляции r позволяет определить форму корреляционной зависимости. Он подсчитывается по формуле:
- •4. Степень тесноты корреляционной связи устанавливается с помощью корреляционного отношения η, равного
- •2. Отбор факторных признаков, пока модель не построена, производится несколькими способами. Все они основаны на расчете межфакторных коэффициентов корреляции
- •3. Форму и тесноту корреляционной зависимости можно с помощью множественного коэффициента корреляции . В частности, если число факторных признаков равно двум, то
- •Для заметок
- •Тема 4. «Ряды динамики»
- •3. В зависимости от типа ряда динамики среднее значение его уровней подсчитывается по формуле:
- •Для заметок
- •Тема 5. «Экономические индексы»
- •1. Обозначим и,и,и- соответственно себестоимостьz, цена p и объем q (объем производства, продаж и т. Д.) базисного и отчетного периодов.
- •3. С помощью индексов можно найти величину экономии (отрицательное число) или перерасхода (положительное число) производителя от изменения себестоимости:
- •4. Величина экономии (отрицательное число) или перерасхода (положительное число) потребителя от изменения цены равна:
- •1. Обозначим - время, необходимое на производство единицы продукции (трудоемкость). Тогда, суммарные затраты времени на производство всей продукции данного типа
- •2. Индивидуальный индекс производительности труда равен:
- •3. Сводный индекс производительности труда, взвешенный по трудоемкости может быть подсчитан двумя способами: по определению и по формуле средней арифметической взвешенной,
- •4. Сводный индекс производительности труда, взвешенный по выработке, равен:
- •1. Индекс цен переменного состава рассчитывается как отношение средних цен отчетного и базисного периодов:
- •2. Изменение индивидуальных цен, а также изменение и специфика реализации (производства) в различных местах продажи (производства) учитывается индексом структурных сдвигов:
- •3. Изменение цен без учета структуры производится с помощью индекса цен фиксированного состава, который рассчитывается также как и агрегатный индекс цен, введенный в задаче 18:
- •4. Между введенными индексами существует связь:
- •1. Территориальный индекс цен равен
- •2. Соотношение весов сравниваемых регионов учтено в следующем способе расчета территориального индекса цены:
- •3. Индекс физического объема реализации подсчитывается по формуле:
- •4. Расчет индексов ипроизводится аналогично.
- •Для заметок
- •V. Приложения
- •1. Экзаменационные вопросы по курсу «Статистика»
- •3. Таблицы
- •4. Литература
- Если отбор случайный – повторный, - если отбор случайный – бесповторный.
Имеем (см. задачу 4):
, ,n = 100, N = 1500, t = 2.
Средняя ошибка выборки равна:
,
,
Если отбор повторный или бесповторный соответственно. Тогда, в зависимости от типа отбора, предельная ошибка выборки равна:
или .
Получаем: нижняя граница доверительного интервала:
;
верхняя граница доверительного интервала:
.
Итак, с вероятностью 0,95 можно утверждать, что средний диаметр детали, изготавливаемой предприятием находится в пределах от 21,1582 до 21,7618 мм (если выборка организована методом случайного повторного отбора) и от 21,1684 до 21,7516 мм (если выборка случайная, бесповторная).
Задача 7. Для выборки из задачи 1 с вероятностью γ = 0,99 определить границы интервала, в котором заключена генеральная доля признака р – диаметр детали, находящийся в пределах от 20 до 23 мм включительно и сделать соответствующие выводы. Задачу решить в предположении бесповторного отбора из генеральной совокупности объема N = 2000.
С доверительной вероятностью γ утверждается, что математическое ожидание р принадлежит интервалу:
,
где - выборочная доля (m – количество элементов выборочной совокупности, обладающих интересующим нас признаком, n – объем выборочной совокупности), – предельная ошибка доли, равная
,
причем t – постоянная величина, значение которой определяется в зависимости от γ также, как и в задаче 6, – средняя ошибка доли, равная
- Если отбор случайный – повторный, - если отбор случайный – бесповторный.
В выборке интересующий нас диаметр детали (от 20 до 23 мм) принадлежит интервалам (см. задачу 1) (20;21), (21;22) и (22;23), частоты которых соответственно равны 27, 28 и 19. Следовательно, выборочная доля
.
Согласно условию задачи находим предельную ошибку доли:
.
Имеем: нижняя граница доверительного интервала:
;
верхняя граница доверительного интервала:
.
Итак, с вероятностью 0,99 утверждается, что среди 2000 деталей доля деталей диаметра от 20 до 23 мм находится в пределах от 0,6117 до 0,8683 (от 61,17% до 86,83%).
Для заметок
Тема 2. «Проверка статистических гипотез»
Задача 8. С вероятностью 0,95 проверить гипотезу о том, что генеральная совокупность, которой принадлежит выборка из задачи 1, распределена по нормальному (Гауссову) закону распределения случайной величины.
Гипотеза о нормальном распределении генеральной совокупности, которой принадлежит исследуемая выборка, с доверительной вероятностью γ проверяется с помощью - критерия согласия Пирсона (критерия хи - квадрат). Приведем алгоритм проверки гипотезы с помощью этого критерия.
1. Сравниваем полигон частот выборочной совокупности с графиком функции плотности
идеального нормального распределения (рисунок 7). Если они похожи, то переходим к следующему пункту алгоритма. В противном случае утверждаем, что с помощью имеющейся совокупности проверить гипотезу невозможно.
2. Сравниваем кумулятивную кривую с графиком интегральной функции
идеального нормального распределения (рисунок 8). Выводы аналогичны пункту 1 алгоритма.
Р
x 0
1
Р
0 x
3. По знаку асимметрии и эксцесса устанавливаем вид распределения (см. таблицу 9).
Таблица 9
as es |
<0 |
>0 | |
Правостороннее |
Левостороннее | ||
<0 |
Туповершинное |
правостороннее туповершинное |
левостороннее туповершинное |
>0 |
Островершинное |
правостороннее островершинное |
левостороннее островершинное |
4. По величине асимметрии и эксцесса устанавливаем тип распределения:
а) если as = es =0 – идеальное нормальное распределение;
б) если |as|<0,1, |es|<1 - нормальное распределение;
в) если |as|<0,5, |es|<0,5 – распределение, близкое к нормальному;
г) если |as|<1, |es|<1 – распределение нормального типа.
5. Производим частот теоретических частот каждого из интервалов группировки (α;β), рассчитанных в предположении, что выборочная совокупность распределена по нормальному закону распределения:
,
, ,
где - функция Лапласа, значения которой приведены в таблице 1 Приложения. Заметим, что функция Лапласа – нечетная, то есть.
6. Чтобы убедиться, что теоретические частоты адекватно описывают эмпирические данные, на одном чертеже строим кривую нормального распределения и полигон частот.
7. Находим наблюдаемое значение критерия Пирсона по формуле:
.
8. С вероятностью γ выдвигаем гипотезу о нормальном распределении генеральной совокупности, которой принадлежит выборка. Для этого по таблице 2 Приложения критических значений критерия Пирсона определяем критическое значение
, α = 1-γ, ν = k -3,
k – число интервалов группировки. Выводы производятся на основании следующего утверждения: если
,
то гипотеза о нормальном распределении генеральной совокупности, которой принадлежит исследуемая выборка, принимается с указанной вероятностью. В противном случае гипотеза отвергается с той же вероятностью.
Сравнивая рисунки 4 и 7, делаем вывод об их похожести.
Сравнивая рисунки 6 и 8, делаем вывод об их похожести.
Согласно задаче 4 (или 5)
, ,
следовательно (см. таблицу 9) рассматриваемое распределение является левосторонним островершинным.
Так как одновременно
, ,
то наше распределение имеет нормальный тип.
Используем результаты решения задач 4 и 5:
n = 100, ,.
Тогда, теоретические частоты рассчитываются так:
,
, .
Находим их в расчетной таблице:
(α;β) | |||||||
(18;19) |
18,5 |
3 |
-1,63 |
-0,8969 |
-2,29 |
-0,9780 |
4,055 |
(19;20) |
19,5 |
11 |
-0,97 |
-0,6679 |
-1,63 |
-0,8969 |
11,450 |
(20;21) |
20,5 |
27 |
-0,30 |
-0,2358 |
-0,97 |
-0,6679 |
21,605 |
(21;22) |
21,5 |
28 |
0,36 |
0,2812 |
-0,30 |
-0,2358 |
25,850 |
(22;23) |
22,5 |
19 |
1,02 |
0,6923 |
0,36 |
0,2812 |
20,555 |
(23;24) |
23,5 |
5 |
1,68 |
0,9070 |
1,02 |
0,6923 |
10,735 |
(24;25) |
24,5 |
3 |
2,35 |
0,9812 |
1,68 |
0,9070 |
3,710 |
(25;26) |
25,5 |
4 |
3,01 |
0,9974 |
2,35 |
0,9812 |
0,810 |
На одном графике (рисунок 9) строим кривую теоретических частот (сплошная линия) и полигон частот (пунктирная линия).
Рис. 9
Сравнение графиков наглядно показывает, что найденные результаты расчетов адекватно описывают эмпирические данные.
Находим наблюдаемое значение критерия Пирсона. Расчеты производим в таблице:
18,5 |
3 |
4,055 |
-1,055 |
1,113025 |
0,3710 |
19,5 |
11 |
11,450 |
-0,450 |
0,202500 |
0,0184 |
20,5 |
27 |
21,605 |
5,395 |
29,106025 |
1,0780 |
21,5 |
28 |
25,850 |
2,150 |
4,622500 |
0,1651 |
22,5 |
19 |
20,555 |
-1,555 |
2,418025 |
0,1273 |
23,5 |
5 |
10,735 |
-5,735 |
32,890225 |
6,5780 |
24,5 |
3 |
3,710 |
-0,710 |
0,504100 |
0,1680 |
25,5 |
4 |
0,810 |
3,190 |
10,176100 |
2,5440 |
- |
- |
- |
- |
11,0499 |
Итак,
.
Доверительная вероятность γ = 0,95, отсюда уровень значимости
α = 1-0,95 = 0,05. Число интервалов группировки k = 8, тогда ν = 8 -3 = 5. Отсюда, критическое значение согласно таблице 2 Приложения равно
.
Так как
11,0499<11,1,
то гипотеза о том, что генеральная совокупность, которой принадлежит выборка из задачи 1, распределена нормально, принимается с вероятностью 0,95.