Федеральное агентство по образованию
Государственное образовательное учреждение
высшего профессионального образования
Санкт-Петербургский государственный
инженерно-экономический университет
Статистика
Методические указания по выполнению лабораторных работ
для всех форм обучения
Для всех специальностей
Санкт-Петербург
2011
Лабораторная работа №1 Группировка статистических данных
Подготовка к выполнению лабораторной работы.
1. По учебнику изучить темы:
«Статистическое наблюдение»
«Статистическая сводка»
«Группировка»
«Ряд распределения»
2. Уметь группировать статистические данные.
3. Подготовить выборку по 5 признакам, объемом не менее 50 единиц (например, информация о деятельности по 50 предприятий по 5 показателям: объем производства, численность занятых, стоимость основных средств, кредиторская задолженность и балансовая прибыль). Такую информацию можно найти в статистических сборниках, internet, экономической периодике.
Задание:
Построить вариационный ряд.
Вычислить среднее значение, моду, медиану, дисперсию (смещенную и несмещенную оценку), коэффициент вариации.
Сделать равноинтервальную группировку.
Построить таблицу частот и накопленных частот для сгруппированной выборки.
Построить гистограмму и кумуляту.
Сделать выводы о распределении (характеристика симметричности и однородности).
Выполнение задания в ППП MS Excel 2007.
Ход работы:
1. В ППП MS Excel основные статистические характеристики можно получить с помощью функции Описательная статистика. Для этого последовательно выполняем следующие операции: вкладка Данные – Анализ данных – Описательная статистика – ОК. Предварительно надо проверить доступ к пакету анализа: – Параметры Excel – Надстройки – выбрать Пакет анализа и нажать на Перейти – отметить флажком Пакет анализа и Поиск решения – ОК.
В диалоговом окне заполняем строки:
Входной интервал (один или несколько столбцов из введенных исходных данных);
Группирование (выбираем по столбцам);
Метки - указание на то, что первая строка содержит название столбца;
Выходной интервал – указание места, куда будут выведены результаты расчета (любая чистая ячейка на том же листе);
Помечаем флажком строки: Итоговая статистика, Уровень надежности (0,95) – ОК
2. Для выполнения равноинтервальной группировки сначала определяем величину интервала по формуле:
h = (х максимальное – х минимальное)/n,
количество интервалов берем равное 4 (т.е. n=4).
Затем рассчитываем границы интервалов (х минимальное + h), и с применением функции:
– Статистические – ЧАСТОТА определяем частоты (количество единиц совокупности, попадающее в каждый интервал).
Выбираем интервал, в ячейку с его частотой вставляем формулу:
=ЧАСТОТА(массив_данных; массив_интервалов) – значения частот всех предыдущих интервалов где: массив_данных – столбец исходных данных (без его названия) массив_интервалов – значение правой границы рассматриваемого интервала
значения частот всех предыдущих интервалов – для первого интервала это значение равно 0
В результате должен получиться ряд распределения (смотри таблицу 1).
Таблица 1. Ряд распределения*
Левая граница интервала |
Правая граница интервала |
Интервал |
Середина интервала |
Частота |
Накопленная частота |
Частость |
Накопленная частость |
100 |
120 |
100-120 |
110 |
12 |
12 |
0,24 |
0,24 |
120 |
140 |
120-140 |
130 |
18 |
30 |
0,36 |
0,60 |
140 |
160 |
140-160 |
150 |
14 |
44 |
0,28 |
0,88 |
160 |
180 |
160-180 |
170 |
6 |
50 |
0,12 |
1,00 |
Итого: |
50 |
- |
1,00 |
- |
* все значения в таблице должны быть получены путем использования формул, кроме значений столбца Интервал – они набираются вручную
3. Построение гистограммы и кумуляты выполняется с указанием названия графика и каждой оси. Для гистограммы берем частоты и интервалы, выбираем Вставка – Гистограмма – Гистограмма с группировкой. Для кумуляты в таблице рассчитываем накопленные частоты и середины интервалов, выбираем Вставка – Точечная – Точечная с прямыми отрезками и маркерами.
4. Выводы делаем по рассчитанным характеристикам Описательной статистики. Выводы должны давать общую картину распределения: однородность совокупности («похожесть» единиц совокупности друг на друга), концентрация значений вокруг средней величины, «типичное» значение, симметричность распределения (преобладание больших или малых значений).