- •3. Программа наблюдения и сбор первичных данных
- •3.1. Организационная форма наблюдения
- •3.3. Способ статистического наблюдения
- •4. Систематизация первичных данных
- •4.1. Группировка первичных данных
- •4.2. Табличная форма отображения первичных данных
- •4.3. Графическое отображение первичных данных
- •5. Статистические показатели
- •5.1. Показатели среднего
- •5.2. Показатели вариации
- •5.3. Показатели зависимости признаков
- •Расчет и анализ статистических показателей
- •6.1. Расчет показателей описательной статистики
- •6.2. Гистограммы
- •6.3. Корреляция динамических рядов количества запросов
- •6.4. Проверка статистических гипотез
- •6.4.1. Гипотеза о равенстве дисперсий количества запросов на земельные участки и окс.
- •6.4.2. Гипотеза о равенстве средних значений запросов на земельные участки и окс
- •6.5. Анализ регрессии
- •6.5.2. Регрессия заявок на окс.
- •6.6. Прогноз получения заявок на земельные участки и окс.
4.3. Графическое отображение первичных данных
Для отображения динамических рядов можно использовать обыкновенный график.(рис.1)
5. Статистические показатели
5.1. Показатели среднего
Среднее значение – простейшая характеристика статистической совокупности. Вычисляется по формуле среднего арифметического:
Здесь - значение количества соответствующего запроса вi-й день наблюдения,n– количество дней наблюдения. В нашем случае период наблюдения с 10.01.2013 по 30.09.2013 составляет 181 дней, поэтомуn следует принять равным 181. (См. табл. 1).
Среднее значение будем рассчитывать для запросов каждого из отдела. Сравнение средних позволит предварительно оценить соотношение между запросами о земельных участках и ОКС. Но если посмотреть на графики рис. 1, то видно, что среднее значение является приближенной характеристикой. Если запрос ОКС «ведет себя» достаточно стабильно, и может быть оценен средним значением, то запрос о земельных участках колеблется в больших пределах. Для его характеристики показателя среднего недостаточно.
5.2. Показатели вариации
Эти показатели характеризуют изменчивость совокупности, колеблемость (вариативность) признаков единиц наблюдения. В общем случае изменчивость оценивается дисперсией , размахоми средним линейным отклонением.
5.3. Показатели зависимости признаков
Уровни динамического ряда зависят от одного факторного признака – времени. Поэтому рассмотрим характеристики, описывающие свойства ряда в зависимости от этого признака.
1). Коэффициент корреляции является оценкой силы линейной связи между уровнями ряда и временем (датой).
Выборочный коэффициент корреляции вычисляется по формуле
Здесь - уровень ряда (значение количества запросов) вi-й период (день);- датаi-го периода;.- средние значения уровней ряда и даты соответственно.
2). Проверить наличие тенденции можно и другим способом. Разобьем динамический рад на две равные части. Вычислим средние значения для каждой из частей. Проверим гипотезу о равенстве средних . Здесь- генеральные средние первого и второго полупериодов (частей) динамического ряда;- уровень значимости. Если гипотеза не отклоняется, то это означает, что генеральное среднее первой части динамического ряда незначимо отличается от генерального среднего второй. То есть уровни динамического ряда не имеют тенденции к стабильному изменению. В противном случае, при отклонении гипотезы, можно утверждать, что существует устойчивая тенденция к изменению уровней ряда. О направлении изменения можно догадаться, сравнив выборочные средние. Если, то уровни ряда в среднем растут. При противоположном знаке неравенства – убывают.
3). Уравнение регрессии описывает аналитическую зависимость среднего значения уровней ряда от времени. Именно с помощью регрессионного анализа можно прогнозировать значения уровней динамического ряда в будущем.
Расчет и анализ статистических показателей
6.1. Расчет показателей описательной статистики
Под показателями описательной статистики понимают простейшие статистические характеристики. К ним относятся показатели среднего, вариации и некоторые другие – асимметрия, эксцесс и пр. Программа Excelпозволяет сразу вычислить комплекс показателей.
Результаты расчета приведены в табл. 2
Таблица 2
зем. участок |
|
ОКС |
|
Среднее |
232.6906077 |
Среднее |
93.39226519 |
Стандартная ошибка |
4.817468323 |
Стандартная ошибка |
2.808362224 |
Медиана |
230 |
Медиана |
90 |
Мода |
221 |
Мода |
86 |
Стандартное отклонение |
64.81240768 |
Стандартное отклонение |
37.78264954 |
Дисперсия выборки |
4200.648189 |
Дисперсия выборки |
1427.528607 |
Эксцесс |
0.517390249 |
Эксцесс |
0.510471932 |
Асимметричность |
0.238787006 |
Асимметричность |
0.648998188 |
Интервал |
399 |
Интервал |
191 |
Минимум |
77 |
Минимум |
25 |
Максимум |
476 |
Максимум |
216 |
Сумма |
42117 |
Сумма |
16904 |
Счет |
181 |
Счет |
181 |
Уровень надежности(95.0%) |
9.505976786 |
Уровень надежности(95.0%) |
5.541546786 |
Из табл. 2 следует, что для запросов о земельных участках условия симметричности выполняются. Значения запросов ОКС распределены несимметрично. На это указывает достаточно большое значение коэффициента асимметрии.
Оценка островершинности распределений базируется на сравнении коэффициента эксцесса с нулем. Для запросов о земельных участках эксцесс равен 0.51739. и для запросов ОКС эксцесс равен 0.51047 и оба положительные. Значит острота вершины распределения почти такая же, как и у нормального
Итак, можно сделать первые выводы:
- распределение запросов о земельных участках симметрично, по остроте вершины близко к нормальному;
- распределение запросов ОКС несимметрично, по остроте вершины близко к нормальному.
Таким образом, предварительно можно утверждать, что оба распределения отличаются от нормального.
Степень изменчивости (вариативность) количества запросов.
Рассеяние случайных величин оценивается показателями вариации. В описательной статистике присутствуют три таких показателя: дисперсия выборки (выборочная дисперсия), стандартное отклонение (или среднее квадратическое отклонение) и интервал (размах). Для удобства сравнения запишем эти данные в таблицу 3. В последнем столбце «Отношение показателей» приведены частные от деления показателей запросов земли на запросы ОКС. Видно, что показатели вариации запросов земли значительно больше, чем запросов ОКС. Это говорит о неустойчивости запросов поданных на земли. Такой же вывод можно было сделать и раньше, на основании анализа графиков таблица 3.
Таблица 3.
Наименование показателя |
земля |
ОКС |
Отношение показателей |
Стандартное отклонение |
64.81241 |
37.78265 |
1.715 |
Дисперсия выборки |
4200.648 |
1427.529 |
2.943 |
Интервал |
399 |
191 |
2.089 |
Интервальные оценки генеральных средних.
Результаты расчета интервальных оценок генеральных средних приведены в табл. 4.
Таблица 4.
Наименование показателя |
земля |
ОКС |
Среднее |
232.6906 |
93.3922 |
Предельная ошибка |
9.5059 |
5.5415 |
Максимум интервальной оценки |
242.1966 |
98.9338 |
Максимальный элемент выборки (максимум) |
476 |
216 |
Минимум интервальной оценки |
223.1846 |
87.8507 |
Минимальный элемент выборки (минимум) |
77 |
25 |
Из табл. 4 следует, что при доверительной вероятности 0.95 доверительный интервал для генерального среднего запроса по земле равен [223.1846…242.1966] шт., а для запросов по ОКС – [87.8507…98.9338] шт.