Медиана.
Медиана – определяет значение признака у средней единицы ранжированного ряда.
Для нахождения медианы (значения признака у средней единицы ранжированного ряда) сначала определяется ее порядковый номер ((∑f)/2), а затем по накопленным частотам определяется либо сама медиана (для дискретных рядов), либо медианный интервал (для интервальных рядов), в котором путем простой интерполяции рассчитывается значение медианы по формуле:
(2.3.4.)
- начало модального интервала;
h – шаг интервала;
- накопленные частоты предшествующего интервала;
Определяем порядковый номер медианы: (2.3.5.)
Берем интервал 1167,1 – 4153,8
По данным таблицы 2 рассчитываем медиану:
тыс.т.
Медиану можно определить графически, для этого строится кумулята.
Рисунок 9. Кумулята.
Вывод: Половина перевезенного груза имеет объем меньше, чем 4153,8 тыс.т., а половина больше.
[1 с.8-11]
Показатели вариации
Вариация – различие в числовых значениях признака.
По размерам вариации определяется ее однородность, т.е. однородность совокупности.
В показателях рассчитывается отклонение значения признака от средней величины. В отклонениях проявляется развитие явления.
Среднее линейное отклонение – определяет насколько единиц в среднем индивидуальные значения признака отличаются от среднего арифметического.
(2.4.1.)
Таблица 11 (продолжение табл.2)
Данные для расчета показателей вариации
|
|
|
|
2538,27 1045,17 447,93 1941,03 3434,13 |
12691,35 5225,85 1791,72 5823,09 10302,39 |
6442814,59 1092380,33 200641,28 3767597,46 11793248,86 |
32214072,95 5461901,65 802565,12 11302792,38 35379746,58 |
|
35834,4 |
23296682,52 |
85161078,68 |
По данным таблицы 10 рассчитываем среднее линейное отклонение:
тыс.т.
Дисперсия – это средняя арифметическая квадратов отклонений отдельных значений признака от их средней арифметической.
(2.4.2.)
По данным таблицы 10 рассчитываем дисперсию:
Среднее квадратическое отклонение – определяет то же самое, что и среднее линейное отклонение, но значение среднего квадратического отклонения всегда больше, чем значения среднего линейного, т.к. более четко реагирует вариацию признаков.
S = (2.4.3)
По данным таблицы 10 рассчитываем среднее квадратическое отклонение:
S = тыс.т.
Вывод: На 2063,5тыс.т. в среднем значение признака, т.е. объем перевезенного груза отличается от среднего арифметического.
Коэффициент вариации – является критерием однородности совокупности и надежности средней арифметической.
Если коэффициент вариации меньше 33%, то совокупность однородна, и среднее арифметическое выбрано надежно.
Если он больше 33%, то совокупность не однородна, среднее арифметическое не надежно.
(2.4.4.)
Вывод: Совокупность неоднородна, т.к. V> 33%
[1 с.12-13]
Корреляционно-регрессионный анализ
Аналитическая группировка статистических наблюдений на транспорте.
Определяем тесноту связи между фактором (среднесписочная численность на АТП) и результирующим показателем (объемами перевезенных грузов).
Таблица 12 (продолжение таблицы 1)
Аналитическая группировка статистических наблюдений.
x |
y |
|
|
|
|
|
|
|
|
2153,0 |
4756,5 |
720,83 |
223,9 |
161363,885 |
519588,68 |
50113,3 |
6471,655 |
-1715,16 |
0,36 |
1768,0 |
5321,4 |
336,53 |
788,8 |
265437,459 |
113249,08 |
622142,3 |
5437,888 |
-116,49 |
0,02 |
690,9 |
1167,6 |
-740,78 |
-3365 |
2492737,506 |
548747,60 |
11323494,2 |
2539,951 |
-1372,35 |
1,18 |
865,2 |
2984,1 |
-566,48 |
-1549 |
877209,196 |
320893,93 |
2397976,1 |
3008,818 |
-24,72 |
0,01 |
1586,0 |
6594,0 |
153,83 |
2061,4 |
317088,702 |
23662,13 |
4249205,1 |
4946,425 |
1647,58 |
0,25 |
1449,0 |
5533,5 |
17,33 |
1000,9 |
17339,900 |
300,16 |
1001720,8 |
4579,240 |
954,26 |
0,17 |
1932,0 |
5621,7 |
500,33 |
1089 |
544883,945 |
250325,11 |
1186051,7 |
5878,510 |
-256,81 |
0,05 |
1138,0 |
3767,4 |
-293,48 |
-765,2 |
224578,809 |
86127,58 |
585592,3 |
3743,188 |
24,21 |
0,01 |
1940,0 |
8633,1 |
508,73 |
4100,5 |
2086006,514 |
258801,13 |
16813772,2 |
5901,106 |
2732,10 |
0,32 |
1512,0 |
7408,8 |
80,33 |
2876,2 |
231027,552 |
6452,11 |
8272296,4 |
4748,710 |
2660,09 |
0,36 |
1071,0 |
1980,3 |
-360,68 |
-2552 |
920565,230 |
130086,46 |
6514439,5 |
3562,420 |
-1582,12 |
0,80 |
2352,0 |
4116,0 |
920,33 |
-416,6 |
-383444,208 |
846998,11 |
173588,9 |
7008,310 |
-2892,31 |
0,70 |
898,8 |
2956,8 |
-532,88 |
-1576 |
839725,740 |
283955,77 |
2483271,7 |
3099,202 |
-142,40 |
0,05 |
1724,0 |
8068,2 |
292,43 |
3535,6 |
1033886,133 |
85512,38 |
12500184,5 |
5319,259 |
2748,94 |
0,34 |
1006,0 |
2322,6 |
-425,78 |
-2210 |
940979,781 |
181284,35 |
4884276,8 |
3387,301 |
-1064,70 |
0,46 |
1733,0 |
6079,5 |
300,83 |
1546,9 |
465334,160 |
90495,68 |
2392775,9 |
5341,855 |
737,65 |
0,12 |
1558,0 |
2803,5 |
126,53 |
-1729 |
-218779,439 |
16008,58 |
2989925,1 |
4872,988 |
-2069,49 |
0,74 |
682,5 |
2457,0 |
-749,18 |
-2076 |
1555017,597 |
561263,18 |
4308281,4 |
2517,355 |
-60,36 |
0,02 |
871,5 |
1917,3 |
-560,18 |
-2615 |
1465048,085 |
313796,03 |
6840003,3 |
3025,765 |
-1108,47 |
0,58 |
1703,0 |
6163,5 |
271,43 |
1630,9 |
442656,176 |
73671,53 |
2659704,3 |
5262,769 |
900,73 |
0,15 |
28634 |
90653 |
|
|
14278662,72 |
4711220 |
92248815,7 |
|
|
6,67 |
х – среднесписочная численность, чел.
у – объем перевезенного груза, тыс.т.
Основные понятия математической статистики это корреляция и регрессия.
Первая задача математичкой статистики – это изучение связей между случайными явлениями. Эту задачу решает корреляционный анализ. Он находится в зависимости от регрессионного анализа.
Регрессионный анализ решает вторую задачу математической статистики. Определяет форму связи между случайными явлениями.
Оценки, полученные с помощью регрессионного анализа имеют большую точность, чем выше коэффициент корреляции.
По данным таблицы 11 рассчитываем среднее значение х и у.
(2.5.1.)
(2.5.2.)
Находим коэффициент корреляции.
Коэффициент корреляции – определяет интенсивность связи между случайными величинами.
Коэффициент корреляции изменяется от -1 до 1.
Чем ближе коэффициент корреляции по модулю к единице, тем ближе разброс точек вокруг линии регрессии.
Если коэффициент корреляции стремится к 0, то точки дальше удалены от линии регрессии.
Если коэффициент корреляции имеет положительное значение, то зависимость прямая, т.е. с ростом Х значение У увеличивается.
Если коэффициент корреляции имеет отрицательное значение, то зависимость обратная, т.е. с ростом Х значение У уменьшается.
По данным таблицы 11 рассчитываем коэффициент корреляции:
(2.5.3.)
Вывод: Связь между случайными величинами умеренная.
Оцениваем значимость коэффициента корреляции по t-критерию Стьюдента.
С помощью критериев значимости определяется существенность полученных коэффициентов по выборочным данным, т.е. насколько они значимы во всей генеральной совокупности с определённой вероятностью. Для экономических расчетов вероятность 95%.
t-критерий Стьюдента используется для малых выборок, если n не более 20. t расчетная рассчитывается по формуле:
(2.5.4.)
[1 с.20]
Теоретическое значение t определяется по таблице распределения Стьюдента.
Если значение t, определенное по формуле, будет больше, чем значение t, полученное из таблицы распределения Стьюдента при заданном уровне значимости, то предположение о нулевом значении коэффициента корреляции в генеральной совокупности не подтверждается. Если tтабл ≥ tрасч, то в генеральной совокупности корреляции может не быть.
Вывод: В генеральной совокупности коэффициент корреляции отличен от 0 с 95% вероятностью, т.к. 3,953 больше 2,101 (t табличная).
Строим поле корреляции и сформулировать гипотезу о форме связи. Подсчитываем коэффициент регрессии.
Коэффициент регрессии – определяет форму связи между случайными величинами и для линейной парной зависимости (y=b*x+a) рассчитывается по формуле:
(2.5.5.)
Канонический вид:
у-4532,65=3,03х-3,03 1431,7
у-4532,65=3,03х-4338,051
у=3,03х-4338,051+4532,65
у=3,03х+194,599
Из системы уравнений получим a1 = 3,03; а0 = 194,599.
Вывод: Из полученного уравнения регрессии у=3,03х+194,599 можно утверждать, что с увеличением среднесписочной численности, объем перевезенного груза возрастет в среднем на 3,03 тыс. тонны.
Таблица 13
Строим поле корреляции в прямоугольной системе координат.
x |
500,0 |
2000,0 |
y |
1709,6 |
6254,6 |
Полем корреляции называются нанесенные в определённом масштабе точки в прямоугольной системе координат, каждая из которых имеет две координаты. |
Рисунок 10. Линейная зависимость.
Оцениваем модель через среднюю ошибку аппроксимации.
Дополнительной оценкой точности аппроксимации является средняя относительная ошибка аппроксимации. Она представляет собой среднее отклонение расчетных значений от фактических.
Ошибка аппроксимации – определяет качество модели (адекватность).
- Если ошибка аппроксимации меньше 10%, то качество модели хорошее.
- От 10% до 60%, то качество удовлетворительное.
- Если больше 60%, то плохое.
По данным таблицы 11 рассчитываем ошибку аппроксимации:
(2.5.6.)
Вывод: Качество модели удовлетворительное.
Определяем долю влияния изучаемого фактора на результирующий показатель с помощью коэффициента детерминации.
Коэффициент детерминации – определяет долю влияния численности на объем перевезенного груза.
(2.5.7.)
(2.5.8.)
Вывод: 0,4624 доля влияние факторов, вошедших в модель на объем перевезенного груза.
0,5376 доля влияния факторов, не вошедших в модель на объем перевезенного груза.
Анализ рядов динамики
Анализируем динамику перевозок грузов с помощью расчета статистических показателей и средних характеристик.
Динамический ряд – ряд расположенных в хронологической последовательности числовых значений статистического показателя, который характеризует изменение изучаемого признака во времени.
Динамический ряд характеризуется временем t и уровнем y.
Уровень ряда – это показатель, числовые значения которого составляют динамический ряд.
Время – это моменты или периоды, к которым относятся уровни ряда.
Анализ динамических рядов выявляет закономерности развития экономических явлений во времени.
Существуют два вида динамического ряда:
Моментный ряд. В этом ряде уровни характеризуют значения статистического показателя на определенную дату.
Интервальный ряд. В нём уровни характеризуют размер явления за определенный период. Уровни данного ряда не содержаться в предыдущих или последующих, поэтому их можно суммировать с целью получения укрупненных интервалов.
Таблица 14
Объем выполненных работ предприятием по годам, тыс. руб.
Рассчитываем основные показатели динамики объемов перевезенных грузов (цепные и базисные).
Абсолютный прирост
Определяется как разность между двумя уровнями динамического ряда и определяет, насколько данный уровень превышает уровень, принятый за базу сравнения (табл. 15)
Базисный абсолютный прирост: (2.6.1.)
Цепной абсолютный прирост: (2.6.2.)
Если каждый уровень динамического ряда сравнивать с одним и тем же предшествующим уровнем, принятым за базу то это сравнение с постоянной базой – базисный.
Если каждый уровень динамического ряда сравнивать с предшествующим то это сравнение с переменной базой – называется цепным.
Темп роста
Определяется как коэффициент роста, выраженный в процентах (табл. 15)
(2.6.3.)
Коэффициент роста
Определяется как отношение двух сравниваемых уровней. Он определяет во сколько раз сравниваемый уровень больше или меньше уровня, с которым производится сравнение.
Коэффициент роста с базисным показателем:
(2.6.4.)
Коэффициент роста с цепным показателем:
(2.6.5.)
Темп прироста – определяет на сколько процентов сравниваемый уровень больше или меньше уровня принятого за базу сравнения (табл. 15)
Базисный темп прироста:
(2.6.6.)
Цепной темп прироста:
(2.6.7.)
(2.6.8.)
Абсолютное значение 1% прироста. Этот показатель равен сотой части предыдущего уровня. Определяет какое абсолютное значение содержится в 1% прироста.
(2.6.9.)
Результаты расчетов сведем в таблицу 15.
Средний абсолютный прирост
(2.6.10)
Вывод: Объем выполненных работ предприятием в среднем изменился на 1,08 тыс. руб.
Средний темп роста
(2.6.11)
(2.6.12)
Вывод: Объем выполненных работ предприятием в среднем за анализируемый период времени изменилось в 1,007 раз.
Средний темп прироста
(2.6.13)
Вывод: Объем выполненных работ предприятием в среднем изменилось на 0,7%.
Таблица 15
Расчет показателей динамического ряда
Показатели |
Год |
|||
2000 |
2001 |
2002 |
2003 |
|
1. Объем выполненных работ предприятием, тыс. руб |
131,6 |
138,2 |
145,2 |
148,3 |
2. Темпы роста базисные: |
− |
1,05 |
1,10 |
1,127 |
2.1. коэффициенты |
||||
2.2. проценты |
− |
105 |
110 |
112,7 |
3. Темпы роста цепные: |
− |
1,05 |
1,05 |
1,02 |
3.1. коэффициенты |
||||
3.2. проценты |
− |
105 |
105 |
102,0 |
4. Абсолютные приросты, ед. |
− |
6,6 |
13,6 |
16,7 |
4.1. базисные (2000 г.) |
||||
4.2. цепные (по годам) |
− |
6,6 |
7,0 |
3,1 |
5. Темпы прироста базисные |
− |
0,05 |
0,103 |
0,127 |
5.1. коэффициенты |
||||
5.2. проценты |
− |
5 |
10,3 |
12,7 |
6. Темпы прироста цепные |
− |
0,05 |
0,051 |
0,021 |
6.1. коэффициенты |
||||
6.2. проценты |
− |
5 |
5,1 |
2,1 |
7. Абсолютное значение 1 % пр. |
− |
1,32 |
1,38 |
1,45 |
Рисунок 11. Тренд
Уравнение тренда: у=5,71х-11288
Анализ перевозок грузов с помощью расчета индексов сезонности.
В статистике периодические колебания, которые имеют определенный и постоянный период, равный годовому промежутку, называется «сезонные колебания» или «сезонные волны», а динамический ряд – сезонным рядом динамики.
Существуют ряд методов изучения и измерения сезонных колебаний. Самый простой заключается в построении специальных показателей, которые называются индексами сезонности Is. Совокупность этих показателей отражают сезонную волну. Индексами сезонности являются процентные отношения фактических внутригрупповых уровней к теоретическим уровням, выступающие в качестве базы сравнения.
Индексы – относительные величины, которые характеризуют соотношение во времени и в пространстве социально-экономических явлений.
Таблица 16
Среднемесячные объемы перевозок грузов АТП по годам, т.
Месяц |
Среднемесячные объемы перевозок грузов, т. |
||
2000 |
2001 |
2002 |
|
Январь |
46242 |
42936 |
42754 |
Февраль |
44810 |
45631 |
41829 |
Март |
43111 |
46839 |
43425 |
Апрель |
45827 |
48115 |
44723 |
Май |
49682 |
47816 |
47111 |
Июнь |
52119 |
49424 |
48216 |
Июль |
54723 |
53829 |
49825 |
Август |
59475 |
57917 |
54210 |
Сентябрь |
60197 |
59600 |
57817 |
Октябрь |
56815 |
54128 |
44297 |
Ноябрь |
45637 |
46200 |
43810 |
Декабрь |
44438 |
49180 |
41973 |
Определяем среднесуточный объем перевозок
, где (2.7.1.)
- среднемесячный объем перевозок i-го месяца j-го года.
- дни календарные i-го месяца j-го года.
Определяем среднесуточный объем перевозок для каждого месяца по данным за 3 года.
, где (2.7.2.)
- объем перевозок i-го месяца за 1,2,3 год соответственно. Результаты расчетов представить в таблицу 16.
Для построения сезонной волны рассчитываем индексы сезонности по формуле:
, где (2.7.3.)
- общая среднесуточная величина за исследуемый период, определяется как средневзвешенная арифметическая из среднесуточных объемов по месяцам за 3 года.
(2.7.4)
Строим график
Таблица 17
Среднесуточные объемы перевозок АТП по годам, т.
Месяц |
Кол-во дней в мес. |
Ср.суточочный объем перевозок грузов, т. |
|
|
||||||
2000г |
2001г. |
2002г |
||||||||
Январь |
31 |
1492 |
|
|
|
|
||||
Февраль |
28 |
1600 |
1630 |
1494 |
1575 |
44100 |
||||
Март |
31 |
1391 |
1511 |
1401 |
1434 |
44454 |
||||
Апрель |
30 |
1528 |
1604 |
1491 |
1541 |
46230 |
||||
Май |
31 |
1603 |
1542 |
1520 |
1555 |
48205 |
||||
Июнь |
30 |
1737 |
1647 |
1607 |
1664 |
49920 |
||||
Июль |
31 |
1765 |
1736 |
1607 |
1703 |
52793 |
||||
Август |
31 |
1919 |
1868 |
1749 |
1845 |
57195 |
||||
Сентябрь |
30 |
2007 |
1987 |
1927 |
1974 |
59220 |
||||
Октябрь |
31 |
1833 |
1746 |
1429 |
1669 |
51739 |
||||
Ноябрь |
30 |
1521 |
1540 |
1460 |
1507 |
45210 |
||||
Декабрь |
31 |
1433 |
1586 |
1354 |
1458 |
45198 |
||||
Итого |
365 |
|
|
|
|
588253 |
Таблица 18
Значения индексов сезонности
Месяц |
Индекс сезонности |
Январь |
88 |
Февраль |
98 |
Март |
89 |
Апрель |
96 |
Май |
96 |
Июнь |
103 |
Июль |
106 |
Август |
114 |
Сентябрь |
122 |
Октябрь |
104 |
Ноябрь |
93 |
Декабрь |
90 |
Рисунок 12. Индекс сезонности
Выводы:
Интенсивность движения на дорогах области характеризуется резко выраженной сезонностью.
Наименьшими перевозками характеризуется январь=88, а наибольшими сентябрь=122, это вызвано большим количеством объемов работ, носящих сезонный характер.