Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Новая КР Статистика.doc
Скачиваний:
7
Добавлен:
16.09.2019
Размер:
1.89 Mб
Скачать

Медиана.

Медиана – определяет значение признака у средней единицы ранжированного ряда.

Для нахождения медианы (значения признака у средней единицы ранжированного ряда) сначала определяется ее порядковый номер ((∑f)/2), а затем по накопленным частотам определяется либо сама медиана (для дискретных рядов), либо медианный интервал (для интервальных рядов), в котором путем простой интерполяции рассчитывается значение медианы по формуле:

(2.3.4.)

- начало модального интервала;

h – шаг интервала;

- накопленные частоты предшествующего интервала;

Определяем порядковый номер медианы: (2.3.5.)

Берем интервал 1167,1 – 4153,8

По данным таблицы 2 рассчитываем медиану:

тыс.т.

Медиану можно определить графически, для этого строится кумулята.

Рисунок 9. Кумулята.

Вывод: Половина перевезенного груза имеет объем меньше, чем 4153,8 тыс.т., а половина больше.

[1 с.8-11]

    1. Показатели вариации

Вариация – различие в числовых значениях признака.

По размерам вариации определяется ее однородность, т.е. однородность совокупности.

В показателях рассчитывается отклонение значения признака от средней величины. В отклонениях проявляется развитие явления.

Среднее линейное отклонение – определяет насколько единиц в среднем индивидуальные значения признака отличаются от среднего арифметического.

(2.4.1.)

Таблица 11 (продолжение табл.2)

Данные для расчета показателей вариации

2538,27

1045,17

447,93

1941,03

3434,13

12691,35

5225,85

1791,72

5823,09

10302,39

6442814,59

1092380,33

200641,28

3767597,46

11793248,86

32214072,95

5461901,65

802565,12

11302792,38

35379746,58

35834,4

23296682,52

85161078,68

По данным таблицы 10 рассчитываем среднее линейное отклонение:

тыс.т.

Дисперсия – это средняя арифметическая квадратов отклонений отдельных значений признака от их средней арифметической.

(2.4.2.)

По данным таблицы 10 рассчитываем дисперсию:

Среднее квадратическое отклонение – определяет то же самое, что и среднее линейное отклонение, но значение среднего квадратического отклонения всегда больше, чем значения среднего линейного, т.к. более четко реагирует вариацию признаков.

S = (2.4.3)

По данным таблицы 10 рассчитываем среднее квадратическое отклонение:

S = тыс.т.

Вывод: На 2063,5тыс.т. в среднем значение признака, т.е. объем перевезенного груза отличается от среднего арифметического.

Коэффициент вариации – является критерием однородности совокупности и надежности средней арифметической.

  • Если коэффициент вариации меньше 33%, то совокупность однородна, и среднее арифметическое выбрано надежно.

  • Если он больше 33%, то совокупность не однородна, среднее арифметическое не надежно.

(2.4.4.)

Вывод: Совокупность неоднородна, т.к. V> 33%

[1 с.12-13]

    1. Корреляционно-регрессионный анализ

Аналитическая группировка статистических наблюдений на транспорте.

Определяем тесноту связи между фактором (среднесписочная численность на АТП) и результирующим показателем (объемами перевезенных грузов).

Таблица 12 (продолжение таблицы 1)

Аналитическая группировка статистических наблюдений.

x 

y 

 

 

 

 

 

 

 

 

2153,0

4756,5

720,83

223,9

161363,885

519588,68

50113,3

6471,655

-1715,16

0,36

1768,0

5321,4

336,53

788,8

265437,459

113249,08

622142,3

5437,888

-116,49

0,02

690,9

1167,6

-740,78

-3365

2492737,506

548747,60

11323494,2

2539,951

-1372,35

1,18

865,2

2984,1

-566,48

-1549

877209,196

320893,93

2397976,1

3008,818

-24,72

0,01

1586,0

6594,0

153,83

2061,4

317088,702

23662,13

4249205,1

4946,425

1647,58

0,25

1449,0

5533,5

17,33

1000,9

17339,900

300,16

1001720,8

4579,240

954,26

0,17

1932,0

5621,7

500,33

1089

544883,945

250325,11

1186051,7

5878,510

-256,81

0,05

1138,0

3767,4

-293,48

-765,2

224578,809

86127,58

585592,3

3743,188

24,21

0,01

1940,0

8633,1

508,73

4100,5

2086006,514

258801,13

16813772,2

5901,106

2732,10

0,32

1512,0

7408,8

80,33

2876,2

231027,552

6452,11

8272296,4

4748,710

2660,09

0,36

1071,0

1980,3

-360,68

-2552

920565,230

130086,46

6514439,5

3562,420

-1582,12

0,80

2352,0

4116,0

920,33

-416,6

-383444,208

846998,11

173588,9

7008,310

-2892,31

0,70

898,8

2956,8

-532,88

-1576

839725,740

283955,77

2483271,7

3099,202

-142,40

0,05

1724,0

8068,2

292,43

3535,6

1033886,133

85512,38

12500184,5

5319,259

2748,94

0,34

1006,0

2322,6

-425,78

-2210

940979,781

181284,35

4884276,8

3387,301

-1064,70

0,46

1733,0

6079,5

300,83

1546,9

465334,160

90495,68

2392775,9

5341,855

737,65

0,12

1558,0

2803,5

126,53

-1729

-218779,439

16008,58

2989925,1

4872,988

-2069,49

0,74

682,5

2457,0

-749,18

-2076

1555017,597

561263,18

4308281,4

2517,355

-60,36

0,02

871,5

1917,3

-560,18

-2615

1465048,085

313796,03

6840003,3

3025,765

-1108,47

0,58

1703,0

6163,5

271,43

1630,9

442656,176

73671,53

2659704,3

5262,769

900,73

0,15

28634

90653

 

 

14278662,72

4711220

92248815,7

 

 

6,67

х – среднесписочная численность, чел.

у – объем перевезенного груза, тыс.т.

Основные понятия математической статистики это корреляция и регрессия.

Первая задача математичкой статистики – это изучение связей между случайными явлениями. Эту задачу решает корреляционный анализ. Он находится в зависимости от регрессионного анализа.

Регрессионный анализ решает вторую задачу математической статистики. Определяет форму связи между случайными явлениями.

Оценки, полученные с помощью регрессионного анализа имеют большую точность, чем выше коэффициент корреляции.

По данным таблицы 11 рассчитываем среднее значение х и у.

(2.5.1.)

(2.5.2.)

Находим коэффициент корреляции.

Коэффициент корреляции – определяет интенсивность связи между случайными величинами.

Коэффициент корреляции изменяется от -1 до 1.

  • Чем ближе коэффициент корреляции по модулю к единице, тем ближе разброс точек вокруг линии регрессии.

  • Если коэффициент корреляции стремится к 0, то точки дальше удалены от линии регрессии.

  • Если коэффициент корреляции имеет положительное значение, то зависимость прямая, т.е. с ростом Х значение У увеличивается.

  • Если коэффициент корреляции имеет отрицательное значение, то зависимость обратная, т.е. с ростом Х значение У уменьшается.

По данным таблицы 11 рассчитываем коэффициент корреляции:

(2.5.3.)

Вывод: Связь между случайными величинами умеренная.

Оцениваем значимость коэффициента корреляции по t-критерию Стьюдента.

С помощью критериев значимости определяется существенность полученных коэффициентов по выборочным данным, т.е. насколько они значимы во всей генеральной совокупности с определённой вероятностью. Для экономических расчетов вероятность 95%.

t-критерий Стьюдента используется для малых выборок, если n не более 20. t расчетная рассчитывается по формуле:

(2.5.4.)

[1 с.20]

Теоретическое значение t определяется по таблице распределения Стьюдента.

Если значение t, определенное по формуле, будет больше, чем значение t, полученное из таблицы распределения Стьюдента при заданном уровне значимости, то предположение о нулевом значении коэффициента корреляции в генеральной совокупности не подтверждается. Если tтабл ≥ tрасч, то в генеральной совокупности корреляции может не быть.

Вывод: В генеральной совокупности коэффициент корреляции отличен от 0 с 95% вероятностью, т.к. 3,953 больше 2,101 (t табличная).

Строим поле корреляции и сформулировать гипотезу о форме связи. Подсчитываем коэффициент регрессии.

Коэффициент регрессии – определяет форму связи между случайными величинами и для линейной парной зависимости (y=b*x+a) рассчитывается по формуле:

(2.5.5.)

Канонический вид:

у-4532,65=3,03х-3,03 1431,7

у-4532,65=3,03х-4338,051

у=3,03х-4338,051+4532,65

у=3,03х+194,599

Из системы уравнений получим a1 = 3,03; а0 = 194,599.

Вывод: Из полученного уравнения регрессии у=3,03х+194,599 можно утверждать, что с увеличением среднесписочной численности, объем перевезенного груза возрастет в среднем на 3,03 тыс. тонны.

Таблица 13

Строим поле корреляции в прямоугольной системе координат.

x

500,0

2000,0

y

1709,6

6254,6

Полем корреляции называются нанесенные в определённом масштабе точки в прямоугольной системе координат, каждая из которых имеет две координаты.

Рисунок 10. Линейная зависимость.

Оцениваем модель через среднюю ошибку аппроксимации.

Дополнительной оценкой точности аппроксимации является средняя относительная ошибка аппроксимации. Она представляет собой среднее отклонение расчетных значений от фактических.

Ошибка аппроксимации – определяет качество модели (адекватность).

- Если ошибка аппроксимации меньше 10%, то качество модели хорошее.

- От 10% до 60%, то качество удовлетворительное.

- Если больше 60%, то плохое.

По данным таблицы 11 рассчитываем ошибку аппроксимации:

(2.5.6.)

Вывод: Качество модели удовлетворительное.

Определяем долю влияния изучаемого фактора на результирующий показатель с помощью коэффициента детерминации.

Коэффициент детерминации – определяет долю влияния численности на объем перевезенного груза.

(2.5.7.)

(2.5.8.)

Вывод: 0,4624 доля влияние факторов, вошедших в модель на объем перевезенного груза.

0,5376 доля влияния факторов, не вошедших в модель на объем перевезенного груза.

    1. Анализ рядов динамики

Анализируем динамику перевозок грузов с помощью расчета статистических показателей и средних характеристик.

Динамический ряд – ряд расположенных в хронологической последовательности числовых значений статистического показателя, который характеризует изменение изучаемого признака во времени.

Динамический ряд характеризуется временем t и уровнем y.

Уровень ряда – это показатель, числовые значения которого составляют динамический ряд.

Время – это моменты или периоды, к которым относятся уровни ряда.

Анализ динамических рядов выявляет закономерности развития экономических явлений во времени.

Существуют два вида динамического ряда:

  1. Моментный ряд. В этом ряде уровни характеризуют значения статистического показателя на определенную дату.

  2. Интервальный ряд. В нём уровни характеризуют размер явления за определенный период. Уровни данного ряда не содержаться в предыдущих или последующих, поэтому их можно суммировать с целью получения укрупненных интервалов.

Таблица 14

Объем выполненных работ предприятием по годам, тыс. руб.

Рассчитываем основные показатели динамики объемов перевезенных грузов (цепные и базисные).

Абсолютный прирост

Определяется как разность между двумя уровнями динамического ряда и определяет, насколько данный уровень превышает уровень, принятый за базу сравнения (табл. 15)

Базисный абсолютный прирост: (2.6.1.)

Цепной абсолютный прирост: (2.6.2.)

Если каждый уровень динамического ряда сравнивать с одним и тем же предшествующим уровнем, принятым за базу то это сравнение с постоянной базой – базисный.

Если каждый уровень динамического ряда сравнивать с предшествующим то это сравнение с переменной базой – называется цепным.

Темп роста

Определяется как коэффициент роста, выраженный в процентах (табл. 15)

(2.6.3.)

Коэффициент роста

Определяется как отношение двух сравниваемых уровней. Он определяет во сколько раз сравниваемый уровень больше или меньше уровня, с которым производится сравнение.

Коэффициент роста с базисным показателем:

(2.6.4.)

Коэффициент роста с цепным показателем:

(2.6.5.)

Темп прироста – определяет на сколько процентов сравниваемый уровень больше или меньше уровня принятого за базу сравнения (табл. 15)

Базисный темп прироста:

(2.6.6.)

Цепной темп прироста:

(2.6.7.)

(2.6.8.)

Абсолютное значение 1% прироста. Этот показатель равен сотой части предыдущего уровня. Определяет какое абсолютное значение содержится в 1% прироста.

(2.6.9.)

Результаты расчетов сведем в таблицу 15.

Средний абсолютный прирост

(2.6.10)

Вывод: Объем выполненных работ предприятием в среднем изменился на 1,08 тыс. руб.

Средний темп роста

(2.6.11)

(2.6.12)

Вывод: Объем выполненных работ предприятием в среднем за анализируемый период времени изменилось в 1,007 раз.

Средний темп прироста

(2.6.13)

Вывод: Объем выполненных работ предприятием в среднем изменилось на 0,7%.

Таблица 15

Расчет показателей динамического ряда

Показатели

Год

2000

2001

2002

2003

1. Объем выполненных работ

предприятием, тыс. руб

131,6

138,2

145,2

148,3

2. Темпы роста базисные:

1,05

1,10

1,127

2.1. коэффициенты

2.2. проценты

105

110

112,7

3. Темпы роста цепные:

1,05

1,05

1,02

3.1. коэффициенты

3.2. проценты

105

105

102,0

4. Абсолютные приросты, ед.

6,6

13,6

16,7

4.1. базисные (2000 г.)

4.2. цепные (по годам)

6,6

7,0

3,1

5. Темпы прироста базисные

0,05

0,103

0,127

5.1. коэффициенты

5.2. проценты

5

10,3

12,7

6. Темпы прироста цепные

0,05

0,051

0,021

6.1. коэффициенты

6.2. проценты

5

5,1

2,1

7. Абсолютное значение 1 % пр.

1,32

1,38

1,45

Рисунок 11. Тренд

Уравнение тренда: у=5,71х-11288

    1. Анализ перевозок грузов с помощью расчета индексов сезонности.

В статистике периодические колебания, которые имеют определенный и постоянный период, равный годовому промежутку, называется «сезонные колебания» или «сезонные волны», а динамический ряд – сезонным рядом динамики.

Существуют ряд методов изучения и измерения сезонных колебаний. Самый простой заключается в построении специальных показателей, которые называются индексами сезонности Is. Совокупность этих показателей отражают сезонную волну. Индексами сезонности являются процентные отношения фактических внутригрупповых уровней к теоретическим уровням, выступающие в качестве базы сравнения.

Индексы – относительные величины, которые характеризуют соотношение во времени и в пространстве социально-экономических явлений.

Таблица 16

Среднемесячные объемы перевозок грузов АТП по годам, т.

Месяц

Среднемесячные объемы перевозок грузов, т.

2000

2001

2002

Январь

46242

42936

42754

Февраль

44810

45631

41829

Март

43111

46839

43425

Апрель

45827

48115

44723

Май

49682

47816

47111

Июнь

52119

49424

48216

Июль

54723

53829

49825

Август

59475

57917

54210

Сентябрь

60197

59600

57817

Октябрь

56815

54128

44297

Ноябрь

45637

46200

43810

Декабрь

44438

49180

41973

  • Определяем среднесуточный объем перевозок

, где (2.7.1.)

- среднемесячный объем перевозок i-го месяца j-го года.

- дни календарные i-го месяца j-го года.

  • Определяем среднесуточный объем перевозок для каждого месяца по данным за 3 года.

, где (2.7.2.)

- объем перевозок i-го месяца за 1,2,3 год соответственно. Результаты расчетов представить в таблицу 16.

  • Для построения сезонной волны рассчитываем индексы сезонности по формуле:

, где (2.7.3.)

- общая среднесуточная величина за исследуемый период, определяется как средневзвешенная арифметическая из среднесуточных объемов по месяцам за 3 года.

(2.7.4)

  • Строим график

Таблица 17

Среднесуточные объемы перевозок АТП по годам, т.

Месяц

Кол-во

дней в мес.

Ср.суточочный объем перевозок грузов, т.

2000г

2001г.

2002г

Январь

31

1492

1385

1379

1419

43989

Февраль

28

1600

1630

1494

1575

44100

Март

31

1391

1511

1401

1434

44454

Апрель

30

1528

1604

1491

1541

46230

Май

31

1603

1542

1520

1555

48205

Июнь

30

1737

1647

1607

1664

49920

Июль

31

1765

1736

1607

1703

52793

Август

31

1919

1868

1749

1845

57195

Сентябрь

30

2007

1987

1927

1974

59220

Октябрь

31

1833

1746

1429

1669

51739

Ноябрь

30

1521

1540

1460

1507

45210

Декабрь

31

1433

1586

1354

1458

45198

Итого

365

588253

Таблица 18

Значения индексов сезонности

Месяц

Индекс сезонности

Январь

88

Февраль

98

Март

89

Апрель

96

Май

96

Июнь

103

Июль

106

Август

114

Сентябрь

122

Октябрь

104

Ноябрь

93

Декабрь

90

Рисунок 12. Индекс сезонности

Выводы:

  1. Интенсивность движения на дорогах области характеризуется резко выраженной сезонностью.

  2. Наименьшими перевозками характеризуется январь=88, а наибольшими сентябрь=122, это вызвано большим количеством объемов работ, носящих сезонный характер.