Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Конспект 3.doc
Скачиваний:
9
Добавлен:
09.08.2019
Размер:
407.04 Кб
Скачать

1. Построение рядов распределения, определение числовых характеристик случайных величин.

Расположение значений случайной величины в порядке возрастания или убывания называется ранжированием ряда. Среднее значение случайной величины х при N наблюдениях определяется по формуле

Мера рассеивания (дисперсия) определяется по формуле

Средним квадратическим отклонением называется квадратный корень из дисперсии, т.е. Коэффициент вариации (относительная мера колеблемости) представляет собой отношение среднего квадратического отклонения к среднему значению. Чтобы построить интервальный ряд распределения и определить частоты по интервалам, необходимо сначала определить ширину интервалов. Для определения ширины интервалов в рядах распределения можно использовать следующую формулу: где xmax - xmin — разность между наибольшим и наименьшим значениями (размах вариации); N — число наблюдений; 1 + 3,322 lg N — число интервалов.

Частное от деления размаха вариации на число интервалов принимается за ширину интервала, которая обычно сохраняется одинаковой для всех групп ряда распределения. Началом первого интервала считается величина xmin - d/2, а окончанием последнего интервала — величина xmax + d/2. Образуется k + 1 интервалов, после чего производится подсчет значений (частот), попадающих в тот или иной интервал.

Резко выделяющиеся, или аномальные, значения наблюдений представляют собой ошибки, которые должны быть исключены при нахождении регрессионной модели. Аномальные значения выявляются по критерию vа или по критерию tа Романовского.

Удельная фондоемкость грузовых перевозок (XI) на участках железной дороги

i

xi

i

xi

i

xi

i

xi

i

xi

1

6,47

16

7,36

31

7,90

46

9,17

61

13,63

2

6,47

17

7,38

32

7,99

47

9,43

62

14,01

3

6,50

18

7,38

33

8,18

48

Э,54

63

14,20

4

6,51

19

7,38

34

8,18

49

9,76

64

14,52

5

6,51

20

7,39

35

8,19

50

10,48

65

14,99

6

6,51

21

7,48

36

8,22

51

10,49

66

15,20

7

6,64

22

7,48

37

8,41

52

10,53

67

15,89

8

6,76

23

7,49

38

8,41

53

10,56

68

16,39

9

7,02

24

7,51

39

8,48

54

10,87

69

18,51

10

7,05

25

7,56

40

8,52

55

10,93

11

7,09

26

7,62

41

8,60

56

11,08

12

7,17

27

7,62

42

8,62

57

11,28

13

7,27

28

7,72

43

8,79

58

12,43

14

7,34

29

7,76

44

9,09

59

!2,92

15

7,35

30

7,78

45

9,16

60

13,17

  1. Проверка по vа. Для первого члена (i = 1) вариационного ряда находят

,

а для последнего члена (в нашей задаче i = 69)

где х — выборочное среднее, или математическое ожидание; s — выборочное среднее квадратическое, или стандартное отклонение:

n — число членов рассматриваемого ряда.

В нашей задаче v1 = 1,01; v2 = 3,27 при n = 69, s = 2,81 и х = 9,31. Расчетные значения сопоставляем с критическими, найденными для заданного уровня значимости (α = 0,05, или 95% вероятности) и объема выборки.

2. Прогнозирование изменения показателей

Прогнозирование развития любой системы (предприятия, фирмы и т.д.) предъявляет специфические требования к параметрам (объектам), характеризующим и определяющим ее развитие. Поэтому на первом этапе работ необходимо провести детальное логическое изучение системы: зависимости рассматриваемого объекта (параметра, показателя) от других систем одного уровня и субсистемы (системы более высшего уровня); взаимосвязи между данным объектом и другими объектами системы; установление характера предоставления статистических данных об объекте.

Подготовка исходных данных начинается с проверки временного ряда, в результате которой устанавливаются полнота ряда (наличие данных за каждый год (месяц, квартал) ретроспективного периода), сопоставимость данных и в случае необходимости осуществляется проверка методики приведения данных к сопоставимому виду. Если временной ряд представлен не полностью, то необходимо недостающие данные определить с помощью тех или иных методов интерполяции в зависимости от характера протекания процесса.

Наряду с этим осуществляется также формирование массива функций, который в последующем будет использован для выбора вида математической модели.

Фильтрация исходного динамического ряда включает его сглаживание и выравнивание.

В результате этой процедуры устраняются случайные возмущения (флуктуации), возникающие в результате воздействия неучтенных факторов или ошибок измерения относительно наиболее вероятного протекания процесса, и, тем самым, исключается искажающее влияние случайных колебаний на выбор вида регрессии.

Временной ряд—это последовательность наблюдений yt1, yt2…… ytn каждое из которых относится к некоторому моменту времени t1, t2, ..., tп или определяет результаты за некоторый период.

Применение полученных результатов, вытекающих из анализа временных рядов, позволяет прогнозировать исследуемые показатели.

При изучении процесса в развитии необходимо определить его тенденцию. Под общей тенденцией понимают закономерность, которая сложилась за ряд прошлых периодов и сохраняется в настоящем. Эту общую тенденцию экстраполируют на ближайшее будущее исходя из принципа наличия инерционности изучаемых процессов: Наиболее вероятный уровень в ближайшем будущем, если не произойдет радикальных изменений в ходе процесса, это тот, который вытекает из закономерностей, установленных на основании глубокого изучения прошлого и настоящего.

В ходе реального процесса, определенного технологическими параметрами и плановыми показателями, могут иметь место отклонения (превышение плановых показателей, изменения по номенклатуре и др.). Для последующего исследования и анализа хозяйственной деятельности предприятия, вскрытия резервов повышения эффективности производства и улучшения качества важно знать направленность действия отдельных факторов.

Располагая временными рядами для исследуемого показателя и для всех факторов, необходимо, прежде всего, выявить общую тенденцию изменения этих величин (тренд, эволюторную составляющую, линию уровня).

Тренд — это уравнение y = f(t), выражающее в среднем изменение во времени показателя, заданного рядом динамики. Такое уравнение можно рассматривать как аппроксимацию временного ряда или как частный случай регрессии. Как показывает исследование экономических временных рядов, в них всегда содержится общая тенденция, которую необходимо выделить.

Уравнение можно отыскивать:

- непосредственно по отчетным или опытным данным;

- по k-членным скользящим средним.

Использование скользящих средних целесообразно в случае достаточной длины ряда. Число членов скользящей средней должно быть обусловлено соображениями по существу процесса и в зависимости от шага временного ряда. Так, если данные о размерах показателя недельные, то интерес представляет четырехчленная скользящая средняя, выравнивающая характер процесса в пределах месяца; в случае месячных данных целесообразно трехчленное выравнивание, сглаживающее результаты в пределах квартала.

При сглаживании с помощью скользящих средних приходится терять часть данных: при трехчленном выравнивании — две строки таблицы, при четырех- и пятичленном выравнивании — четыре строки и т. д. Если число данных невелико, то такое сокращение их числа вряд ли целесообразно.

Вопрос о целесообразной длине временного ряда достаточно сложный. С одной стороны, как и всегда при отыскании аппроксимирующей формулы или уравнения регрессии, естественно стремление к увеличению массива наблюдений с целью повышения точности и надежности результатов; с другой, при обработке временных рядов следует учесть нежелательность использования старых данных. Примирить эти противоречивые требования можно только за счет уменьшения длин интервалов временного ряда — сокращения «шага» ряда (путем перехода, например, от квартальных данных к месячным, от месячных к недельным и т.д., если такие данные по материалам отчетности можно собрать).

При отыскании общей тенденции возникают две задачи: выбор формы уравнения, то есть вида функции f(t), и вычисление параметров уравнения.

При выборе формы уравнения следует, как и в статистическом регрессионном анализе, хорошо знать процесс по существу. Так, для краткосрочного прогнозирования многих технико-экономических показателей наилучшей формой тренда является показательная, описывающая рост по закону сложных процентов. Для более длительного периода прогнозирования по целому ряду показателей подходит экспонента с насыщением. Если же существо процесса не диктует определенной формы уравнения, то выбор производится по наименьшей остаточной дисперсии. Графическая иллюстрация временного ряда также поможет в этом выборе.

Модели, прогнозирующие величины изучаемого технико-экономического показателя, могут быть трех видов:

- однофакторные, выражающие изменения самого показателя;

- парные регрессионные, выражающие изменения показателя в зависимости от изменения одного фактора;

- многофакторные, выражающие изменения показателя в зависимости от группы важнейших, определяющих его факторов.

Модели, с помощью которых прогнозируется изменение только самого показателя, независимо от причин его (показателя) вызывающих, мало эффективны, особенно для оперативного управления. Такие модели не позволяют выявить направление и меру воздействия на определенные факторы для достижения уровня показателя, заданного на прогнозируемый период. Парные регрессионные модели, описывающие зависимость изменения показателя от единственного фактора, не учитывают всю совокупность важнейших факторов, а их взаимодействие может привести к значительным искажениям изолированного влияния учтенного фактора.

Весьма ценными являются многофакторные прогнозирующие модели, охватывающие важнейшие факторы, обусловливающие изменение изучаемого показателя, учитывающие взаимосвязи между ними. При этом особенно важно включение в модель именно управляемых факторов, причем по состоянию на несколько периодов, предшествующих прогнозируемому. По каждому фактору должен быть выявлен лаг, указывающий продолжительность запаздывания наибольшего влияния фактора на показатель. При отсутствии лага по данному фактору следует заменять этот фактор его авторегрессионной моделью. Если, например, всех факторов четыре: факторы х1 и х2 — запаздывают с лагами L1 и L2, а факторы х3 и х4 действуют синхронно, то многофакторную модель следует строить в виде

На основании изучения статистических данных и логического анализа протекания изучаемого процесса из заданного массива функций отбираются наиболее приемлемые виды уравнений связи. Этот этап необходим, так как позволяет при отборе функций учесть основные условия протекания рассматриваемого процесса и требования, предъявляемые к математической модели. На этом этапе должны быть решены следующие вопросы:

а) является ли исследуемый показатель величиной монотонно возрастающей (убывающей), стабильной, периодической, имеющей один или несколько экстремумов;

б) ограничен ли показатель сверху или снизу каким-либо пределом;

в) имеет ли функция, определяющая процесс, точку перегиба;

г) обладает ли анализируемая функция свойством симметричности;

д) имеет ли процесс четкое ограничение развития во времени. Наиболее предпочтительно использовать в прогнозной экстраполяции технико-эксплуатационных показателей функции (модели) прогноза, представленные в таблице.

Окончательное решение о виде аппроксимирующей функции может быть принято после определения ее параметров и верификации прогноза по ретроспективному ряду. Поэтому для прогнозирования используют несколько подходящих аппроксимирующих функций, с тем, чтобы после оценки точности выбрать наиболее подходящую.

Таблица

Таблица моделей прогноза

Номер модели

Модель прогнозирования

Номер модели

Модель прогнозирования

1

у = А + В·х

9

у = -А·хВ

2

у=1/(А + В·х)

10

у=А + В· lп(х)

3

у = А + В/х

11

y = A + B·log(x)

4

у=х/(А + В·х)

12

у=А/(В + х)

5

у = А-Вх

13

у = А·х/(В + х)

6

у = А·ехр(В·х)

14

у = А·ехр(В/х)

7

y=10·х)

15

у=А·Ю(В/х)

8

у =1/(А+В·ехр(-х))

16

y = A + B· (xN)

На этапе оценки математической модели прогнозирования определяются параметры различных видов аппроксимирующих функций. Наиболее распространенными методами оценки параметров аппроксимирующих зависимостей являются метод наименьших квадратов (МНК) и его модификации, метод экспоненциального сглаживания, метод вероятностного моделирования, метод адаптивного сглаживания.

Выбор моделей прогнозирования базируется на оценке их качества. Независимо от метода оценки параметров моделей экстраполяции (прогнозирования) их качество определяется на основе исследования свойств остаточной компоненты — (у, — yTi), i =\,n , т.е. величины расхождений на участке аппроксимации (построения модели) между фактическими уровнями и их расчетными значениями.

Качество модели определяется ее адекватностью исследуемому процессу и точностью. Адекватность характеризуется наличием и учетом определенных статистических свойств, а точность — степенью близости к фактическим данным. Модель прогнозиро­вания будет считаться лучшей со статистической точки зрения, если она является адекватной и более точно описывает исходный динамический ряд.

Модель прогнозирования считается адекватной, если она учитывает существенную закономерность исследуемого процесса, в ином случае ее нельзя применять для анализа и прогнозирования.

Закономерность исследуемого процесса находит отражение в наличии определенных статистических свойств остаточной компоненты, а именно: независимости уровней, их случайности, соответствия нормальному закону распределения и равенства нулю средней ошибки.

Независимость остаточной компоненты означает отсутствие автокорреляции между остатками (yi - yТi).

О чевидно, важно иметь критерий, позволяющий устанавливать наличие автокорреляции. Таким критерием является критерий Дарбина — Уотсона, в соответствии с которым вычисляется статистика d:

где yi ; yi-1 - уровни фактического динамического ряда; yТi , yТ i-1 - теоретические (прогнозные) уровни динамического ряда; n - объем выборки.

Возможные значения статистики лежат в интервале 0 < d < 4 . Согласно методу Дарбина и Уотсона существует верхний dв и нижний da пределы значимости статистики d. Эти критические значения зависят от уровня значимости α, объема выборки п и числа объясняющих переменных m (для трендовых моделей m=1).

Вычисленное значение d сравнивается с dв и da найденными по специальным таблицам. При этом руководствуются следующими правилами:

1) dB < d < 4 — dBпринимается гипотеза: автокорреляция отсутствует;

2)0<d<dH принимается гипотеза о существовании положительной автокорреляции остатков;

3) dH < d < dH и 4—dB<d<4—dti

— при выбранном уровне значимости нельзя прийти к определенному выводу;

4) 4 — dH<d<4 — принимается гипотеза о существовании отрицательной автокорреляции остатков.

К ритерий Дарбина — Уотсона имеет два недостатка. Первый из них — наличие области неопределенности, в которой с помощью данного критерия нельзя прийти ни к какому решению. Второй — при объеме выборки меньше 15 для d не существует критических значений dH и dB. В этом случае для оценки независимости уровней ряда можно использовать коэффициент автокорреляции rа. Данный показатель приближенно можно вычислить по формуле

где d - статистика Дарбина - Уотсона.

Расчетное значение rа сравнивают с табличным. Критическое значение коэффициента автокорреляции rат имеет одну степень свободы f = п. Если rа < rат - уровни динамического ряда независимы.