Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Прогнозирование и планирование.doc
Скачиваний:
77
Добавлен:
27.05.2015
Размер:
846.34 Кб
Скачать

Глава 16. Регрессионный анализ: популярная система прогнозирования продаж

Регрессионный анализ - это статистическая процедура для математической усредненной оценки функциональной связи между зависимой и независимой переменной (переменными). Простая регрессия рассматривает одну независимую переменную, например цену или затраты на рекламу в функции спроса, а множественная регрессия - две или большее количество переменных, например цену и затраты на рекламу совместно. В этой главе обсуждается простая (линейная) регрессия, например Y=а+bх, и показывается, как метод наименьших квадратов применяется для расчета коэффициентов регрессии.

МЕТОД НАИМЕНЬШИХ КВАДРАТОВ

Метод наименьших квадратов широко используется в регрессионном анализе для расчета значений коэффициентов в уравнении регрессии. Для регрессионного анализа используются данные всех наблюдений и ищется прямая наилучшего согласия с помощью метода наименьших квадратов. На рисунке 16.1 показано регрессионное взаимодействие.

Рисунок 16.1 – Схема построения линии наилучшего приближения

по методу наименьших квадратов

Чтобы пояснить метод наименьших квадратов, определим невязку (отклонение) как разницу между наблюдаемым значением и его оценкой и обозначим ее через u: u=Y-Y’, где Y – наблюдаемое значение зависимой переменной; Y’ – расчетное значение зависимой переменной, выполняемое по формуле: Y’=a+bX.

Согласно критерию наименьших квадратов прямая наилучшего согласия должна располагаться таким образом, чтобы сумма квадратов невязок (на рис. 16.1 это расстояние по вертикали от точек, соответствующих наблюдениям, по прямой) были минимальной, т.е. .

Для нахождения минимума продифференцируем и приравняем нулю производную. Получим:

Решая уравнения относительно b и a, получаем:

, , где,.

Вариант 1. Чтобы показать, как рассчитываются значения b и a, используем данные табл. 16.1. Все расчеты приведены ниже таблицы.

Таблица 16.1 – Объемы продаж и затрат на рекламу

Период

Затраты на рекламу, X, тыс. долл.

Объем продаж, Y,

тыс. долл.

XY

X2

Y2

1

9

15

135

81

225

2

19

20

380

361

400

3

11

14

154

121

196

4

14

16

224

196

256

5

23

25

575

529

625

6

12

20

240

144

400

7

12

20

240

144

400

8

22

23

506

484

529

9

7

14

98

49

196

10

13

22

286

169

484

11

15

18

270

225

324

12

17

18

306

289

324

Итого

174

225

3414

2792

4359

Из таблицы следует:

.

Подставляя полученные значения в вышеприведенные формулы, получаем:

;

Тогда можно записать: .

Вариант 2. Предположим, что расходы на рекламу в следующем периоде также составили 10 тыс. долл. Предполагаемый объем продаж следующего периода (в тыс. долл.) рассчитывается:

.

ПРЕДУПРЕЖДЕНИЕ

Прежде чем реализовывать регрессионный подход с использованием метода наименьших квадратов, очень важны нанести данные на специальную диаграмму, так называемую диаграмму Разброса (рис. 16.2). Это делается для того, чтобы убедиться в существовании линейной зависимости между значениями Y и X прошлых периодов.

28

Рисунок 16.2 – Диаграмма разброса

Если по какой-то причине присутствует нелинейная зависимость, то линейная функция Y=а+bХ не обеспечит хорошего согласия. С целью достижения хорошего согласия и высокой точности необходимо рассчитывать статистические коэффициенты регрессии: R2 и t-значение, которые обсуждаются ниже.

КОЭФФИЦИЕНТЫ РЕГРЕССИИ

Регрессионный анализ как разновидность статистического исследования использует набор коэффициентов, характеризующих точность и надежность полученного результата. К ним относятся:

  1. коэффициент корреляции (r) и коэффициент смешанной корреляции (R2);

  2. стандартное отклонение для оценки (S) и доверительный интервал предсказания;

  3. стандартное отклонение для коэффициента регрессии (Sb) и t-статистика/

Поясним каждый из перечисленных коэффициентов.

1. Коэффициент корреляции r и коэффициент смешанной корреляции R2

Коэффициент корреляции r показывает степень корреляции (зависимости) между значениями Х и Y, изменяется в диапазоне [-1, + 1].

Более широко используется коэффициент смешанной корреляции (коэффициент детерминированности) R2 (читается «R-квадрат»), который говорит о том, насколько хорошо составлено уравнение регрессии. Если говорить точнее, этот коэффициент характеризует «добротность» модели предсказания (в какой степени совпадают фактические и прогнозируемые значения Y). Чем больше значение R2, тем лучше. По-другому: коэффициент смешанной корреляции отражает долю в общем разбросе Y, которая объясняется уравнением регрессии (описывается им). R2 изменяется в диапазоне [0,1].

Вариант 3. Утверждение «Объем продаж представляет собой функцию от расходов на рекламу с коэффициентом R2 = 70%» можно пояснить следующим образом. 70% от общего разброса объема продаж происходит за счет изменений расходов на рекламу и описывается соответствующим уравнением регрессии, оставшиеся 30% - результат действия других факторов, отличных от расходов на рекламу, например цены и общего дохода. Коэффициент смешанной корреляции рассчитывается по формуле:

Для случая линейной регрессии Y=a+bX можно использовать сокращенную формулу расчета:

.

Вариант 4. Чтобы показать, как рассчитываются различные коэффициенты регрессии, используем данные, приведенные в таблице 16.1. Используя сокращенную формулу для расчета R2, имеем:

Полученный результат означает, что около 60,84% от общего разброса объема продаж приходится на изменение затрат на рекламную кампанию, оставшиеся 39,16% пока никак не объясняются. Относительно малое значение R2 говорит о том, что имеется значительный резерв по улучшению модели прогнозирования (формулы Y’=10,5836+0,5632X). Улучшения модели можно достичь, учитывая цену или совместно цену и расходы на рекламу.