- •П.Я. Бушин
- •Введение
- •Глава 1. Парная линейная регрессия и корреляция
- •1.1. Обычный метод наименьших квадратов (мнк) и его предпосылки
- •1.2. Оценки точности уравнения регрессии и его параметров
- •1.2.1. Стандартная ошибка оценки по регрессии
- •1.2.3. Интервальные оценки параметров уравнения регрессии
- •1.2.4. Проверка значимости параметров уравнения регрессии
- •1.2.7. Коэффициент ранговой корреляции Спирмена
- •1.3. Спецификация уравнения регрессии
- •0 1,22 1,42 2,58 2,78 4
- •1.4. Нелинейная корреляция и регрессия
- •1.4.2. Индекс корреляции
- •Глава 2. Множественная корреляция и регрессия
- •2.1. Множественный корреляционный анализ
- •2.1.1. Анализ матрицы парных коэффициентов корреляции
- •2.1.2. Частная и множественная корреляция
- •2.2. Линейная модель множественной регрессии
- •2.2.1. Уравнение множественной регрессии в натуральном масштабе
- •2.2.2.Стандартизованное уравнение множественной регрессии
- •2.2.3. Оценки точности уравнения множественной регрессии
- •2.2.4. Анализ остатков уравнения множественной регрессии на втокорреляцию
- •2.2.5. Пошаговый выбор переменных
- •0 0,9 1,83 2,17 3,1 4
- •2.3. Особые случаи использования мнк во множественной регрессии
- •2.3.1. Оценка параметров уравнения множественной регрессии в условиях мультиколлинеарности (пошаговый регрессионный анализ)
- •2.3.2. Оценка параметров уравнения множественной регрессии с автокоррелированными остатками
- •2.3.3. Оценка уравнения множественной регрессии с гетероскедастичными остатками (обобщенный мнк)
- •2.3.4. Регрессионные модели с переменной структурой (фиктивные переменные)
- •Глава 3. Анализ временных рядов
- •3.1. Характеристики временных рядов
- •3.2. Показатели точности прогноза
- •3.3. Анализ автокорреляций
- •3.4. Модели стационарных временных рядов
- •3.5. Модели нестационарных временных рядов
- •3.5.1. Прогноз по тренду
- •3.5.2. Прогнозирование на основе сезонной компоненты (сезонная декомпозиция временного ряда)
- •3.5.3. Прогноз по экспоненциально взвешенным скользящим средним (адаптивные методы прогнозирования)
- •Поквартальные данные продажи учебников
- •Расчет прогноза с учетом сезонной компоненты
- •Глава 4. Система одновременных эконометрических уравнений
- •4.1. Общие понятия о системах одновременных уравнений
- •4.2. Косвенный метод наименьших квадратов
- •4.3. Проблемы идентифицируемости
- •Библиографический список
- •Оглавление
- •Глава 1. Парная линейная регрессия и корреляция………………………………………4
- •Глава 2. Множественная корреляция и регрессия………………………………………..23
- •Глава 3. Анализ временных рядов………………………………………………………….58
- •Пример. Моделирование сезонной компоненты на основе
- •Учебное издание Павел Яковлевич Бушин эконометрика
1.4.2. Индекс корреляции
Как уже отмечалось, мерой тесноты линейной корреляционной связи является коэффициент парной корреляции Пирсона. Мерой же тесноты нелинейной корреляционной связи является индекс корреляции, определяемый из соотношения
R = ,
где – расчетные значения зависимой переменной по нелинейной регрессии.
Величина индекса корреляции находится в пределах от нуля до единицы, и чем ближе его значение к 1, тем теснее рассматриваемая связь.
Известно, что линейный коэффициент корреляции и индекс корреляции в случае линейной зависимости совпадают. Совпадают эти коэффициенты и в случае линеаризации зависимостей путем преобразования независимой переменной, т.е. индекс корреляции между у и х совпадет с линейным коэффициент корреляции между у и преобразованным х.
Иное дело, когда линеаризация уравнения связана с преобразованием зависимой переменной у. В этом случае линейный коэффициент корреляции между преобразованными переменными дает лишь приближенную оценку тесноты связи и численно не совпадает с индексом корреляции.
Значимость индекса корреляции проверяется так же, как и коэффициента корреляции.
Задания для самостоятельной работы
Задание 1
Пусть имеются данные, аналогичные рассмотренным в тренировочном примере (n= 21,y– потребление,х– доходы).
х |
4,2 |
2,9 |
7,1 |
4,9 |
6,4 |
2,1 |
3,5 |
7,5 |
5 |
2,4 |
у |
4,3 |
3,6 |
5,1 |
4,6 |
7,1 |
3,1 |
3,9 |
6,1 |
5,1 |
3,6 |
7,9 |
4,9 |
2,5 |
6,1 |
3,2 |
9,2 |
4,5 |
5,5 |
3,6 |
5,2 |
8,5 |
8,2 |
4,7 |
4 |
4,6 |
3,1 |
7,5 |
5,2 |
6,1 |
4,4 |
4,1 |
5,5 |
Провести анализ этой информации по аналогии с рассмотренным тренировочным примером.
Если нет возможности посчитать с помощью статистического ППП, то воспользуйтесь нижеприведенными результатами.
Рассчитаем для них уравнение регрессии и другие характеристики, необходимые для полного анализа с помощью парной регрессии и корреляции. При возможности эти показатели рассчитайте самостоятельно.
Ниже приведены результаты расчетов (рис. 9, 10 и 11).
Описательные статистики рассчитаны отдельно:
=5,1, =4,95,Sx=2.1, Sy=1,4.
Рис. 9. Уравнение простой (парной) регрессии
Рис. 10. График остатков для наблюдений, отсортированных по возрастанию переменной х
Рис. 11. График остатков для случайного набора пар (по номерам строк)
Выписать уравнение регрессии и провести полный анализ его точности в соответствии с рассмотренным тренировочным примером.
Проверить равенства: = = и прокомментировать их смысл.
Прокомментировать смысл коэффициента регрессии (склонность к потреблению), рассчитать мультипликатор и коэффициент средней эластичности и привести их содержательный анализ.
Показать, что Vx>Vy и прокомментировать это знаком при свободном члене уравнения простой линейной регрессии.
Охарактеризовать тесноту линейной корреляционной связи на основе шкалы Чеддока.
Проверить остатки на гетероскедастичеость.
Выборочный коэффициент Дарбина –Уотсона для набора пар наблюдений в случайном порядке, т. е. для исходных данных, соответствующих рис.11, равен 1,54, а для упорядоченных пар по возрастанию переменной х (рис.10) – равен 3,25 (рассчитать самостоятельно, используя опции статистического ППП). Прокомментировать различие этих коэффициентов. Проверить остатки на автокорреляцию и сделать вывод.
Сравнительный анализ моделей приведен ниже (рис.12)
Рис. 12. Сравнительный анализ моделей
Далее приведены две из вышеперечисленных моделей.
Рис. 13. Мультипликативная модель
Рис. 14. Экспоненциальная модель
Выписать уравнения этих моделей, проанализировать их точность на основе данных из рис. 12, охарактеризовать смысл их параметров и указать наиболее точное из этих уравнений. По возможности проанализируйте поведение остатков для каждого уравнения.
Задание 2
Следующие данные представляют результат исследований по оценке стоимости недвижимости. При этом: у– рыночная цена продажи,х– оценка стоимости по результатам инвентаризации.
х |
1015,2 |
977,4 |
800 |
1031,4 |
947,7 |
1023,3 |
1069,2 |
999 |
982,8 |
у |
1220,4 |
1231,2 |
1263,6 |
1233,9 |
1209,6 |
1239,3 |
1279,8 |
1193,4 |
1263,6 |
х |
920,7 |
1007,1 |
872,1 |
1082,7 |
1026 |
1053 |
1026 |
1059,5 |
1085,4 |
у |
1179,9 |
1188 |
1177,2 |
1269 |
1271,7 |
1263,6 |
1193,4 |
1244,7 |
1252,8 |
х |
1001,7 |
1020,6 |
1070,9 |
1109,7 |
904,5 |
972 |
993,6 |
963,9 |
1093,5 |
у |
1252,8 |
1201,5 |
1239,3 |
1328,4 |
1206,9 |
1312,2 |
1285,2 |
1198,8 |
1314,9 |
Провести полный корреляционно-регрессионный анализ этой информации и сделать выводы о данном рынке недвижимости. Можно ли строить прогноз стоимости недвижимости на основе этих данных? Как повысить точность прогноза (изучите поведение остатков)?
Задание 3
Для 27 предприятий розничной торговли получены следующие данные; х–розничный товарооборот,у– издержки обращения:
х |
510 |
560 |
800 |
465 |
225 |
390 |
640 |
405 |
200 |
у |
30 |
33 |
46 |
31 |
16 |
25 |
39 |
26 |
15 |
х |
425 |
570 |
472 |
250 |
665 |
650 |
620 |
380 |
550 |
у |
34 |
37 |
28 |
19 |
38 |
36 |
35 |
24 |
38 |
х |
750 |
660 |
450 |
563 |
400 |
553 |
772 |
450 |
600 |
у |
44 |
36 |
27 |
34 |
26 |
38 |
45 |
29 |
33 |
Провести полный корреляционно-регрессионный анализ этой информации и спрогнозировать издержки обращения для предприятий с объемом розничного товарооборота в 500, 550, 600 и 620 усл. д .е.
Задание 4
По результатам отчетов о работе 30 малых предприятий получены следующие данные: х– среднегодовая стоимость основных производственных фондов,у– производство продукции:
х |
275 |
281 |
421 |
435 |
545 |
332 |
368 |
486 |
563 |
369 |
у |
212 |
347 |
376 |
462 |
512 |
298 |
386 |
498 |
612 |
338 |
х |
378 |
493 |
254 |
291 |
211 |
463 |
359 |
561 |
569 |
454 |
у |
347 |
411 |
192 |
357 |
241 |
411 |
362 |
598 |
476 |
432 |
х |
386 |
458 |
547 |
530 |
419 |
415 |
352 |
333 |
461 |
589 |
у |
453 |
477 |
569 |
342 |
419 |
471 |
298 |
415 |
267 |
463 |
Провести полный корреляционно-регрессионный анализ этой информации и спрогнозировать объемы производства продукции для предприятий со среднегодовой стоимостью основных фондов 250, 300, 350 и 400 усл. д. е.
Задание 5
Имеются данные о 20 периодических изданий: х– тираж,у– стоимость одной строки рекламы.
х |
2082 |
1575 |
1285 |
1058 |
970 |
963 |
828 |
779 |
768 |
692 |
у |
37,6 |
18,5 |
14,5 |
14,6 |
16,5 |
16,1 |
13,8 |
13,1 |
13,8 |
12,2 |
х |
664 |
657 |
646 |
533 |
529 |
515 |
492 |
486 |
444 |
349 |
у |
10,5 |
14,2 |
12,8 |
7,8 |
5,2 |
11,1 |
6,6 |
8,8 |
6 |
6,8 |
Проанализировать эти данные на основе регрессионного анализа и дать прогноз стоимости одной строки рекламы, если ожидаемый тираж составит 1600, 1700 1800 и 2000 экз. Проверить выполнимость предпосылок МНК.