- •Раздел 1. Введение в эконометрику
- •Тема 1.1. Основные понятия теории вероятностей и статистики, применяемые в эконометрике
- •Раздел 2. Парная регрессия
- •Тема 2.1. Метод наименьших квадратов
- •Тема 2. 2. Экономическая и статистическая интерпретация модели парной регрессии (2 занятия)
- •Раздел 3. Множественная регрессия
- •Тема 3.3. Мультиколлинеарность
- •Тема 3.4. Гетероскедастичность
- •Тема 3.5. Автокорреляция
- •Тема 3.6. Модели с фиктивными переменными
- •Раздел 4. Временные ряды
- •Тема 4.1. Характеристики временных рядов
- •Тема 4.2. Стационарные и нестационарные временные ряды.
- •Тема 4.3. Динамические эконометрические модели
- •Раздел 5. Системы одновременных уравнений.
- •Тема 5.1. Понятие о системах эконометрических уравнений.
- •Тема 5.2. Методы оценки системы одновременных уравнений.
Раздел 1. Введение в эконометрику
Тема 1.1. Основные понятия теории вероятностей и статистики, применяемые в эконометрике
Решение типовых задач
Задача 1. На станции технического обслуживания анализируются затраты времени на ремонт автомобилей. На основании данных, полученных по 100 автомобилям, выяснилось, что для 25 из них требуется 1 ч для проведения профилактических работ. Мелкий ремонт требуется для 40 автомобилей, что занимает 2 ч. Для 20 автомобилей требуется ремонт с заменой отдельных узлов, что занимает в среднем 5 ч. 10 автомобилей могут быть отремонтированы за 10 ч. Для 5 автомобилей необходимое время ремонта составляет 20 ч.
Задание: Построить закон распределения СВ X — времени обслуживания случайно выбранного автомобиля. Определить функцию распределения F(х) и построить ее график.
Решение:
Х |
1 |
2 |
5 |
10 |
20 |
pi |
0,25 |
0,40 |
0,20 |
0,10 |
0,05 |
Функция распределения F(х) и ее график имеют вид:
Задача 2. На основе продолжительных наблюдений за весом X пакетов орешков, заполняемых автоматически, установлено, что стандартное отклонение веса пакетов σ = 10 г. Взвешено 25 пакетов, при этом их средний вес составил хср = 244 г.
Задание: В каком интервале с надежностью 95 % лежит истинное значение среднего веса пакетов?
Решение:
Логично считать, что СВ X имеет нормальный закон распределения:
X ~ N(m, 10). Для определения 95% -го доверительного интервала найдем критическую точку uα/2 = u0025 по таблице функции Лапласа по соотношению
Ф(u0,0,25)=0,95/2=0,475 => u0,025= 1,96.
Тогда по формуле Хср± uα/2σ/√n построим доверительный интервал:
(244-1,96*10/5; 244+1,96*10/5) или (240,8; 247,92).
Задача 3. Задание: В условиях задачи 2 проверить гипотезу М(Х) = 250 г при уровне значимости α = 0,05. Если данное утверждение неверно, то станок-автомат требует подналадки.
Решение:
Н0: m = 250;
H1: m ≠ 250.
По формуле U=(xср–m0)/(σ/√n) по данным выборки строим статистику
U = (244-250)/(10/√25)=-3. В данном случае используется двусторонняя критическая область. По таблице функции Лапласа найдем критическую точку uα/2 = u0,025= 1,96. Так как |Uнабл| = 3 > 1,96 = uкр, то Но должна быть отклонена в пользу H1. Это свидетельствует о том, что станок требует подналадки. Аналогичный ответ можно получить, используя интервальную оценку (240,8; 247,92), найденную в задаче 2. Если гипотетическое значение 250 не принадлежит данному интервалу, то обоснован вывод о ложности гипотезы Н0.
Задача 4. Анализируется доход X фирм в отрасли, имеющий нормальное распределение. Предполагается, что средний доход в данной отрасли составляет не менее 1 млн. $. По выборке из 49 фирм получены следующие данные: хср= 0,9 млн. $ и S = 0,15 млн. $.
Задание: Не противоречат ли эти результаты выдвинутой гипотезе при уровне значимости α = 0,01?
Решение:
H0: m = 1;
H1: m< 1.
Для проверки гипотезы Но строим критерий Тнабл = (хср–m 0)/(S/√n)=
=(0,9-1)/(0,15/7)= -4,67.
Критическую точку левосторонней критической области определяем по таблице критических точек распределения Стьюдента tкр = -t0,01,48=-2,404. Поскольку Tнабл = -4,67 < -2,404 = tкр, то Но должна быть отклонена в пользу H1, что дает основание считать, что средний доход в отрасли меньше, чем 1 млн. $.
Задача 5. В университете проведен анализ успеваемости среди студентов и студенток за последние 25 лет. СВ X и У - соответственно их суммарный балл за время учебы. Получены следующие результаты: хср = 400; Sх2= 300; уср= 420; Sу2= 150.
Задание: Можно ли утверждать, что девушки в среднем учатся лучше ребят? Принять α = 0,05.
Решение:
Для ответа на данный вопрос фактически необходимо проверить следующую гипотезу:
Но : М(Х) = M(Y);
H1 : M(X) < M(Y).
По формуле строим статистику Т с учетом, что n= k = 25:
tкр= -t0,05; 25+25-2 = -1,68.
Поскольку Тнабл = - 4,71 < -1,68 = tкр, то Но должна быть отклонена в пользу H1, что дает основание утверждать, что в данном университете девушки в среднем учатся лучше ребят.
Задача 6. Задание: В условиях задачи 5 определите, есть ли основания считать, что дисперсии двух СВ X и Y существенно отличаются друг от друга (т.е. разброс оценок у студентов больше, чем у студенток).
Решение:
Из условий задачи строится следующая гипотеза:
Н0: σ2х = σ2у;
Н1: σ2х > σ2у.
Для проверки гипотезы по формуле F = S2x / S2y определяется статистика Fнабл = 300/150 = 2. Критическая точка распределения Фишера Fкр= 0,05;24;24= =1,98. Поскольку Fнабл = 2 > 1,98 = Fкр, то Но должна быть отклонена в пользу Н1, и имеются основания считать, что разброс в оценках у студентов данного университета существенно больше разброса в оценках у студенток.
Задача 7. Точность работы станка-автомата, заполняющего пакеты порошком, определяется совпадением веса пакетов. Дисперсия веса не должна превышать 25 (г)2.
По выборке из 20 пакетов определена исправленная дисперсия:
г 2.
Задание: Определите, требуется ли срочная подналадка станка. Принять α = 0,05.
Решение:
Сформулируем нулевую и альтернативную гипотезы, соответствующие условию задачи:
Но : σ2 = 25;
Hi : σ2 > 25.
Рассчитаем наблюдаемое значение критерия χ2 в соответствии с
χ2кр= χ20,05;19=30,14.
Так как χ2набл=22,8 < 30,14 = χ2кр, то нет оснований для отклонения Н0. Другими словами, имеющиеся данные не дают основания считать, что станок требует срочной подналадки.
Задача 8. Определяется наличие линейной зависимости между уровнями инфляции (X) и безработицы (Y) в некоторой стране за 11 лет. По статистическим данным рассчитан выборочный (эмпирический) коэффициент корреляции rху = -0,34. Задание: Существует ли значимая линейная связь между указанными показателями в данной стране на рассматриваемом временном интервале? Принять α = 0,02.
Решение:
Для ответа на вопрос проанализируем следующую гипотезу:
Н0: ρху = 0;
Н1: ρху ≠ 0.
По формуле .
С помощью таблицы критических точек распределения Стьюдента определим t α/2;n-2 = t 0,01;9 = 2,821. Поскольку |Тнабл| = 3,254 < 2,821, то коэффициент корреляции rху статистически не значим. Следовательно, ρху существенно не отличается от нуля, и между уровнями инфляции (X) и безработицы (У) не существует определенная отрицательная линейная зависимость.
Задача 9. Автомат, работающий со стандартным отклонением σ = 5 г, фасует чай в пачки. Проведена случайная выборка объемом n = 30 пачек. Средний вес пачки чая в выборке Хср = 101 г.
Задание: Найдите доверительный интервал для среднего веса пачки чая в генеральной совокупности с доверительной вероятностью р = 95%.
Решение:
р = 0,95 => α = 1 - р = 1 - 0,95 = 0,05 => uα/2 = u0,025 => Ф(u0,025)=0,95/2 = 0,475 => u0,025 = 1,96.
Хср± uα/2σ/√n = 101 ± 1,96*5/√30 ≈ 101 ± 1,79, то есть искомый интервал (99,21; 102,79).
Задача 10. Задание: По исходным данным задачи 9 определить, каким должен быть объем выборки, чтобы ширина доверительного интервала была ± 1 грамм.
Решение:
uα/2σ/√n ≤ 1 => √n ≥ uα/2σ => n ≥ (uα/2σ)2 = (1,96*5)2 = 96,04, то есть минимальный объем выборки равен 97. Так как объем первоначальной выборки равен 30, то объем новой выборки равен 97 – 30 = 67 пачек.
Находим среднюю для объединенной выборки в 97 пачек (находим именно среднюю для выборки в 97 единиц, а не среднее арифметическое средних для выборок объемов 30 и 67 пачек) и получаем доверительный интервал для средней в генеральной совокупности Хср ±1.
Задача 11. Проведена выборка объема n = 2000 шт. 150 из них оказались бракованными.
Задание: Найти доверительный интервал доли бракованных изделий в генеральной совокупности для доверительной вероятности р = 95%.
Решение:
Производится выборка объема n. Для нее вычисляется выборочная доля р - доля объектов, обладающих этим свойством. Тогда при выполнении условий nр^ ≥ 5, n(1-р^) ≥ 5 доверительный интервал для генеральной доли задается формулой р^ ± uα/2(√p^(l-p^)/n).
p^ = 150/2000 = 0,075
nр^ = 2000*0,075 = 150 > 5.
n(1-p^)= 2000*(1-0,075) = 1850 > 5
Оба условия выполнены.
р = 0,95 => α = 1 - р = 1 - 0,95 = 0,05 => uα/2 = u0,025 => Ф(u0,025)=0,95/2 = 0,475 => u0,025 = 1,96.
р^ ± uα/2(√p^(l-p^)/n)= 0,075 ± 1,96(√0,075(1 - 0,075)/2000) ≈
≈ 0,075 ± 0,012, то есть искомый интервал (0,063; 0,087).
Задача 12. Задание: По исходным данным задачи 11 определить объем выборки, при котором ширина доверительного интервала будет ±0,005.
Решение:
р^ ± uα/2(√p^(l-p^)/n) ≤ 0,005 => (uα/2)2p^(l – р^)/n < 0,0052 = 0,000025 => n ≥ (uα/2)2p^(l – р^)/0,000025 ≈ 1,962*0,075*(1 - 0,075)/0,000025 ≈ 10660, то есть минимальный объем выборки равен 10660.
Так как объем первоначальной выборки равен 2000, то объем новой выборки равен 10660 - 2000 = 8660 деталей. Находим выборочную долю бракованных изделий p^ для объединенной выборки в 10660 деталей и получаем доверительный интервал для доли бракованных изделии в генеральной совокупности р ± 0,005.
Задача 13. Проводились испытания нового лекарства. В эксперименте участвовали n1 = 3000 мужчин и n2 = 3500 женщин. У 50 мужчин и 110 женщин наблюдались побочные эффекты. Можно ли утверждать, что побочные эффекты от нового лекарства у женщин возникают чаще, чем у мужчин? Доверительная вероятность р = 95%.
Выборочные доли р^1 = 50/3000 ≈ 0,017, р^2 = 110/3500 ≈ 0,031.
H0: p1=p2 (генеральные доли одинаковы).
H0: p1<p2
Проведем левостороннюю проверку. α = 1- р = 1- 0,95 = 0,05 => uα = =u0,05 => Ф(u0,05)=0,90/2 = 0,450 => u0,05 = 1,645 => граничная точка -1,645. Выборочная доля для объединенной выборки pср = (50 + 110)/(3000 + 3500) ≈ ≈0,025.
Статистика u = (p1^-p2^)/КОРЕНЬ(pср*(1- pср)*(1/n1+1/n2))=
=(0.017-0.031)/КОРЕНЬ(0,025*(1-0,025)*(1/3000+1/3500))≈-3,604
Отсюда, поскольку uнабл < uкрит (-3,604<-1,645) гипотеза Н0 отклоняется в пользу альтернативной гипотезы Н1 на уровне значимости 5%. Побочные эффекты от нового лекарства у женщин возникают чаще, чем у мужчин.