- •ОГЛАВЛЕНИЕ
- •ПРЕДИСЛОВИЕ
- •МЕТОДИЧЕСКИЕ МАТЕРИАЛЫ
- •РАБОЧАЯ ПРОГРАММА ДИСЦИПЛИНЫ
- •РЕКОМЕНДАЦИИ ПО САМОСТОЯТЕЛЬНОЙ РАБОТЕ СТУДЕНТА
- •ТЕОРЕТИЧЕСКИЕ МАТЕРИАЛЫ
- •ГЛАВА 1. СТАТИСТИЧЕСКИЕ ПОНЯТИЯ И РАСПРЕДЕЛЕНИЯ
- •§ 1. Введение
- •§ 2. Суть регрессионного анализа
- •§ 3. Некоторые статистические определения
- •§ 4. Нормальное (гауссовское) распределение
- •§ 5. (хи-квадрат)-распределение
- •§ 6. Распределение Стьюдента (t-распределение)
- •§ 7. F-распределение (распределение дисперсионного отношения)
- •§ 8. Статистическая проверка гипотез
- •§ 9. Определение критических значений распределений Стьюдента и Фишера с использованием программы Microsoft Office Excel
- •Резюме
- •Вопросы для самопроверки
- •ГЛАВА 2. ПАРНАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ. УСЛОВИЯ ГАУССА–МАРКОВА
- •§ 1. Основные понятия
- •§ 2. Метод наименьших квадратов
- •§ 3. Предпосылки метода наименьших квадратов
- •§ 4. Анализ точности определения оценок коэффициентов регрессии
- •§ 5. Проверка статистической значимости коэффициентов парной линейной регрессии
- •§ 6. Интервальные оценки коэффициентов линейного уравнения регрессии
- •§ 7. Доверительные интервалы для зависимой переменной
- •§ 8. Проверка общего качества уравнения регрессии. Коэффициент детерминации
- •Резюме
- •Вопросы для самопроверки
- •ГЛАВА 3. МНОЖЕСТВЕННАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ
- •§ 1. Определение параметров уравнения регрессии
- •§ 2. Расчет коэффициентов множественной линейной регрессии
- •§ 3. Дисперсии и стандартные ошибки коэффициентов
- •§ 4. Проверка статистической значимости коэффициентов уравнения регрессии
- •§ 5. Интервальные оценки коэффициентов теоретического уравнения регрессии
- •§ 6. Проверка общего качества уравнения регрессии
- •§ 7. Проверка равенства двух коэффициентов детерминации
- •§ 8. Проверка гипотезы о совпадении уравнений регрессии для двух выборок
- •§ 10. Частные уравнения регрессии
- •Резюме
- •Вопросы для самопроверки
- •ГЛАВА 4. АВТОКОРРЕЛЯЦИЯ СЛУЧАЙНЫХ ВОЗМУЩЕНИЙ
- •§ 1. Суть и причины автокорреляции
- •§ 2. Последствия автокорреляции
- •§ 3. Обнаружение автокорреляции. Критерий Дарбина–Уотсона
- •§ 4. Методы устранения автокорреляции
- •Резюме
- •Вопросы для самопроверки
- •ГЛАВА 5. ГЕТЕРОСКЕДАСТИЧНОСТЬ СЛУЧАЙНЫХ ВОЗМУЩЕНИЙ
- •§ 1. Общие понятия
- •§ 2. Последствия гетероскедастичности
- •§ 3. Обнаружение гетероскедастичности
- •§ 4. Методы смягчения проблемы гетероскедастичности
- •Резюме
- •Вопросы для самопроверки
- •ГЛАВА 6. МУЛЬТИКОЛЛИНЕАРНОСТЬ
- •§ 1. Общие понятия и последствия мультиколлнеарности
- •§ 2. Определение мультиколлинеарности
- •§ 3. Методы устранения мультиколлинеарности
- •Резюме
- •Вопросы для самопроверки
- •ГЛАВА 7. ФИКТИВНЫЕ ПЕРЕМЕННЫЕ В РЕГРЕССИОННЫХ МОДЕЛЯХ
- •§ 1. Модель с одной фиктивной (бинарной) переменной
- •§ 3. Сравнение двух регрессий
- •Резюме
- •Вопросы для самопроверки
- •ГЛАВА 8. НЕЛИНЕЙНАЯ РЕГРЕССИЯ
- •§ 1. Общие понятия
- •§ 2. Степенные модели (логарифмические)
- •§ 3. Обратная модель (гиперболическая)
- •§ 4. Полиномиальная модель
- •§ 5. Показательная модель (лог-линейная)
- •§ 6. Выбор формы модели
- •Резюме
- •Вопросы для самопроверки
- •ГЛАВА 9. ВРЕМЕННЫЕ РЯДЫ
- •§ 1. Общие понятия
- •§ 2. Моделирование тренда временного ряда
- •§ 4. Стационарные ряды
- •§ 5. Процесс авторегрессии AR(p)
- •§ 6. Процессы скользящего среднего MA(q)
- •§ 7. Комбинированные процессы авторегрессии-скользящего среднего ARMA(p, q)
- •§ 8. Модели ARMA, учитывающие наличие сезонности
- •§ 9. Нестационарные временные ряды. Процессы авторегрессии и проинтегрированного скользящего среднего ARIMA(p, k, q)
- •§ 10. Регрессионные модели с распределенными лагами
- •§ 11. Полиномиально распределенные лаги Ш. Алмон
- •Резюме
- •Вопросы для самопроверки
- •ГЛАВА 10. СИСТЕМЫ ОДНОВРЕМЕННЫХ УРАВНЕНИЙ
- •§ 1. Общие понятия
- •§ 2. Идентификация структурной формы модели
- •§ 3. Косвенный метод наименьших квадратов
- •§ 4. Двухшаговый метод наименьших квадратов
- •§ 5. Трехшаговый метод наименьших квадратов
- •Резюме
- •Вопросы для самопроверки
- •ЗАКЛЮЧЕНИЕ
- •ЗАДАНИЯ ДЛЯ КОНТРОЛЯ
- •Тесты для самоконтроля
- •Ключи к тестам для самоконтроля
- •Контрольная работа
- •Вопросы к зачету (экзамену)
- •ГЛОССАРИЙ
- •СПИСОК ЛИТЕРАТУРЫ
§ 3. Некоторые статистические определения
Будем полагать, что в нашем распоряжении имеются выборочные данные, которые могут быть использованы для оценки теоретических характеристик, относящихся ко всей генеральной совокупности. Генеральной совокупностью называют совокупность всех мыслимых наблюдений, которые могли бы быть произведены при данном реальном комплексе условий. Генеральная совокупность — понятие условно-математическое, и его не следует смешивать с реальными совокупностями, подлежащими статистическому исследованию. Пусть по результатам выборки известны n значений
признака x (x1 ,x2 ,...,xn ) и n значений признака y (y1 ,y2 ,...,yn ).
Выборочное среднее x переменной x (является оценкой математического ожидания M (x)=m ):
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
= 1n ∑xi . |
|
|
|
|
|||||
|
|
|
x |
|
|
|
|
||||||
|
|
|
|
|
|
|
i=1 |
|
|
|
|
|
|
Выборочная дисперсия (вариация) переменной х: |
|
||||||||||||
|
|
|
|
|
|
|
|
n |
|
|
n |
2 |
|
|
|
n |
|
∑xi |
2 |
∑xi |
|||||||
1 |
|
|
|
|
|
2 |
i=1 |
|
i=1 |
|
|||
∑(xi−x ) |
|||||||||||||
Var (x)= |
|
= |
|
|
− |
|
. |
||||||
n |
n |
|
n |
||||||||||
|
|
i=1 |
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Несмещенная выборочная дисперсия S 2x |
переменной х (является |
2
несмещенной оценкой теоретической дисперсии σx ):
n
S 2x = n −1 1 ∑(x i−x )2 .
i=1
Выборочная ковариация Cov(x, y) является мерой взаимосвязи между двумя переменными х и y:
24
|
1 |
n |
1 |
n |
|||||||||||||||
Cov(x, y)= |
∑(xi − |
|
)(yi − |
|
)= |
∑xi yi − |
|
× |
|
= |
|
− |
|
× |
|
. |
|||
x |
y |
x |
y |
xy |
x |
y |
|||||||||||||
n |
n |
||||||||||||||||||
|
|
i=1 |
|
i=1 |
Она служит оценкой теоретической ковариации:
σxy =M (x−M (x))(y−M (y)) .
Иногда при расчете выборочной ковариации делят не на n, а на
(n-1).
Выборочный коэффициент корреляции rxy является более точной по сравнению сковариацией мерой взаимосвязимежду переменными:
|
Cov(x,y) |
|
|
|
|
− |
|
× |
|
|
|
||
r xy = |
= |
|
|
xy |
x |
y |
. |
||||||
Var (x)×Var (y) |
Var (x)×Var (y) |
||||||||||||
|
|
|
|||||||||||
Теоретический коэффициент корреляции ρxy : |
|
||||||||||||
|
ρxy = |
|
σxy |
. |
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
σ2xσ2y |
|
|
|
|
|
|
|
При строгой положительной линейной связи коэффициенты корреляции равны +1, при строгой отрицательной линейной связи коэффициенты корреляции равны -1. Величина r = 0 означает, что линейная зависимость между переменными в выборке отсутствует. Тот факт, что r = 0 или r = ±1, необязательно означает, что ρ=0
или ρ=±1, и наоборот.
Для определения статистической значимости коэффициента rxy , в случае нормально распределенных случайных величин, ис-
пользуется t-статистика.
Пусть по результатам выборочного наблюдения rxy ≠0 . Объяс-
няется ли это действительно существующей корреляционной связью между признаками x и y в генеральной совокупности или является следствием случайности отбора элементов в выборку?
По вычисленному значению выборочного коэффициента корреляции r требуется проверить гипотезу:
25
Н0: коэффициент корреляции в генеральной совокупности равен нулю, при альтернативе.
Н1: коэффициент корреляции в генеральной совокупности не равен нулю.
В качестве статистического критерия для гипотезы Н0 обычно используется величина:
t = |
|
|
r |
|
|
× n−2 , |
|
|
|
||||||
1−r2 |
|||||||
|
|
которая распределена по закону Стьюдента с (n-2) степенями свободы. Гипотеза Н0 отвергается (т. е. корреляционная связь считает-
ся установленной), если t превысит критическое значение tα2 ,n−2 с
вероятностью ошибиться α и (n-2) степенями свободы. С доверительной вероятностью (1-α) истинное значение коэффициента r заключено в пределах:
|
|
|
|
|
|
|
|
|
thz1<ρ<thz2 , |
|
|
|
|
||||||||
|
|
|
1 |
ln |
1+r |
|
|
|
r |
u |
α |
|
, th z = |
ez −e−z |
|
|
|||||
|
|
|
|
|
|
2 |
|
|
|||||||||||||
где |
z1,2 |
= |
|
|
− |
|
|
|
|
|
|
|
|
|
z |
−z — тангенс ги- |
|||||
2 |
1−r |
2 |
( |
) |
n−3 |
||||||||||||||||
|
|
|
|
|
|
n−1 |
|
e |
+e |
|
|
||||||||||
перболический от аргумента z , u |
α |
— квантиль уровня |
α |
стандарт- |
|||||||||||||||||
2 |
|||||||||||||||||||||
2 |
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ного нормального распределения.
Пример 1.1. Имеются данные о длительности разговоров по мобильным телефонам X (ч) и емкостью батареек Y (мА/ч).
|
|
|
|
|
Таблица 1.1 |
|
|
|
Расчетная таблица |
|
|
|
|
|
|
|
|
№ |
X |
Y |
X2 |
Y2 |
XY |
1 |
2 |
3 |
4 |
5 |
6 |
1 |
4,5 |
800 |
20,25 |
640000 |
3600 |
2 |
4 |
1500 |
16 |
2250000 |
6000 |
3 |
3 |
1300 |
9 |
1690000 |
3900 |
4 |
2 |
1550 |
4 |
2402500 |
3100 |
5 |
2,75 |
900 |
7,5625 |
810000 |
2475 |
26
|
|
|
|
|
|
Окончание табл. 1.1 |
|
|
1 |
2 |
3 |
4 |
5 |
|
6 |
|
6 |
1,75 |
875 |
3,0625 |
765625 |
|
1531,25 |
|
7 |
2,25 |
750 |
5,0625 |
562500 |
|
1687,5 |
|
8 |
1,75 |
1100 |
3,0625 |
1210000 |
|
1925 |
|
9 |
1,5 |
850 |
2,25 |
722500 |
|
1275 |
|
10 |
2,35 |
450 |
5,5225 |
202500 |
|
1057,5 |
|
Σ |
25,85 |
10075 |
75,7725 |
11255625 |
|
26551,25 |
|
|
|
|
|
|
|
|
Рассмотрим расчет дисперсии и коэффициента корреляции. Выборочная дисперсия переменной x :
|
|
|
|
|
|
1 |
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
n |
|
|
|
|
2 |
||||
|
Var (x)= |
∑(xi− |
|
|
|
)2 =∑xi2 |
|
n |
− ∑xi |
n = |
|||||||||||||||||||||||||||
x |
|
||||||||||||||||||||||||||||||||||||
n |
|
||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
i=1 |
|
|
|
|
|
|
|
|
|
|
|
i=1 |
|
|
|
|
i=1 |
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
75,7725 |
|
|
|
|
|
25,85 |
2 |
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
= |
|
|
|
|
|
|
|
|
|
− |
|
|
|
=0,895. |
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
10 |
|
|
|
|
|
|
|
10 |
|
|
|
|
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
Выборочная дисперсия переменной y : |
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||
|
|
|
|
|
|
|
1 |
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
n |
|
|
|
2 |
|||||
|
Var (y)= |
∑(yi− |
|
)2 =∑yi |
2 |
n − ∑yi |
n |
||||||||||||||||||||||||||||||
y |
|||||||||||||||||||||||||||||||||||||
n |
|
||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
i=1 |
|
|
|
|
|
|
|
|
|
|
|
|
i=1 |
|
|
|
|
i=1 |
|
|
|
|
|||||
|
|
|
11255625 |
|
|
|
|
|
|
10075 2 |
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
= |
|
|
|
|
|
|
|
|
|
|
|
− |
|
|
|
=110506,3. |
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
10 |
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
10 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
Линейный коэффициент корреляции: |
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
n |
|
|
n |
|
|
|
|
|
|
|
|
|
|||||
|
r xy |
|
|
|
|
|
|
|
|
|
|
|
n∑xi yi −∑xi ×∑ yi |
|
|
|
|
|
|
|
|||||||||||||||||
|
= |
|
|
|
|
|
|
|
|
|
|
i=1 |
|
|
|
|
i=1 |
|
|
i=1 |
|
|
|
|
|
|
= |
|
|||||||||
|
|
|
|
n |
|
|
|
|
|
|
|
n |
2 |
|
n |
|
|
n |
|
i ) |
2 |
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
n∑ |
i2 − |
|
∑ |
× n∑y2 |
− |
∑ y |
|
|
|
|
|||||||||||||||||||||
|
|
|
|
|
|
|
|
i=1 |
x |
|
|
(i=1 xi ) |
|
i=1 |
i |
|
(i=1 |
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
= |
|
|
|
|
|
|
|
10×26551,25−25,85×10075 |
|
|
|
|
|
|
|
=0,161. |
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
[10×7577,25 − (25,85)2] × [10×11255625 − (10075)2]
27