Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Консп. лек. по экономет. Цвиль М.М..doc
Скачиваний:
54
Добавлен:
09.11.2019
Размер:
3.5 Mб
Скачать

2. Коэффициент корреляции

Перейдем к оценке тесноты корреляционной зависимости. Рассмотрим наиболее важный для практики и теории случай линейной зависимости вида .

Представим уравнение в эквивалентном виде:

В этой системе величина

(2.14)

показывает, на сколько величин у изменится в среднем , когда увеличится на одно х.

Величина является показателем тесноты линейной связи и называется выборочным коэффициентом корреляции (или просто коэффициентом корреляции).

Две корреляционные зависимости переменной от приведены на рис. Очевидно, что в случае а) зависимость между переменными менее тесная и коэффициент корреляции должен быть меньше, чем в случае б), так как точки корреляционного поля а) дальше отстоят от линии регрессии, чем точки поля б).

Если , то корреляционная связь между переменными называется прямой, если , - обратной. При прямой (обратной) связи увеличение одной из переменных ведет к увеличению (уменьшению) условной (групповой) средней другой.

Учитывая (2.13), формулу для представим в виде:

(2.15)

Отметим другие модификации формулы , полученные из формулы (2.15):

(2.16)

(2.17)

Для практических расчетов наиболее удобна формула (2.17), так как по ней находится непосредственно из данных наблюдений и на значении не скажутся округления данных, связанные с расчетом средних и отклонений от них.

Выборочный коэффициент корреляции (при достаточно большом объеме выборки ) так же, как и коэффициент корреляции двух случайных величин, обладает следующими свойствами.

  1. Коэффициент корреляции принимает значения на отрезке [– 1;1], т.е. . Чем ближе к единице, тем теснее связь.

  2. При корреляционная связь представляет линейную функциональную зависимость. При этом все наблюдаемые значения располагаются на прямой линии.

  3. При линейная корреляционная связь отсутствует. при этом линия регрессии параллельна оси Ох.

3. Основные положения регрессионного анализа. Теорема Гаусса – Маркова

В силу воздействия неучтенных случайных факторов и причин отдельные наблюдения переменной будут в большей или меньшей мере отклоняться от функции регрессии .

Рассмотрим линейный регрессионный анализ, для которого линейная парная регрессионная модель имеет вид:

. (2.18)

Отметим основные предпосылки регрессионного анализа.

  1. В модели возмущение (или зависимая переменная ) есть величина случайная, а объясняющая переменная - величина неслучайная.

  2. Математическое ожидание возмущения равно нулю:

(2.19)

(или математическое ожидание зависимой переменной равно линейной функции регрессии: ).

  1. Дисперсия возмущения (или зависимой переменной ) постоянна для любого

(2.20)

(или ) – условие гомоскедастичности или равноизменчивости возмущения (зависимой переменной )).

  1. Возмущения и (или переменные и ) не коррелированы:

(2.21)

  1. Возмущение (или зависимая переменная ) есть нормально распределенная случайная величина.

В этом случае модель называется классической нормальной линейной регрессионной моделью.

Для получения уравнения регрессии достаточно предпосылок 1 – 4. Требование выполнения предпосылки 5 (т.е. рассмотрение «нормальной регрессии») необходимо для оценки точности уравнения регрессии и его параметров.

Оценкой модели по выборке является уравнение регрессии . Параметры этого уравнения и определяются на основе метода наименьших квадратов.

Воздействие неучтенных случайных факторов и ошибок наблюдений в модели определяется с помощью дисперсии возмущений (ошибок) или остаточной дисперсии . Несмещенной оценкой этой дисперсии является выборочная остаточная дисперсия.

S 2 , (2.22)

где групповая средняя, найденная по уравнению регрессии; выборочная оценка возмущения или остаток регрессии.

Возникает вопрос, являются ли оценки , и параметров «наилучшими»? Ответ на этот вопрос дает следующая теорема.

Теорема Гаусса – Маркова. Если регрессионная модель удовлетворяет предпосылкам 1 – 4, то оценки , имеют наименьшую дисперсию в классе всех линейных несмещенных оценок.

Таким образом, оценки , в определенном смысле являются наиболее эффективными линейными оценками параметров , .