Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
tema3.doc
Скачиваний:
9
Добавлен:
01.05.2019
Размер:
299.01 Кб
Скачать

8. Измерение связи неколичественных признаков. Фиктивные переменные.

Корреляционно-регрессивный анализ применим только к количественным признакам. Однако на практике достаточно часто возникает необходимость исследования влияния качественных признаков, имеющих 2 или более уровней градации.

К числу таких признаков можно отнести:

  • пол (м., ж.)

  • образование

  • фактор сезонности

  • форма собственности предприятия

  • отрасль и т.д.

Качественные признаки могут оказать существенное влияние на структуру линейных связей между переменными и приводить к скачкообразному изменению параметров регрессивной модели. В этом случае говорят об исследовании регрессивной модели с переменной структурой или построении регрессивной модели по неоднородным данным.

Например, необходимо изучить зависимость размеров заработной платы (у), не только от количественных факторов: х1 – производительности труда; х2 – количества рабочих дней, но и от качественного признака Z – пол работника.

Можно получить оценки для каждого уровня качественных признаков, т.е. построить уравнение регрессии.

Отдельно для работников - мужчин и отдельно для работников – женщин, а затем изучить различия между ними.

Но есть и другой подход, позволяющий изучить влияние значений количественных переменных и качественных признаков с помощью одного уровня регрессии. Этот подход основан на введении так называемых фиктивных переменных (структурных, манекенных). В качестве фиктивных переменных используются дихотолические переменные, которые принимают всего 2 значения: 0 или 1. В этом случае первоначальная модель заработной платы изменится и примет следующий вид.

Где Z1 = 0, если работник женского пола,

Z1 = 1, если работник мужского пола.

Таким образом по данной модели мы можем сделать вывод, что средняя заработная плата у мужчин больше на величину C1 Z1 = C1  1, т.е. С1.

Следует отметить, что в принципе качественные различия можно формализировать с помощью любой переменной, принимающей 2 разных значения (т.е. необязательно 0 или 1).

Однако в эконометрике почти всегда используются переменные типа 0 или 1, т.к. при этом интерпретация полученных результатов выглядит предельно просто.

9. Предпосылки метода наименьших квадратов при нахождении параметров уравнения множественной регрессии.

При этом делаются определенные предположения относительно случайно составляющей ε1.

Случайно составляющая ε представляет собой не наблюдаемую величину. После того как произведена оценка параметров модели, рассчитанная разность фактических и теоретических значений результата признана ( ), можно определить величину случайной ошибки.

При изменении специализации модели, добавлении в нее новых переменных или новых наблюдений выборочные оценки Е могут измениться, поэтому в задачи регрессивного анализа входит не только построение самой модели, но и исследование случайных отклонений ε1, т.е. остаточных величин.

При статистической оценке параметров регрессии, показателей корреляции основывается на непроверяемых предпосылках распределения случайного числа ε1 Они носят лишь предварительный характер.

После построения уравнения регрессии производится проверка наличия у оценок ε тех свойств, которые предполагались. Это связано с тем, что оценки параметров регрессии должны отвечать определенным критериям. Они должны быть не смещенными, самостоятельными и эффективными. Эти свойства оценок, полученные по МНК имеют чрезвычайно важное значение при использовании корреляционно-регрессивной модели.

Коэффициенты регрессии, найденные исходя из системы нормальных уравнений, представляют собой выборочные оценки характеристики силы связи. Их несмещенность является нежелательным свойством, т.к. именно в этом случае они могут иметь практическую значимость. Несмещенность оценки означает, что математическое ожидание остатков равно 0. Следовательно, при большем числе выборочных оцениваний остатки не будут накапливаться, и найденный параметр bj можно рассматривать как среднее значение из возможно большего количества несмещенных оценок. Если оценки имеют свойство несмещенности, то их можно сравнивать по разным исследованиям.

Оценки считают эффективными, если они характеризуются наименьшей дисперсией. В практических исследованиях это означает возможность перехода от точечного прогноза к интервальному. Степень реалистичности доверительных оценок параметров обеспечивается, если эти оценки будут также и самостоятельными.

Самостоятельность оценок характеризует увеличение их увеличения их точности с увеличением объема их выборки. Наибольший практический интерес представляют те результаты регрессии, для которых отдельный интервал доверительного значения параметра bj имеет предел значений вероятности, равный 1.

Указанный критерий оценок обязательно учитывается при различных способах оценивания.

МНК строит оценки регрессии на основе суммы минимизации квадратов остатков.

Поэтому очень важно учитывать поведение остаточной величины регрессии (т.е. ε).

Исследование остатков ε предполагает проверку наличия следующих 5 предпосылок МНК:

  1. случайный характер остатков,

  2. нулевая средняя величина остатков, независимо от хi,

  3. Гомоскедастичность , т.е. дисперсия каждого отклонения εi одинаково для всех значений х (постоянство дисперсии ошибок),

  4. отсутствие автокорреляции остатков. Значения остатков εi распределены независимо друг от друга.

  5. остатки подчиняются нормальному распределению.

В том случае, когда все 5 предпосылок выполняются, оценки полученные по МНК и методу мах правдоподобия совпадают между собой. Если же какие-либо из предпосылок не выполняются, то следует корректировать модель.

25

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]