Статистическое изучение взаимосвязи социально-экономических явлений

Часть II однофакторный и многофакторный регрессионный анализ

1. Нахождение уравнений регрессии между двумя признаками

Измерить корреляционную связь между признаками х и у и найти форму этой связи (ее аналитическое выражение – математическую модель) – две важные, неразрывные и дополняющие друг друга задачи корреляционно-регрессионного анализа. Их можно рассматривать в разной последовательности. В части I были рассмотрены методы выявления корреляционной связи и измерения ее тесноты, в части II рассматриваются вопросы, связанные с регрессионным анализом.

Найти уравнение регрессии – значит по эмпирическим (фактическим) данным математически описать изменение взаимно коррелируемых величин.

Уравнение регрессии должно определить, каким будет среднее значение результативного признака у при том или ином значении факторного признака х, если остальные факторы, влияющие на у и не связанные с х, не учитывать, т.е. абстрагироваться от них. Другими словами, уравнение регрессии можно рассматривать как вероятностную гипотетическую функциональную связь средней величины результативного признака у со значениями факторного признака х.

Теоретическая линия регрессии – это уравнение регрессии (линия, изображающая уравнение регрессии).

Теоретические значения результативного признака – это значения, рассчитанные по уравнению регрессии.

Обозначения: или(читается: «игрек, выравненный по икс») и рассматривается как функция отх, т.е ==f(x).

Найти в каждом конкретном случае тип функции, с помощью которой можно адекватно отразить ту или иную зависимость между признаками х и у, – это одна из основных задач регрессионного анализа.

Выбор теоретической линии регрессии

часто обусловлен формой эмпирической линии регрессии (теоретическая линия как бы сглаживает изломы эмпирической линии регрессии);
кроме того, необходимо учитывать природу изучаемых показателей и специфику их взаимосвязей.

Виды уравнений (и обоснование выбора вида уравнения), которые наиболее часто используются (в экономических исследованиях) для аналитической связи между х и у , даются в лекции №11.

Линейная (или прямолинейная) зависимость – это зависимость, выраженная уравнением прямой ; зависимости, выпаженные другими видами уравнений –криволинейные.

Выбрав тип функции, по эмпирическим данным определяют параметры уравнения. При этом отыскиваемые параметры должны быть такими, при которых рассчитанные по уравнению теоретические значения результативного признака были бы максимально близки к эмпирическим данным (т.е. минимально от них отличались).

Существуют различные методы нахождения параметров уравнения регрессии, из них наиболее часто используется метод наименьших квадратов.

Метод наименьших квадратов (МНК) это метод, основанный на принципе Лежандра.

Принцип Лежандра заключается в следующем требовании: искомые значения параметров уравнения регрессии должны быть такими, при которых теоретические значения результативного признака обеспечивали бы минимальную суммуквадратов их отклонений от эмпирических значений, т.е.

(21)

(Заметим, = 0, поэтому разности возводятся в квадрат.)

1 / 61 2 3 4 5 6 > Следующая >>>

Соседние файлы в папке регрессия_Лекции_10-11

#
10.06.2015414.21 Кб100Статистика_ч1.doc
#
10.06.2015413.7 Кб91Статистика_ч2.doc