- •Статистическое изучение взаимосвязи социально-экономических явлений
- •Часть II однофакторный и многофакторный регрессионный анализ
- •1. Нахождение уравнений регрессии между двумя признаками
- •1.1. Парная линейная регрессия. Расчет параметров уравнения регрессии по индивидуальным данным
- •1.2. Парная линейная регрессия. Расчет параметров уравнения регрессии по сгруппированным данным
- •Поясним, как вычислялись суммы :
- •1.3. Парная линейная регрессия. Сопряженные уравнения
- •1.4. Парная линейная регрессия. Параболическая и гиперболическая корреляция
- •2. Многофакторная (множественная) регрессия. Общие положения
- •2) Выбор типа урвнения.
- •2.1. Мультиколлинеарность и коллинеарность.
- •5.1. Построение и статистический анализ многофакторной линейной модели
- •5.1. Построение и статистический анализ двухфакторной линейной модели (трехмерной регрессии)
- •5.1.1. Парные коэффициенты корреляции
- •5.1.2. Частные коэффициенты корреляции
- •5.1.3. Совокупный коэффициент множественной корреляции
- •5.1.4. Совокупный коэффициент множественной детерминации
- •5.1.5. Частные коэффициенты эластичности
- •3. Пример на экономическую интерпретацию многофакторной регрессионной модели
Статистическое изучение взаимосвязи социально-экономических явлений
Часть II однофакторный и многофакторный регрессионный анализ
1. Нахождение уравнений регрессии между двумя признаками
Измерить корреляционную связь между признаками х и у и найти форму этой связи (ее аналитическое выражение – математическую модель) – две важные, неразрывные и дополняющие друг друга задачи корреляционно-регрессионного анализа. Их можно рассматривать в разной последовательности. В части I были рассмотрены методы выявления корреляционной связи и измерения ее тесноты, в части II рассматриваются вопросы, связанные с регрессионным анализом.
Найти уравнение регрессии – значит по эмпирическим (фактическим) данным математически описать изменение взаимно коррелируемых величин.
Уравнение регрессии должно определить, каким будет среднее значение результативного признака у при том или ином значении факторного признака х, если остальные факторы, влияющие на у и не связанные с х, не учитывать, т.е. абстрагироваться от них. Другими словами, уравнение регрессии можно рассматривать как вероятностную гипотетическую функциональную связь средней величины результативного признака у со значениями факторного признака х.
Теоретическая линия регрессии – это уравнение регрессии (линия, изображающая уравнение регрессии).
Теоретические значения результативного признака – это значения, рассчитанные по уравнению регрессии.
Обозначения: или(читается: «игрек, выравненный по икс») и рассматривается как функция отх, т.е ==f(x).
Найти в каждом конкретном случае тип функции, с помощью которой можно адекватно отразить ту или иную зависимость между признаками х и у, – это одна из основных задач регрессионного анализа.
Выбор теоретической линии регрессии
часто обусловлен формой эмпирической линии регрессии (теоретическая линия как бы сглаживает изломы эмпирической линии регрессии);
кроме того, необходимо учитывать природу изучаемых показателей и специфику их взаимосвязей.
Виды уравнений (и обоснование выбора вида уравнения), которые наиболее часто используются (в экономических исследованиях) для аналитической связи между х и у , даются в лекции №11.
Линейная (или прямолинейная) зависимость – это зависимость, выраженная уравнением прямой ; зависимости, выпаженные другими видами уравнений –криволинейные.
Выбрав тип функции, по эмпирическим данным определяют параметры уравнения. При этом отыскиваемые параметры должны быть такими, при которых рассчитанные по уравнению теоретические значения результативного признака были бы максимально близки к эмпирическим данным (т.е. минимально от них отличались).
Существуют различные методы нахождения параметров уравнения регрессии, из них наиболее часто используется метод наименьших квадратов.
Метод наименьших квадратов (МНК) это метод, основанный на принципе Лежандра.
Принцип Лежандра заключается в следующем требовании: искомые значения параметров уравнения регрессии должны быть такими, при которых теоретические значения результативного признака обеспечивали бы минимальную суммуквадратов их отклонений от эмпирических значений, т.е.
(21)
(Заметим, = 0, поэтому разности возводятся в квадрат.)