- •2. Базовые понятия статистики
- •2.1. Генеральная совокупность и выборка
- •2.2. Способы представления и обработки статистических данных
- •2.3. Вычисление выборочных характеристик
- •Вопросы для самопроверки
- •Упражнения и задачи
- •3. Статистические выводы: оценки и проверка гипотез
- •3.1. Точечные оценки и их свойства
- •3.2. Свойства выборочных оценок
- •3.3. Интервальные оценки
- •3.3.1. Доверительный интервал для математического ожидания нормальной св при известной дисперсии
- •3.3.2. Доверительный интервал для математического ожидания нормальной св при неизвестной дисперсии
- •3.3.3. Доверительный интервал для дисперсии нормальной св
- •3.4. Статистическая проверка гипотез
- •3.4.1. Основные понятия
- •3.4.2. Критерии проверки. Критическая область
- •3.5. Примеры проверки гипотез
- •3.5.1. Проверка гипотезы о математическом ожидании нормальной св при известной дисперсии
- •3.5.2.Проверка гипотезы о математическом ожидании нормальной св при неизвестной дисперсии.
- •3.5.3. Проверка гипотезы о величине дисперсии нормальной св
- •3.5.4Проверка гипотезы о равенстве математических ожиданий двух нормальных св при известных дисперсиях
- •3.5.5.Проверка гипотезы о равенстве математических ожиданий двух нормальных св при неизвестных дисперсиях
- •3.5.6. Проверка гипотезы о равенстве дисперсий двух нормальных св
- •3.5.7. Проверка гипотезы о значимости коэффициента корреляции
- •Вопросы для самопроверки
- •Упражнения и задачи
- •4. Парная линейная регрессия
- •4.1. Взаимосвязи экономических переменных
- •4.2. Суть регрессионного анализа
- •4.3. Парная линейная регрессия
- •4.4. Метод наименьших квадратов
- •Вопросы для самопроверки
4.3. Парная линейная регрессия
Если функция регрессии линейна, то говорят о линейной регрессии. Модель линейной регрессии (линейное уравнение) является наиболее распространенным (и простым) видом зависимости между экономическими переменными. Кроме того, построенное линейное уравнение может служить начальной точкой эконометрического анализа.
Например, Кейнсом была предложена формула такого типа для моделирования зависимости частного потребления С от располагаемого дохода ,где —величина автономного потребления, — предельная склонность к потреблению. Однако при использовании этой модели при анализе конкретных данных мы практически всегда будем иметь определенную погрешность, так как строгой функциональной зависимости между этими показателями нет. Однако никто не будет отрицать, что люди (домохозяйства) с большим доходом имеют
большее в среднем потребление. Данная ситуация наглядно представлена на рис. 4.2.
С
I
Рис. 4.2
Из предыдущих рассуждений ясно, что линейная регрессия (теоретическое линейное уравнение регрессии) представляет собой линейную функцию между условным математическим ожиданием зависимой переменной Y и одной объясняющей переменной X (xt — значения независимой переменной в i-м наблюдении, i=1, 2,…, п).
(4.5)
Отметим, что принципиальной в данном случае является линейность по параметрам и уравнения.
Для отражения того факта, что каждое индивидуальное значение yi отклоняется от соответствующего условного математического ожидания, необходимо ввести в соотношение (4.5) случайное слагаемое .
(4.6)
Соотношение (4.6) называется теоретической линейной регрессионной моделью; и — теоретическими параметрами (теоретическими коэффициентами) регрессии; — случайным отклонением.
Следовательно, индивидуальные значения представляются в виде суммы двух компонент — систематической и случайной ( ), причина появления которой достаточно подробно рассмотрена в параграфе 4.2. В общем виде теоретиче-
скую линейную регрессионную модель будем представлять в виде
. (4.7)
Для определения значений теоретических коэффициентов регрессии необходимо знать и использовать все значения переменных X и Y генеральной совокупности, что практически невозможно.
Таким образом, задачи линейного регрессионного анализа состоят в том, чтобы по имеющимся статистическим данным для переменных X и Y:
а) получить наилучшие оценки неизвестных параметров и ;
б) проверить статистические гипотезы о параметрах модели;
в) проверить, достаточно ли хорошо модель согласуется со статистическими данными (адекватность модели данным наблюдений).
Следовательно, по выборке ограниченного объема мы сможем построить так называемое эмпирическое уравнение регрессии
(4.8)
где ; — оценка условного математического ожидания ; и — оценки неизвестных параметров и называемые эмпирическими коэффициентами регрессии. Следовательно, в конкретном случае
yi = bo + b1xi + ei, (4.9)
где отклонение et — оценка теоретического случайного отклонения .
В силу несовпадения статистической базы для генеральной совокупности и выборки оценки Ь0 и практически всегда отличаются от истинных значений коэффициентов и ,что приводит к несовпадению эмпирической и теоретической линий регрессии. Различные выборки из одной и той же генеральной совокупности обычно приводят к определению отличающихся друг от друга оценок. Возможное соотношение между теоретиче-
ским и эмпирическим уравнениями регрессии схематично изображено на рис. 4.3.
X
Задача состоит в том, чтобы по конкретной выборке i = 1, 2, ... , п, найти оценки и неизвестных параметров и так, чтобы построенная линия регрессии являлась бы наилучшей в определенном смысле среди всех других прямых. Другими словами, построенная прямая должна быть «ближайшей» к точкам наблюдений по их совокупности. Мерами качества найденных оценок могут служить опреде- ленные композиции отклонений Например,коэффициенты и эмпирического уравнения регрессии могут быть оценены исходя из условия минимизации одной из следующих сумм:
Однако первая сумма не может быть мерой качества найденных оценок в силу того, что существует бесчисленное количество прямых ( в частности, для которых (доказательство этого утверждения выносится в качестве упражнения).
Метод определения оценок коэффициентов из условия минимизации второй суммы называется методом наименьших модулей (МНМ).
Самым распространенным и теоретически обоснованным является метод нахождения коэффициентов, при котором минимизируется третья сумма. Он получил название метод наименьших квадратов (МНК). Этот метод оценки является наиболее простым с вычислительной точки зрения. Кроме того, оценки коэффициентов регрессии, найденные МНК при определенных предпосылках, обладают рядом оптимальных свойств.
Среди других методов определения оценок коэффициентов регрессии отметим метод моментов (ММ) и метод максимального правдоподобия (ММП).