Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Obshaya_statistika_otvety.docx
Скачиваний:
202
Добавлен:
06.03.2016
Размер:
392.67 Кб
Скачать

58. Построение модели парной регрессии

Если функция регрессии линейна, то говорят о линейной регрессии. Модель линейной регрессии (линейное уравнение) является наиболее распространенным (и простым) видом зависимости между экономическими переменными. Кроме того, построенное линейное уравнение может служить начальной точкой эконометрического анализа. Линейная регрессия (теоретическое линейное уравнение регрессии) представляет собой линейную функцию между условным математическим ожиданием M(Y|X = xi) зависимой переменной Y и одной объясняющей переменной X (xi- значения независимой переменной вi-омнаблюдении, i = 1,2,...,n).

M(Y|X = xi) = β0+ β1xi

Для отражения того факта, что каждое индивидуальное значение отклоняется от соответствующего условного математического ожидания, необходимо ввести в последнее соотношение случайное слагаемое ei.

yi= M(Y|X = xi) + ei= β0+ β1xi+ ei

Это соотношение называется теоретической линейной регрессионной моделью, β0и β1- теоретическими параметрами (теоретическими коэффициентами) регрессии, ei- случайным отклонением.

59. Построение модели множественной регрессии

Обобщением линейной регрессионной модели с двумя переменными является многомерная регрессионная модель (или модель множественной регрессии). Пусть n раз измерены значения факторовx1 , x2 , ..., xk и соответствующие значения переменнойy;предполагается, что

yi = b o + b 1xi1 + ... + xik+ e i , i = 1, ..., n,                                                     (12)

(второй индекс у хотносится к номеру фактора, а первый - к номеру наблюдения); предполагается также, что

Me 0, M= s 2,

                    M(e e j) = 0, i неравно j,                                                       (12a)

т.е. e- некоррелированные случайные величины. Соотношения (12) удобно записывать в матричной форме:

Y = Xb +e(13)

где Y= (y1, ..., yk)T- вектор-столбец значений зависимой переменной,Т- символ транспонирования,  b(b0b 1, ..., b k)T - вектор-столбец (размерностиk) неизвестных коэффициентов регрессии,  e = (e1, ...,en)T- вектор случайных отклонений,

-матрица n x (k + 1); вi- й строке (1,xi1, ...,xik) находятся значения независимых переменных вi-м наблюдении первая переменная - константа, равная 1.

60. Способы оценки полученных моделей регрессии

Регрессионный анализ раздел математической статистики, объединяющий практические методы исследования регрессионной зависимости между величинами по статистическим данным. Цель Р. а. состоит в определении общего вида уравнения регрессии, построении оценок неизвестных параметров, входящих в уравнение регрессии, и проверке статистических гипотез о регрессии. При изучении связи между двумя величинами по результатам наблюдений (x1,y1), ..., (xn, yn) в соответствии с теорией регрессии предполагается, что одна из нихимеет некоторое распределение вероятностей при фиксированном значениихдругой, так что

         Е(Y | х) = g(x, β) и D(Y | х) = σ2h2(x),

        где β обозначает совокупность неизвестных параметров, определяющих функцию g(х), ah(x) есть известная функциях(в частности, тождественно равная 1). Выбор модели регрессии определяется предположениями о форме зависимостиg(х, β) отхи β. Наиболее естественной с точки зрения единого метода оценки неизвестных параметров β является модель регрессии, линейная относительно β:

         g(x, β) = β0g0(x) + ... + βkgk(x).

         Относительно значений переменной х возможны различные предположения в зависимости от характера наблюдений и целей анализа. Для установления связи между величинами в эксперименте используется модель, основанная на упрощённых, но правдоподобных допущениях: величинахявляется контролируемой величиной, значения которой заранее задаются при планировании эксперимента, а наблюдаемые значенияупредставимы в виде

         yi = g(xi, β) + εii = 1, ..., k,

        где величины εхарактеризуют ошибки, независимые при различных измерениях и одинаково распределённые с нулевым средним и постоянной дисперсией σ2Случай неконтролируемой переменнойх отличается тем, что результаты наблюдений (xi, yi), ..., (xn, yn) представляют собой выборку из некоторой двумерной совокупности. И в том, и в другом случае Р. а. производится одним и тем же способом, однако интерпретация результатов существенно различается (если обе исследуемые величины случайны, то связь между ними изучается методами корреляционного анализа).

         Предварительное представление о форме графика зависимости g(x) отхможно получить по расположению на диаграмме рассеяния (называемой также корреляционным полем, если обе переменные случайные) точек (xi, y̅(xi)), где(xi)— средние арифметические тех значенийу, которые соответствуют фиксированному значениюxi.Например, если расположение этих точек близко к прямолинейному, то допустимо использовать в качестве приближения линейную регрессию. Стандартный метод оценки линии регрессии основан на использовании полиномиальной модели (m≥ 1)

         y(x, β) = β0+ β1x+ ... + βmxm

        (этот выбор отчасти объясняется тем, что всякую непрерывную на некотором отрезке функцию можно приблизить полиномом с любой наперёд заданной степенью точности). Оценка неизвестных коэффициентов регрессии β0, ..., βmи неизвестной дисперсии σ2осуществляетсяНаименьших квадратов методом. Оценки0, ..., βm, полученные этим методом, называются выборочными коэффициентами регрессии, а уравнение

         

        определяет т. н. эмпирическую линию регрессии. Этот метод в предположении нормальной распределённости результатов наблюдений приводит к оценкам для β0, ..., βmи σ2, совпадающим с оценками наибольшего правдоподобия .Оценки, полученные этим методом, оказываются в некотором смысле наилучшими и в случае отклонения от нормальности. Так, если проверяется гипотеза о линейной регрессии, то

         

        где xiи yi, и оценкаg(х), а её дисперсия будет меньше, чемдисперсия любой другой линейной оценки. При допущении, что величины yiнормально распределены, наиболее эффективно осуществляется проверка точности построенной эмпирической регрессионной зависимости и проверка гипотез о параметрах регрессионной модели. В этом случае построение доверительных интервалов для истинных коэффициентов регрессии β0, ..., βmи проверка гипотезы об отсутствии регрессионной связи βi= 0, i = 1, ..., m) производится с помощью Стьюдента распределения.

        В более общей ситуации результаты наблюденийy1,...,ynрассматриваются как независимые случайные величины с одинаковыми дисперсиями и математическими ожиданиями

         Eyi, = β1 x1+ ... + βkxki, i = 1, ..., n,

        где значенияxji,j= 1, ...,kпредполагаются известными. Эта форма линейной модели регрессии является общей в том смысле, что к ней сводятся модели более высоких порядков по переменнымx1,...,xk. Кроме того, некоторые нелинейные относительно параметров βi; модели подходящим преобразованием также сводятся к указанной линейной форме.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]