Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебник Математики и информатики.doc
Скачиваний:
85
Добавлен:
03.05.2019
Размер:
24.89 Mб
Скачать
          1. Регрессионный анализ. Простая и линейная регрессия

Предыдущий вопрос посвящен описанию математи­ческого аппарата, привлекаемого для реализации 3-го этапа статистического исследования зависимостей, на котором исследователь пытается проанализировать структуру связей между рассматриваемыми переменными и измерить степень их тесноты. После того как он убедится в наличии статистически значимых связей между анализируемыми переменными, он приступает к выявлению и математическому описанию конкретного вида интересующих его зависимостей: подбирает класс функций, в рамках которого будет вести свой дальнейший анализ (этап 4); производит, ес­ли это необходимо, отбор наиболее информативных предска­зывающих переменных (этап 5); вычисляет оценки для неизвест­ных значений параметров, участвующих в записи уравнения искомой зависимости (этап 6); анализирует точность получен­ного уравнения связи (этап 7). Этапы 4—7 и составляют содер­жание регрессионного анализа.

Но прежде чем переходить к изложению методов, составля­ющих аппарат регрессионного анализа, необходимо ввести и прокомментировать ряд основных понятий и определений.

Условным средним ух называется среднее арифметическое на­блюдавшихся значений случайной величины Y, соответствующих X = х. Очевидно, что ух = f(x), это уравнение называют выбо­рочным уравнением регрессии Y по х.

Условным средним ху называется среднее арифметическое на­блюдавшихся значений случайной величины X, соответствующих Y = у. Очевидно, что ху =(у), это уравнение называют выбо­рочным уравнением регрессии X по у, а ее график – выборочной линией регрессии X по у. Условные средниеух и ху, которые находят по выборке, принимают в качестве оценок условных математических ожиданий ту(х) и тк(у).

Если обе линии регрессии Y по х и X по у - прямые, то корреляционную зависимость называют линейной (линейная корреля­ция). Это бывает в том случае, если количественные признаки случайных величин X и Y, распределены по совместному нормальному закону.

То есть: ух =кх + b

ху =cy + d

где: к = yx – коэффициент регрессии Y по Х,

c = xy – коэффициент регрессии Х по Y.

yx = rxyy/x; xy = rxyx/y; yx·yx = rxy².

Эмпирические уравнения регрессии имеют вид:

ух =у + rxyy/x (х – х)

хy =x + rxyx/y (y – y)

Нахождение выборочных уравнений регрессии – одна из главных задач теории корреляции (регрессивного анализа), когда двумерный признак распределён по нормальному закону.

Для нормально распределенного случайного вектора (Х,Y) теоретические уравнения регрессии линейные:

y- тy = rxy y/x (х-mх), (1)

x- тy = rxy x/ y (y-my), (2)

г де тx = M (X); тy = M (Y); x = D(X); y = D(Y)

rxy - коэффициент корреляции,

Cov (X;Y)

r xy= (3)

x y

где Cov (X;Y) = M (Xº Yº) = Kв; Xº= X-mx; Yº= Y-my.