Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
методичкаЭММ.DOC
Скачиваний:
66
Добавлен:
29.03.2015
Размер:
2.03 Mб
Скачать

Методы исследования зависимостей двух величин.

Пусть даны результаты наблюдений над двумя величинами и:, когда- неслучайная величина, а- случайная. Еслимало, то результаты таких наблюдений можно представить в виде таблицы:

...

...

Ставится задача нахождения формулы (выражения), устанавливающей зависимость между величинами и, вида

Это выражение носит название уравнения регрессии. Здесь является функцией от величиныи зависит также от неизвестных коэффициентов

Эта формула нужна для установления характера зависимости величин и, а также для решения задач интерполяции и экстраполяции значений функции.

Интерполяция заключается в нахождении значений функции при любых значенияхна интервале. Экстраполяция сводится к определению значенийвне области наблюдений над, с помощью чего можно прогнозировать поведение величины. Однако к решению задач экстраполяции нужно относиться с большой осторожностью, так как могут измениться начальные условия и функцияповедет себя иначе.

Задача нахождения функции по результатам наблюдений разбивается на две: 1) определить класс функций ,…. К которому принадлежит; 2)найти неизвестные значения коэффициентов

Для решения первой задачи обычно используются два метода: графический и «соображения специалиста». Первый метод заключается в следующем. На плоскости строятся точкии подбирается одна из функций, график которой неплохо сглаживал бы нанесенные на плоскость значения. Нередко берется одна из следующих функций:

Когда класс функции определен, то для решения второй задачи используют МНК (метод наименьших квадратов). Опишем его суть. Пусть – расчетное значение функции в некоторой точке;– наблюдаемое значение функции в той же точке. Разностьпредставляет некоторую случайную величину - случайную ошибку. Наличие этой случайной погрешности является следствием многих причин, влиянием которых на переменнуюмы пренебрегаем. Значения неизвестных параметров желательно подобрать так, чтобы уменьшить погрешностьво всех точках. Эту задачу будем решать методом наименьших квадратов, который состоит в том, чтобы из всех возможных значений параметров выбрать те, которые доставляют минимум функции.

Минимум достигается когда все частные производные функции по всем параметрам равны нулю, таким образом, для оценки неизвестных параметров осталось только решить систему уравнений вида

.

Аналогичным способом можно поступать когда возникает необходимость рассматривать функцию не от одной, а от нескольких переменных.

Пусть даны результаты наблюдений над двумя случайными величинами и:,необходимо установить вид зависимости между ними.

Многие реальные задачи сводятся к установлению вида зависимости между двумя случайными величинами. Например: 1. Пусть - количество билетов приобретенных на новый кинофильм за прошедшую неделю, а- число коробок попкорна проданного вашей компанией за эту же неделю. 2. Пусть- процент алкоголиков и наркоманов, а- процент людей имеющих судимость в некотором городе;- величина, характеризующая уровень преступности в данном городе.

Сформулированные задачи установления зависимости между случайными величинами также будут решаться МНК. Но поскольку обе величины случайны, то можно рассмотреть как уравнение регрессии по:, так и уравнение регрессиипо:. В простейшем случае эти уравнения имеют вид:

- уравнение прямой регрессии по;

- уравнение прямой регрессии по.

Уравнения регрессии могут быть более сложного типа. Для нахождения неизвестных коэффициентов воспользуемся МНК и получим

,

где

Уравнение прямой регрессии по:.

Уравнение прямой регрессии по:,

где - коэффициент прямой регрессии по вычисляется по формуле:

.

Коэффициент линейной корреляции характеризует линейную зависимость между случайными величинами.

Коэффициент обладает следующими свойствами:

1) ;

2) если инезависимы, то; обратное утверждение неверно;

3) если , тоизависимы;

4) если случайные величины исвязаны линейной функциональной зависимостью, то.

Выборочный коэффициент линейной корреляции находится следующим образом:

. .

Пример. Случайная величина - число лет, которые служащие проработали в торговой компании;- сколько отпусков за это время они брали в этой компании. Результаты наблюдений над случайными величинамии: приведены в следующей таблице:

X

2

3

4

5

Y

3

4

6

8

Построить уравнения прямых регрессий поипо. Найти выборочный коэффициент линейной корреляции .

Решение. Из условия находим:

;

;

Воспользовавшись предложенными формулами, вычислим коэффициенты прямых регрессий поипо.

И по формулам построим уравнения прямых регрессий и выборочный коэффициент линейной корреляции.

;

.