Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Lektsii_Po_Mat_stat.doc
Скачиваний:
25
Добавлен:
11.04.2015
Размер:
1.84 Mб
Скачать

Лекция № 20 Корреляционный и регрессионный анализ

Каждый анализ требует свои формы представления данных.

Корреляционный и регрессионный анализ – в структурах данных выделяет одну или несколько зависимых переменных, а остальные воспринимаются, как независимые.

Выделяют, как зависимые так и не зависимые переменные. Решают по основе теоретического анализа. Данные представляют в общем виде, в виде некоторой таблицы.

….. …….

У - зависимая переменная

Х - независимая переменная

Следующий шаг анализа, состоит в том, чтобы вычислить вид неопределенности: это означает, что для каждой переменной должна быть указана своя модель. Одна или несколько переменных должны иметь вероятные модели.

Принято различать силу связи между переменными и форму связи.

Если речь идет об оценке силы связи, то поскольку переменные имеют вероятный характер (являются случайными величинами), то для оценки силы связи используют корреляционный момент или эффект корреляции.

- среднее арифметическое значение коэффициента корреляции не больше 1.

0,9 и выше – сильная линейная корреляционная связь.

0,7 – слабая связь.

0,2-0,5 – очень слабая связь.

Чтобы оценить силу связи между переменными мы используем корреляционные переменные. В совокупности образует корреляционную матрицу . Анализ корреляционной матрицы, расчет коэффициентов составляет основную часть корреляционного анализа, а сама корреляционная матрица представляет формы исходных данных: факторный анализ, анализ классов.

Регрессионный анализ.

Он позволяет определить форму связи между зависимыми и независимыми элементами.

В классическом регрессионном анализе одна переменная рассматривается как зависимая (у), остальные – как независимые ().

Определить форму связи, значит обосновать вид функции , она похожа на запись функций многих переменных. Зависимость устанавливается между случайными объектами. Случайный объект является переменной.

Линейный множественный регрессионный анализ.

Линейный означает, что в качестве функции выбрана линейная функция.

определены и не являются коэффициентами. Регрессионный означает, что зависимая величина у определяется значением , он она не влияет на переменные. Кроме того,y рассматривается как нормально распределенная случайная величина, а в этом случае как независимые случайные переменные. Это означает, что значение точно измерено и установлено.

Правильная запись уравнения будет:

Е – случайная величина.

Y N()

Теоретическое уравнение множественной регрессии.

Практическое использование уравнение наталкивается на сложности.

(2)

j=0,k решение уравнения будет иметь такой вид:

- транспортируемая матрица Х.

В – вектор.

В результате получаем решение для коэффициента Т.

(2) позволяет рассчитать уравнение регрессии по опытным данным.

Допущения при которых используются эти решения . Остатки не коррелируются между собой.

Оценка метрологических свойств модели.

Она состоит из ряда действий:

1)проверка значений коэффициентов модели. Так как коэффициенты модели, например, есть оценка коэффициента, то он представляет собой случайную величину. Поэтому проверим статистическое значение этой величины. Значение проверяют с помощью Т – критерия при основной гипотезе.

число степеней свободы.

Если гипотезу примем, то этот фактор исключается из модели, то значение нужно пересчитать по формуле (2).

Проверка.

2)Способность соответствовать определенным данным. Оценка описывает влияние факторов на входную величину .

Причины приводят к ухудшению качества модели. Наличие такой связи приводит к возрастанию коэффициента .

Наличие выбросов выборки.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]