Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Uchebnoe_posobie_Tam_stat1.docx
Скачиваний:
8
Добавлен:
08.09.2019
Размер:
559.16 Кб
Скачать

4.4. Показатели тесноты парной линейной зависимости и их интерпретация

Наличие связи между двумя признаками называется парной корреляцией. Пусть y – анализируемый показатель; x – фактор, под влиянием которого изменяется y. Первым шагом в проведении исследования является построение специального графика, называемого корреляционным полем или диаграммой рассеяния, где на оси абсцисс откладывается значение x, по оси ординат – y, а точки соответствуют сочетаниям первичных наблюдений x и y. По расположению точек, по их концентрации в определенном направлении можно судить о наличии связи.

Показателями тесноты парной линейной зависимости являются линейный коэффициент корреляции и коэффициент детерминации.

Коэффициент корреляции:

(4.4)

Тесноту связи между признаками оценивают по следующему правилу:

  • связь весьма тесная, если

  • связь тесная, если ;

  • связь умеренная, если ;

  • связь слабая, если .

Существует несколько альтернативных определений коэффициента детерминации, однако в случае линейной регрессии он равен квадрату коэффициента корреляции.

Коэффициент детерминации выражается в процентах и показывает, какая доля дисперсии результативного признака объясняется влиянием независимых переменных. В случае линейной регрессии коэффициент детерминации показывает долю вариации результата y, обуславливаемую вариацией фактора x.

4.5. Оценка значимости уравнения регрессии

Прежде чем использовать полученное уравнение регрессии в дальнейшем анализе оценивают существенность изучаемой связи и качество построенного уравнения регрессии. Оценка существенности связи проводится по F-критерию Фишера.

F-критерий Фишера заключается в проверке гипотезы Но о статистической незначимости уравнения регрессии. Для этого выполняется сравнение фактического Fфакт и критического (табличного) Fтабл значений F-критерия Фишера.

Fфакт определяется из соотношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы

, (4.5)

где n – число единиц совокупности; m – число степеней свободы. Для линейной регрессии m=1. Fтабл – максимально возможное значение критерия под влиянием случайных факторов при степенях свободы k1 = m, k2 = n – m – 1 (для линейной регрессии m = 1) и уровне значимости α.

Уровень значимости α вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно величина α принимается равной 0,05 или 0,01.

Если Fтабл < Fфакт, то Н0-гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если Fтабл > Fфакт, то гипотеза Н0 не отклоняется и признается статистическая незначимость, ненадежность уравнения регрессии.

Средняя ошибка аппроксимации – среднее относительное отклонение расчетных значений от фактических.

(4.6)

Построенное уравнение регрессии считается удовлетворительным, если значение не превышает 10-12%.

Причиной недостатка хорошего качества уравнения является несоответствие формы связи линейной.

4.6. Точечный и интервальный прогноз по уравнению линейной регрессии

Точечный прогноз заключается в получении прогнозного значения уp, которое определяется путем подстановки в уравнение регрессии соответствующего (прогнозного) значения xp

уp = a + b·xp.

Интервальный прогноз заключается в построении доверительного интервала прогноза, т. е. нижней и верхней границ уpmin , уpmax интервала, содержащего точную величину для прогнозного значения ŷp ( ). Доверительный интервал всегда определяется с заданной вероятностью (степенью уверенности), соответствующей принятому значению уровня значимости α. Предварительно вычисляется стандартная ошибка прогноза :

,

где ,

и затем строится доверительный интервал прогноза, т. е. определяются нижняя и верхняя границы интервала прогноза:

;

где

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]