Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лабораторні роботи_СТАТИСТИКА_Економка і підпри....doc
Скачиваний:
5
Добавлен:
04.11.2018
Размер:
3.73 Mб
Скачать
    1. Кореляційно-регресійний аналіз (кра).

Метод КРА:

а) застосовується у випадках, коли обидві ознаки є варіаційними;

б) дає можливість формально перевіряти істотність та оцінювати щільність зв’язку (кореляційний аналіз), а також знаходити аналітичний вид залежності, її напрям та характер (регресійний аналіз).

У КРА лінія регресії задається аналітично, тобто, шукається у вигляді рівняння , яке називається рівнянням регресії. Побудова рівняння регресії складається з двох основних етапів: 1) вибору виду функції f(x); 2) знаходження параметрів цієї функції.

      1. Вибір виду рівняння регресії. Регресійний аналіз

У статистичній практиці найбільш поширеними видами рівнянь регресії є такі, параметри яких мають певний фізичний зміст, зокрема:

1. Лінійна залежність а+bх. Параметр а має зміст середнього значення ознаки Y при х=0; якщо ознака Х за своїм фізичним змістом не може приймати нульового значення, то а не має фізичного змісту. Параметр має зміст середньої швидкості зміни Y при зміні Х і показує, на скільки одиниць зміниться в середньому значення Y, якщо значення Х зміниться на одиницю.

2. Квадратична залежність р+qx+rx2. Параметр р має той же зміст, що і параметр a для лінійного рівняння регресії. Параметр q має зміст середньої початкової швидкості зміни Y при зміні Х. Параметр 2r має зміст середнього прискорення зміни Y при зміні Х і показує, на скільки одиниць в середньому зміниться середня швидкість зміни Y, якщо значення Х зміниться на одиницю.

Існують і інші види рівнянь регресії, які розглядатись не будуть.

Вибір виду рівняння регресії в кожному конкретному дослідженні залежить, в основному, від двох факторів: 1) виду кореляційного поля, яке в даному випадку являє собою сукупність точок з координатами (хі; уі) (), побудованих в прямокутній системі координат хоу; 2) ретельного вивчення суті явища, що досліджується, з урахуванням результатів попередніх аналогічних досліджень, якщо останні проводились.

Можлива ситуація, коли ні аналіз явища, ні вигляд кореляційного поля не дають можливості однозначно вибрати вид рівняння регресії. В такому випадку необхідно вибрати дві (або більше) найбільш адекватні на погляд дослідника функції f(x), провести для кожної повне дослідження і за їх результатами вибрати одну, кращу. При цьому можна формалізувати вибір, обираючи, наприклад, ту залежність, для якої регресійна дисперсія (3.11) буде меншою за інші або використовувати існуючі критерії адекватності моделі експериментальним даним.

Зауважимо, що остаточний вибір рівняння регресії, іноді суб’єктивний, залишається все-таки за дослідником.

      1. Визначення параметрів рівняння регресії. Регресійний аналіз

Параметри рівняння регресії f(x) зазвичай знаходяться за методом найменших квадратів, який забезпечує такий вибір їх числових значень, щоб сума квадратів відхилень емпіричних значень уі ознаки Y від відповідних теоретичних (або вирівняних) значень f(xі) була найменшою:

.

Зокрема, для лінійного а+bх та квадратичного р+qx+rx2 рівнянь регресії параметри знаходяться із систем лінійних алгебраїчних рівнянь відповідно

(3.9)

та

(3.10)

Величина

, (3.11)

де п – число пар (хі; уі), m – число параметрів рівняння регресії, які знаходяться за даними вибірки, називається регресійною дисперсією і може слугувати критерієм вибору виду рівняння регресії.

При цьому необхідно враховувати таке. Якщо значення варіант хі та уі є достатньо великими числами, то деякі коефіцієнти при невідомих (наприклад, у системі (3.10)) можуть мати число значущих цифр, яке перевищує число робочих розрядів у процесорах технічних засобів обчислень, що унеможливлює проведення обчислень. У таких ситуаціях необхідно перейти до умовних варіант та за формулами

, ,

де число А обирається дослідником довільно, але бажано якомога ближче до середини інтервалу (хтіп; хтах) з урахуванням зручності подальших обчислень (наприклад, обираючи А кратним 10); В – довільне ціле невід’ємне число, яке визначає порядок величин . Аналогічно вибираються значення чисел С та D. Якщо при цьому виникла необхідність вибирати значення В або D більшими від нуля, то числа або можна (але не бажано) округлювати, зменшуючи тим самим їх число значущих цифр.

Після переходу до умовних варіант та із систем виду (3.9) та (3.10) можна знайти умовні параметри , в результаті чого одержимо умовні рівняння регресії

, . (3.12)

Для переходу до фактичних варіант і параметрів та одержання фактичних рівнянь регресії необхідно в умовні рівняння регресії (3.12) замість змінних та підставити їх вирази через відповідно х та :

, . (3.13)

В результаті одержимо шукані рівняння регресії

, . (3.14)

Для хоча б часткової перевірки останніх необхідно побудувати їх графіки на кореляційному полі (рис. 3.6) і візуально переконатись у тому, що точки (хі; уі) кореляційного поля розташовані хоча б приблизно порівну і рівномірно по обидва боки графіка. У противному разі є підстави сумніватись щодо правильності обчислення параметрів (або побудови графіка).