14. Оцінка якості парної лінійної регресії
Зв'язок між х та у описується залежністю
У=α0+ α1х+Е (2.1)
Е-випадкова величина, яка характеризує вплив усіх інших неврахованих факторів, при цьому кількісні характеристики цього зв’язку(r, R2,ao,a1) будуть визначені за випадковою вибіркою з 10 елементів.
Очевидно, якщо робити інші вибірки, то значення цих характеристик будуть відрізнятися від знайдених.
Як точно ці характеристики, знайдені на основі випадкової вибірки наближаються до характеристик лінійної моделі які нам невідомі і які ми хочемо оцінити? Для відповіді на це питання, зауважимо, що у залежить від х та Е, тому потрібно зробити деякі припущення, відносно незалежної змінної х та випадкової Е.
Основні припущення:
Наведені припущення складають основі класичного кореляційно-регресійного аналізу.
Зв'язок між змінними х та у описується залежністю (2.1)
Для будь-якого значення хі очікуване значення Еі =0, Е(Еі)=0.
Дисперсія Еі постійна для всіх значень хі: D(Ei)=Ϭe2
значення Еі незалежні (не корелюють) між собою. Cov(Ei, Ej)=0.
Випадкова величина Е розподілена нормально з математичним сподіванням Е=0 та дисперсією Ϭe2 .
величина Еі та хі незалежні: Cov(Ei, хі)=0.
Припущення 6 виконується автоматично, коли змінна х є детермінованою 9невипадковою) величиною.
Відомо, що якщо ці припущення виконуються, то оцінки ао і аі параметрів α0, αі знайдені за методом найменших квадратів будуть незміщені, обґрунтовані, ефективні.
Незміщена оцінка – якщо її математичне сподівання = значенню параметра, який оцінюється.
Обґрунтована оцінка – якщо при збільшенні числа спостережень, її значення наближується до параметра який оцінюється.
Ефективна оцінка – якщо вона має найменшу дисперсію, порівнюючи з будь-якими іншими оцінками даного параметру.
Припущення 2 стверджує, що вплив всіх факторів, які не враховані в лінійній моделі, і тому їх віднесено до Е носить випадковий, а не системний характер, тобто додатні значення Еі компенсуються відємними Еі і тому їз усереднений вплив на у=0.
Припущення 3 означає незалежність дисперсії від номера спостереження, це називається – гомоскедастичність.
Виподок, коли умова гомоскедастичності не виконується – назив.- гетероскедастичністю.
Припущення 4 вказує на некорельованість залишків Еі для різних спостережень. Ця умова часто порушується, коли данні спостережень є часовими рядами. Це явище назив – автокореляцією залишків.