Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ms_prac

.pdf
Скачиваний:
37
Добавлен:
10.12.2018
Размер:
2.33 Mб
Скачать

Автокореляційна функція

Лаг

1

2

3

4

5

6

7

8

 

 

 

 

 

 

 

 

 

Коефіцієнти

0.914

0.811

0.717

0.651

0.576

0.480

0.387

0.315

автокореляції

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Коэффициенты автокорреляции.

1

0,914

 

 

 

 

 

 

 

0,9

 

0,811

 

 

 

 

 

 

0,8

 

 

0,717

0,651

 

 

 

 

0,7

 

 

 

0,576

 

 

 

 

 

 

 

 

 

 

0,6

 

 

 

 

 

 

 

 

 

 

 

 

0,48

 

 

0,5

 

 

 

 

 

 

 

 

 

 

 

 

 

0,387

 

 

 

 

 

 

 

 

0,315

0,4

 

 

 

 

 

 

 

0,3

 

 

 

 

 

 

 

 

0,2

 

 

 

 

 

 

 

 

0,1

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

1

2

3

4

5

6

7

8

 

 

 

 

 

Лаг

 

 

 

 

 

 

Рис. 2.3. Корелограма.

 

 

 

Корелограма автокореляційної функції у разі стаціонарного часового ряду (середнє значення такого часового ряду є постійною величиною) повинна швидко спадати з ростом лагу вже після кількох перших значень. Рис. 2.3 показує, що досліджуваний ряд не є стаціонарним. Часовий ряд валового внутрішнього продукту містить трендову компоненту, тобто часовий ряд має тренд.

Побудова кореляційного поля

При виборі форми кореляційної залежності виходять перш за все із економічної природи явищ, простоти функції та вимоги на обмеження числа параметрів. Форму кореляційного зв’язку можна визначити як графічним так і аналітичним методами. У випадку парної кореляції вхідними даними є n пар точок, які в прямокутній – декартовій системі координат утворюють кореляційне поле, зображене на рис. 2.4. Розміщення точок на кореляційному полі дозволяє судити про характер залежності. Наприклад, на рис. 2.5 і 2.6 це лінійна залежність.

Для вибору тієї чи іншої форми кореляційної залежності, слід порівняти кореляційне поле або уявну емпіричну лінію з графіками відомих функцій. Для більш точного встановлення форми зв’язку вихідні дані обробляють на ЕОМ за допомогою програм кореляційного аналізу. При цьому аналізують кілька функцій і вибирають ту, для якої коефіцієнт парної кореляції r є найбільшим.

Кореляційне поле. Кореляційне поле – це сукупність точок у прямокутній системі координат, абсциса кожної з яких відповідає значенню факторної ознаки (х), а ордината – значенню результативної ознаки (у) певної одиниці спостереження. Кількість точок на графіку відповідає кількості одиниць спостереження. Використовується для аналізу наявності та характеру (напряму) зв’язку між результатами двох вибірок спостережень. Розміщення точок на графіку свідчить про наявність і напрям зв’язку. Загалом, напрямленість кореляційного поля вказує на наявність прямого, оберненого зв’язку між ознаками, або його відсутність, а також на форму лінії регресії.

31

Розміщення точок на кореляційному полі дозволяє судити про характер залежності, наприклад: лінійна, параболічна, гіперболічна, логістична, логарифмічна, експонентна, показникові або відсутність залежності. Якщо точки кореляційного поля з’єднати в послідовності зростання абсцис одержують так звану емпіричну лінію регресії (лінії зображені на рис. 2.5 і 2.6).

 

 

 

 

Кореляційне поле

 

 

 

 

10,00

 

 

 

 

 

 

 

8,00

 

 

 

 

 

 

Y

 

 

 

 

 

 

 

ознака

6,00

 

 

 

 

 

 

 

 

 

 

 

 

 

Результуюча

4,00

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2,00

 

 

 

 

 

 

 

0,00

 

 

 

 

 

 

 

0

10

20

30

40

50

 

 

 

 

Факторна ознака Х

 

 

Рис. 2.4.

Візуальна оцінка характеру зв’язку вказує на його відсутність.

При цьому графік функції називають теоретичною лінією регресії. Для вибору тієї чи іншої форми кореляційної залежності, слід порівняти кореляційне поле або емпіричну лінію регресії з графіками відомих функцій.

Для більш точного встановлення форми зв’язку вихідні дані обробляють на ЕОМ за допомогою програм кореляційного аналізу. При цьому аналізують кілька функцій і вибирають ту, для якої кореляційне відношення або коефіцієнт парної кореляції r є найбільшим (або середня похибка апроксимації найменша).

Для прямої кореляції характерною тенденцією є збільшення одного з параметрів, якщо збільшується інший, а для оберненої, навпаки: збільшення одного супроводжується, як звичайно, зменшенням іншого. Причиною фіктивної кореляції, тобто такої, що спостережена, але не властива природним об’єктам, може бути, неоднорідність сукупності даних, які відображають ці два різні об’єкти. Іноді методика дослідження впливає на створення видимості зв’язку там, де його немає.

Для більш точного встановлення форми зв’язку вихідні дані обробляють на ЕОМ за допомогою програм кореляційного аналізу. При цьому аналізують кілька функцій і вибирають ту, для якої кореляційне відношення або коефіцієнт парної кореляції r є найбільшим (або середня похибка апроксимації найменша).

32

 

 

Кореляційне поле за лінійної залежності

 

 

10,00

 

 

 

 

 

 

8,00

 

 

 

 

 

Y

 

 

 

 

 

 

ознака

6,00

 

 

 

 

 

 

 

 

 

 

 

Результуюча

4,00

 

 

 

 

 

 

 

 

 

 

 

 

2,00

 

 

 

 

 

 

0,00

 

 

 

 

 

 

0

10

20

30

40

50

 

 

 

Факторна ознака Х

 

 

 

 

Рис. 2.5.

Прямий лінійний зв’язок.

 

Попередньо вид математичної функції встановлюється за допомогою якісного аналізу зв’язку між явищами та графічного його зображення у вигляді кореляційного поля.

Побудова кореляційного поля здійснюється переважно за такими кроками. Якщо можна припустити за природою даних, що між ними або їхніми характеристичними показниками є взаємозв'язок, будують графік, який має його відображати. Графік, що встановлює зв'язок між змінними, називається полем кореляції.

Крок 1. Вибирають дві змінні, між якими, як вважають, є взаємозв'язок, зазвичай беруть величини, які змінюються з часом. Врахуйте, що одна із змінних повинна бути незалежною, вона буде виступати в якості причини. Друга при цьому повинна змінюватися синхронно з нею - зменшуватися, збільшуватися або змінюватися випадковим чином.

Крок 2. Вимірюють значення залежної змінної для кожного спостереження незалежно і заносять результати в таблицю, в два рядки або два стовпці. Для виявлення наявності зв'язку потрібно не менше 30 спостережень, але для отримання більш точного результату подбайте про наявність не менше 100 спостережень.

Крок 3. Будують координатну площину, при цьому на осі абсцис – вказують значення незалежної змінної, а на осі ординат відкладають значення залежної змінної. Далі підписують осі і вказують одиниці виміру кожного показника.

Крок 4. Позначають на графіку точки кореляційного поля. На осі абсцис для першого значення незалежної змінної, відмічають точкою на осі ординат відповідне йому значення залежної змінної. Так само будують всі інші точки.

Крок 5. Отримана сукупність точок і називається кореляційним полем. Далі здійснюють аналіз отриманого графіка і роблять висновок про наявність сильного чи слабкого причиннонаслідкового зв'язку, або його відсутності.

Крок 6. Необхідно звертати увагу на випадкові відхилення від графіка. Якщо в цілому простежується лінійна або інша залежність, але всю "картину" псують одна-дві точки, що опинилися в стороні від загальної сукупності, їх можна визнати випадковими помилками і не враховувати при інтерпретації графіка.

Крок 7. Якщо необхідно побудувати і проаналізувати поле кореляції для великої кількості даних, користуються спеціальними програмами.

33

 

 

Від'ємний лінійний зв'язок

 

 

 

10,00

 

 

 

 

 

 

8,00

 

 

 

 

 

Y

 

 

 

 

 

 

ознака

6,00

 

 

 

 

 

 

 

 

 

 

 

Результуюча

4,00

 

 

 

 

 

 

 

 

 

 

 

 

2,00

 

 

 

 

 

 

0,00

 

 

 

 

 

 

0

10

20

30

40

50

 

 

 

Факторна ознака X

 

 

 

 

Рис. 2.6.

Обернений лінійний зв’язок.

 

Використання табличного процесора Microsoft Excel

Кореляцією називають взаємну залежність двох випадкових величин (частіше - двох груп величин), при якій зміна однієї з них призводить і до зміни іншої. Коефіцієнт кореляції показує, наскільки ймовірно зміна другої величини при зміні значень першої, тобто ступінь її залежності. Найпростіший спосіб обчислення цієї величини - скористатися відповідною функцією, вбудованою в табличний редактор Microsoft Office Excel.

Після запуску Excel відкрийте документ, що містить групи даних, коефіцієнт кореляції між якими потрібно обчислити. Якщо такого документа ще не створено, то введіть дані в порожню таблицю - табличний редактор створює її автоматично при запуску програми. Кожну з груп значень, кореляція між якими вас цікавить, вводите в окрему колонку. Це не обов'язково повинні бути сусідні колонки, ви вільні оформити таблицю найбільш зручним чином - додати додаткові стовпці з поясненнями до даних, заголовки колонок, підсумкові комірки з сумарними або середніми значеннями і т.д. Можна навіть розташовувати дані не у вертикальному (в колонках), а в горизонтальному (в рядках) напрямку. Єдина вимога, яку треба дотримуватися - комірки з даними кожної групи повинні розташовуватися послідовно одна за іншою, щоб таким чином створювався безперервний масив.

Перейдіть в клітинку, яка повинна буде містити значення кореляції даних двох масивів, і натисніть в меню Excel закладку «Формули». У групі команд «Бібліотека функцій» клацніть по найостаннішої піктограмі - «Інші функції». Розкриється список, що випадає, в якому вам слід перейти в розділ «Статистичні» і вибрати функцію «коррел». В результаті відкриється вікно майстра функцій з формою, призначеної для заповнення. Це ж вікно можна викликати і без вкладки «Формули», просто клацнувши по піктограмі вставки функції, розміщеної лівіше рядки формул.

Вкажіть першу групу корелюють даних в полі «массив1» майстра формул. Щоб ввести діапазон комірок вручну наберіть адресу першої та останньої клітин, розділивши їх двокрапкою

34

(без пробілів). Інший варіант - просто виділіть потрібний діапазон мишкою, а потрібний запис в це поле форми Excel помістить самостійно. Таку ж операцію треба виконати і з другою групою даних в полі «массив2». Реалізація цих операцій відображена скриншотами на рис. 2.7.

Рис. 2.7. Скриншоти реалізації операцій.

35

Натисніть кнопку OK. Табличний редактор розрахує і відобразить значення кореляції в осередку з формулою. При необхідності ви можете зберегти цей документ для подальшого використання (клавіші Ctrl + S).

Кореляційне поле – це сукупність точок у прямокутній системі координат, абсциса кожної з яких відповідає значенню факторної ознаки (х), а ордината – значенню результативної ознаки (у) певної одиниці спостереження. Кількість точок на графіку відповідає кількості одиниць спостереження. Використовується для аналізу наявності та характеру (напряму) зв’язку між результатами двох вибірок спостережень. Розміщення точок на графіку свідчить про наявність і напрям зв’язку. Загалом, напрямленість кореляційного поля вказує на наявність прямого, оберненого зв’язку між ознаками, або його відсутність, а також на форму лінії регресії.

Щоб побудувати кореляційне поле в Excel потрібно виділити наші дані в таблиці, запустити майстер діаграм і вибрати тим діаграм «Точковий» (в Excel 2007 вибираємо на панелі інструментів «Вставка», кнопку «Точкова» і вибираємо підтип «Точкова з маркерами», після цього діаграма буде створена і поміщена на поточну книгу після чого її можна буде дооформлювати). Задаємо для діаграми ім’я – «Кореляційне поле» (в Excel 2007 дані дії виконуються у вкладці «Макет» після виділення діаграми - команду «Назва діаграми» ) На останньому кроці майстра указуємо місце знаходження – поточна книга.

В Excel крім графіка часового ряду можна визначити лінію тренду та її параметри в класі простих елементарних функцій: лінії, поліному логарифму, степеневої. Для цього необхідно виділити діаграму і виконати команду меню «Діаграма/ Додати лінію тренду» ( в Excel 2007 у вкладці «Макет » виберіть команду «Аналіз» а після неї «Лінія тренду» і «Лінійне наближення») або виконати дану команду з контекстного меню «Додати лінію тренду…» клацнувши на будьякій точці графіка правою кнопкою миші. Лінія тренду – графічне представлення напрямку зміни ряду даних, тобто їх тенденції.

Вибираємо тип тренду «Лінійний», який використовується для апроксимації даних за методом найменших квадратів відповідно до рівняння: Y = a * X + b, де a – кут нахилу (в радіанах) і b - координата перетину осі абсцис (осі Y).

Рис. 2.8. Кореляційне поле даних стовпців А і В.

У вкладці «Параметри» встановлюємо прапорці «Показати рівняння на діаграмі» і «Помістити на діаграму величину достовірності апроксимації R2». Клацаємо по кнопці ОК. Далі можна форматувати ці рівняння, виділивши їх і в контекстному меню вибравши «Формат підпису лінії тренду». R2 - це число від 0 до 1, яке відображає близькість лінії тренду до фактичних даних. Лінія тренду найбільше відповідає дійсності, коли значення близько до 1.

36

РЕГРЕСІЙНИЙ АНАЛІЗ

Регресійний аналіз – це статистичний метод дослідження впливу однієї або декількох незалежних змінних на залежну змінну. Незалежні змінні інакше називають регресорами або предикторами, а залежні змінні - критеріальними. Отриману залежність у формі аналітичного виразу називають регресійною моделлю. Отже, регресійна модель – це математичний вираз реальної закономірності, яку використовують для аналізу, планування та управління різними керованими процесами. До регресійної моделі ставлять низку вимог щодо найбільшої відповідності характеру досліджуваного процесу, можливостей відповідної інтеграції усіх його параметрів та мінімального наближення розрахованих результатів до отриманих даних. Звідси випливають високі вимоги до точності, надійності, адекватності кожного параметра і моделі в цілому. Іншими словами, рівняння регресії має подавати з певною точністю і надійністю зміну деякої функціональної ознаки відповідно до зміни одного або декількох чинників.

Парна лінійна регресія.

Звʼязок між різними явищами в будь якій галузі людської діяльності є складний і різноманітний. На рівень розвитку одного чинника можуть впливати багато інших та ще й з різним ступенем впливу. Проте, дослідників найчастіше цікавить вплив зміни одного чинника на рівень зміни іншого. Тому найбільш поширеною і простою в практиці моделювання таких залежностей є парна лінійна регресія, модель якої пояснюють на такому прикладі.

Припустимо, що маємо результати незалежних дослідів у вигляді значень таких n пар

x1, y1 , x2 , y2 , … , xn , yn . Ці значення можна відобразити у вигляді

множини точок в

Декартовій системі координат. Приймемо гіпотезу про те, що між змінними x

і y теоретично

існує деяка лінійна залежність. Суть даної задачі полягає в тому, щоб у Декартовій системі координат знайти рівняння прямої, яка «найкращим чином» проходить через отриману множину точок.

При розвʼязуванні цього типу задач найпоширенішим методом є метод найменших квадратів. Основною вимогою цього методу є отримати найкраще зближення кривої y f x з

експериментальними точками, тобто забезпечити мінімальне значення суми квадратів відхилень між значеннями експериментальних точок за шкалою осі Oy і відповідних їм точок, що лежать на

кривій, для одного і того ж значення незалежної змінної x .

Лінійне рівняння, що звʼязує дві змінні і враховує можливі відхилення має такий вигляд: y x ,

де y – залежна змінна; x – незалежна змінна; і – невідомі параметри регресії; – випадкова змінна, яка характеризує відхилення від вибраної теоретичної кривої.

Отже, залежна змінна y подається у вигляді суми систематичної складової і випадкової . Рівняння y x характеризує середнє значення y для відповідних значень x , а рівняння y x – індивідуальне значення y , яке враховує можливі відхилення від середніх значень. Обчислити справжні значення і неможливо, тому що ми маємо лише обмежене число спостережень. В результаті проведених обчислень ми отримуємо лише статистичні оцінки справжніх параметрів і . Позначимо ці оцінки параметрів відповідно через a і b .

Тоді, рівняння парної регресії yˆ ax b буде оцінкою моделі y x . Розглянемо різницю yi і yˆi , яка рівна:

i yi yˆi yi ax b ,

37

де yi – фактичні, а yˆi розрахункові значення залежності змінної; i – відхилення експериментальної точки в напрямку осі Oy від відповідної (тобто для того самого значення x ) на даній кривій. Тоді сума квадратів таких відхилень матиме вигляд:

n

 

n

 

n

 

 

 

 

2

ˆ

2

yi axi b

2

.

Q a,b i

yi yi

 

 

i 1

 

i 1

 

i 1

 

 

 

Метод найменших квадратів забезпечує обчислення оцінок параметрів кривої регресії a і

 

 

 

 

 

 

n

 

b в той спосіб, що функція Q a,b буде мінімальною, тобто Q a, b

i2 min .

 

 

 

 

 

i 1

Необхідною умовою існування мінімуму функції Q a,b є рівність частинних похідних

цієї функції по a і b нулю.

 

 

 

 

 

 

 

Q

 

n

 

 

 

 

 

 

2 yi axi b xi 0,

 

 

 

a

 

i 1

 

 

 

 

 

 

 

n

 

 

 

 

 

Q

 

 

 

 

 

 

2 yi axi b 0.

 

 

 

a

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

Розкриваючи дужки і підсумовуючи, отримуємо стандартну форму нормальних рівнянь:

n

n

n

xi yi a xi2

b xi 0,

i 1

i 1

i 1

n

n

 

yi a xi nb 0.

i 1

i 1

 

Розділимо обидва рівняння на n і приведемо його до такого вигляду,

 

1

n

 

 

1 n

 

 

1

n

 

 

xi yi a

 

xi2 b

 

xi 0,

 

 

 

n i 1

 

 

n i 1

 

 

n i 1

 

 

n

 

 

n

 

 

 

 

1

1

 

1

 

 

 

 

 

yi a

 

 

xi n

 

b

0,

 

 

 

 

n i 1

n i 1

n

 

 

 

враховуючи той факт, що сума величин поділена на їх кількість дорівнює їх середньому значенню отримаємо таку систему рівнянь:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ax

bx

0,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

i

 

 

 

i

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

ax b 0.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Далі,

помножимо друге рівняння цієї системи на

 

xi

і від першого віднімемо друге і згрупуємо

члени рівняння

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ax

bx

0,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x y

 

 

 

xi yi axi2 yi

 

 

 

 

 

 

 

 

 

 

 

xi yi yi xi axi2 axi a xi2 xi .

 

i

 

i

 

i

 

 

i

 

xi

axi 0

 

 

 

 

 

 

 

 

 

 

 

 

y x

ax

 

 

bx

0.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i i

 

i

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Остаточно отримаємо вираз для обчислення значення параметра a

a xi yi yi xi . xi2 xi

38

Значення параметра b легко знайти з рівняння y a x b як

b y a x .

Таким чином для знаходження параметрів лінійної залежності досить заповнити таблицю та обчислити середні значення для стовпчиків. Отримані середні треба підставити у останні дві рівності. Таблиця має такий вигляд.

№ пари

Значення xi

Значення yi

Добуток xi yi

Квадрат xi2

 

 

 

 

 

 

 

 

 

 

 

 

 

1

x1

y1

x1 y1

 

xi2

2

x2

y2

x2 y2

 

xi2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

xn

yn

xn yn

 

xi2

 

 

 

 

 

 

 

 

 

 

 

 

 

Середні

 

 

 

 

 

 

 

 

 

 

x2

 

x

 

y

 

x y

 

Заповнення таблиці в ручну (наприклад за допомогою калькулятора) є досить марудним заняттям, проте використання табличного процесора, наприклад, Microsoft Excel, для будь-якого варіанту операційної системи Windows є простим і часом, навіть, приємним заняттям. Крім того, в даному табличному процесорі передбачена процедура безпосереднього знаходження параметрів за

графіком, побудованому за парами точок x1, y1 , x2 , y2 , … , xn , yn , як його координатами.

Нелінійні регресії

Хоча лінійну модель регресії часто вважають найбільш поширеною, лінійних процесів є не так вже й багато. Переважно, за значних відхилень точок, коли «хмарка» зображень точок на графіку має вигляд сильно витягнутого еліпса приймають гіпотезу про лінійність регресії. Однак не всі процеси можна нею моделювати. Тому на практиці використовують складніші моделі, які

відображають нелінійну залежність між змінними X ,Y . Нелінійні моделі бувають двох видів:

-нелінійні за змінними, але лінійні за невідомими параметрами, які підлягають оцінці;

-нелінійні за змінними і параметрами.

Лінії регресії, нелінійні за змінними, але лінійні за параметрами називаються

квазілінійними регресіями. Наприклад, модель

y a

1

b

є нелінійна за змінною, а модель

x

 

 

 

 

y abx нелінійна за параметром.

 

 

 

 

Регресії нелінійні за змінними. Якщо в моделі параметри входять у першому степені. А незалежна змінна має степінь відмінний від одиниці, то заміною змінної першого степеня рівняння зводиться до лінійного. Далі, використовуючи метод найменших квадратів (МНК) визначають параметри лінійного рівняння.

Розглянемо оцінку параметрів гіперболи

y a

1

b . Для цього зробимо заміну

1

z

і

x

x

 

 

 

 

 

дістанемо рівняння прямої y a z b , параметри якого оцінюються МНК. Після того, як знайшли оцінки параметрів рівняння y a z b за нової змінної, замінюємо її на початкову.

Якщо лінія регресії нелінійна за параметром, у деяких випадках можна перетворити рівняння кривої таким чином, щоб воно стало лінійним відносно параметрів. Після цього оцінки параметрів знаходять за допомогою МНК.

39

Регресії нелінійні за параметрами. Наприклад, регресійну залежність описують рівнянням показникової функції y abx . У цьому випадку, застосовуючи логарифмування можна перейти від показникової залежності до лінійної:

ln y ln a x lnb .

Виконавши заміну y1 ln y , a1 lna , b1 lnb , дістанемо рівняння прямої y1 a1 b1 x . Оцінки параметрів знаходимо за формулами МНК для лінійної регресії. Після визначення оцінок параметрів a1 і b1 знаходимо оцінки параметрів a і b . У даному випадку за формулами

a exp a1 , b exp b1 .

Таким чином, для знаходження нелінійних регресій, необхідно, шляхом відповідної заміни змінних привести їх до лінійної форми, застосувати МНК і здійснити обернене перетворення параметрів.

Найбільш поширені аналітичні форми для кривих нелінійної регресії приведені в табл. 2. В табл. 2 також для кожної форми подані приклади заміни змінних.

Таблиця 3.

Вид рівняння регресії

Заміна змінних для

 

з/п

лінеаризації

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1.

y k x b

 

 

 

 

 

-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2.

y ax2 bx c

 

 

 

 

 

-

 

 

 

 

 

 

 

 

 

3.

y

k

 

b

u

1

,

v y

 

x

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4.

y ke xb

u e x ,

v y

 

5.

y k ln x b

u ln x,

v y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

1

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6.

y k

 

b

u

,

 

v

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

y

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7.

y

 

 

 

 

 

1

 

 

u e x ,

v

 

1

 

 

 

 

 

 

 

 

 

 

 

 

k e x b

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8.

y ax b

u ln x,

v ln y

 

9.

y ekx b

u x,

 

v ln y

 

10.

y ek x b

u

1

,

 

 

v ln y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

11.

y 10ax b

u x,

 

v lg y

 

12.

y

 

 

 

 

 

x

u x,

v

 

x

 

kx b

 

y

 

 

 

 

 

 

 

 

 

 

 

13.

y xkxb

u xln x,

v ln y

 

14.

y k x2 b

u x2 ,

v y

 

15.

y x3 b

u x3,

v y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

16.

y k

 

x b

u

 

 

x,

v y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

40

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]