- •1. Основні теоретичні положення регресійного аналізу
- •1.1. Кореляційна залежність
- •1.2. Основні математичні поняття,
- •1.3. Передумови використання
- •2. Парний регресійний аналіз
- •2.1. Лінійна парна регресія
- •2.2. Властивості оцінок
- •2.3. Лінійний коефіцієнт кореляції
- •2.4. Коефіцієнт детермінації
- •2.5. Оцінка значущості рівняння регресії
- •2.6. Прогноз залежної змінної.
- •2.7. Приклад 1.
- •2.8. Нелінійна парна регресія
- •2.9. Дослідження нелінійних рівнянь
- •2.10. Приклад 2.
- •2.11. Побудова функції парної регресії
- •2.12. Побудова графіку функції
- •2.13. Питання для самоперевірки
- •3. Багатофакторний регресійний аналіз
- •3.1. Класична нормальна лінійна модель
- •3.2. Коефіцієнти детермінації і кореляції.
- •3.3. Перевірка значущості параметрів
- •3.4. Прогноз залежної змінної
- •3.5. Приклад 3. Знаходження двофакторної моделі
- •3.6. Використання пакету анализ данных
- •3.7. Використання Excel для розрахунку
- •Введення і підготовка даних
- •4. Мультиколінеарність
- •4.1. Поняття і наслідки мультиколінеарності
- •4.2. Алгоритм Фаррара – Глобера
- •4.3. Приклад 4.
- •4.5. Питання для самоперевірки
- •5. Гетероскедастичність
- •5.1. Поняття гетероскедастичності
- •5.2. Виявлення гетероскедастичності.
- •5.3. Приклад 5. Дослідження даних
- •5.4. Виявлення гетероскедастичності.
- •5.5. Приклад 6. Дослідження даних
- •5.6. Непараметричний тест Гольдфельда-Квандта
- •5.7. Питання для самоперевірки
- •6. Автокореляція
- •6.1. Поняття автокореляції.
- •6.2. Критерій Дарбіна-Уотсона
- •6.3. Приклад 7. Дослідження моделі на наявність
- •6.4. Питання для самоперевірки
- •7. Індивідуальні комплексні завдання
- •Завдання 2
- •Завдання 3
- •Завдання 4
- •Завдання 5
- •Предметний покажчик
- •Література
- •Коефіцієнтів автокореляції залишків
- •Критичні значення і для коефіцієнта автокореляції залишків критерія Дарбіна-Уотсона для
- •Критичні значення і для коефіцієнта автокореляції залишків критерія Дарбіна-Уотсона для
- •Значення критерія Пірсона
- •Квантилі розподілу Стьюдента
- •83050, М. Донецьк, вул. Щорса, 31.
- •83023, М. Донецьк, вул. Харитонова, 10
1.2. Основні математичні поняття,
які використовуються в регресійному аналізі
Математичне сподівання дискретної випадкової величини дорівнює сумі добутків можливих значень випадкової величини на їх ймовірності
. (1.2.1)
Математичне сподівання позначається , , , .
Середнє арифметичне значення це експериментальна величина, його, як правило, знаходять на основі вибіркових даних.
Ранжована послідовність значень випадкової величини називається варіаційним рядом. Числа називаються – варіантами варіаційного ряду. Числа , що показують скільки разів зустрічається варіанта в ряді спостереження, називаються частотами.
Перелік варіант і відповідних їм частот називається статистичним розподілом вибірки або статистичним рядом.
Для дискретного статистичного ряду середнє арифметичне обчислюється за формулою
,
де – число варіант, які не повторюються, – обсяг вибірки.
Середнє арифметичне значення позначається або .
Дисперсія випадкової величини дорівнює математичному сподіванню квадрата різниці між величиною та її математичним сподіванням
. (1.2.2)
Дисперсія позначається , , . Якщо дисперсія знаходиться на основі вибіркових даних, то використовують також позначення .
Дисперсія є мірою розсіяння ймовірнісного розподілу випадкової величини.
Незміщена оцінка дисперсії знаходиться на основі вибіркових спостережень і обчислюється за формулою
, (1.2.3)
або за формулою
, (1.2.4)
де
. (1.2.5)
Якщо вибірка велика, тобто , то і дисперсія вибірки обчислюється за формулою
. (1.2.6)
Величину (1.2.6) називають також виправленою вибірковою дисперсією. Вона є незміщеною і обґрунтованою оцінкою дисперсії генеральної сукупності.
Середнє квадратичне відхилення або стандартне відхилення випадкової величини дорівнює кореню квадратному із її дисперсії
.
Стандартне відхилення також, як і є мірою розсіяння.
Вибіркова коваріація (або кореляційний момент) виступає як мірою взаємозв’язку між двома випадковими величинами і , так і мірою ступеня розсіяння значень цих двох змінних відносно їх математичних сподівань. Вибіркова коваріація розраховується за формулою
,
де і вибіркові середні значення величин і . Для коваріації випадкових величин і використовуються також позначення , .
Вибіркова коваріація дорівнює нулю, якщо величини і незалежні. Такі величини ще називають некорельованими. Коваріація однієї змінної дорівнює її дисперсії, тобто
.
Коваріація величина розмірна. Її розмірність залежить від розмірності і чисельного значення величин, для яких вона була обчислена, це створює незручності в використанні для характеристики взаємозв’язку величин. Більш точною мірою зв’язку між величинами і порівняно з коваріацією є коефіцієнт кореляції, який є безрозмірним. Вибірковий лінійний коефіцієнт кореляції позначається або і визначається формулою
.
Величина є показником тісноти лінійного зв’язку між величинами і , чим ближче до одиниці, тим тісніший зв’язок. При зв’язок прямий, при зв’язок обернений. Прямий зв'язок означає, що збільшення значень пояснюючої змінної (регресора) приводить до збільшення значень пояснювальної змінної (регресанта) . При оберненому зв’язку при збільшенні значень значення зменшуються.
При вивченні -вимірної випадкової величини , де – випадкові складові величини , багатовимірним аналогом дисперсії виступає дисперсійно – коваріаційна матриця або , що те саме, коваріаційна матриця
,
де – коваріації складових ,
.