- •Змістовий модуль 3.
- •Основні поняття теорії ймовірностей
- •1. Коротка історична довідка
- •2. Випадкові явища та їх природа
- •3. Предмет теорії ймовірностей
- •4. Класичне означення ймовірності
- •5. Статистична ймовірність
- •6. Геометрична ймовірність
- •1. Елементи комбінаторики без повторень
- •2. Елементи комбінаторики з повтореннями
- •3. Співвідношення між подіями
- •4. Операції над подіями. Діаграми Венна
- •5. Формула включень та виключень
- •1. Теорема додавання ймовірностей несумісних подій
- •2. Теорема додавання ймовірностей сумісних подій
- •3. Теорема множення ймовірностей залежних подій
- •4. Теорема множення ймовірностей незалежних подій
- •Семінарське заняття 20
- •2. Випробування за схемою Бернуллі
- •3. Асимптотичні формули (локальна та інтегральна теореми Лапласа; формула Пуассона)
- •Семінарське заняття 21
- •Тема 18. Дискретні випадкові величини. Тема 19. Неперервні випадкові величини
- •Виконання студентами тестових завдань з питань теми заняття. Методичні вказівки
- •Дискретні випадкові величини, їх характеристики
- •1. Випадкова величина. Закон розподілу дискретної випадкової величини.
- •2. Приклади дискретних випадкових величин та їх законів розподілу
- •3. Математичне сподівання дискретної випадкової величини, його зміст та властивості
- •4. Дисперсія дискретної випадкової величини, її властивості
- •5. Середнє квадратичне відхилення
- •6. Теоретичні моменти
- •1. Функція розподілу та її властивості
- •2. Щільність розподілу ймовірностей, її властивості та зв’язок з функцією розподілу
- •3. Числові характеристики неперервних випадкових величин
- •4. Застосування числових характеристик для прийняття рішень в умовах ризику
- •Семінарське заняття 22
- •2. Показниковий розподіл
- •3. Нормальний закон розподілу
- •4. Розподіли, пов’язані з нормальним
- •5.Поняття про розподіли, що використовуються в актуарній математиці
- •Семінарське заняття 24
- •Тема 22. Закони великих чисел та їх застосування у математичній статистиці. Тема 23. Основні поняття математичної статистики
- •Виконання студентами тестових завдань з питань теми заняття. Методичні вказівки
- •Семінарське заняття 25
- •Тема 24. Точкові та інтервальні оцінки. Тема 25. Перевірка статистичних гіпотез
- •Виконання студентами тестових завдань з питань теми заняття. Методичні вказівки
- •Семінарське заняття 26
- •2. Знаходження параметрів теоретичного рівняння регресії методом найменших квадратів
- •3. Властивості вибіркового коефіцієнта кореляції
- •4. Правило перевірки нульової гіпотези
- •Семінарське заняття 27
- •Тема 26. Регресійний аналіз і кореляція
- •Виконання студентами тестових завдань з питань теми заняття. Методичні вказівки
Виконання студентами тестових завдань з питань теми заняття. Методичні вказівки
Ключовими термінами, на розумінні яких базується засвоєння навчального матеріалу теми, є : методи лінеаризації кривих, логістична крива, час максимального попиту, прогнозні розрахунки – аргумента за відомою функцією і навпаки, функції за відомим аргументом.
З метою глибокого засвоєння навчального матеріалу при самостійному вивченні теми студенту варто особливу увагу зосередити на таких аспектах.
Основні задачі теорії кореляції.
Побудова прямої лінії регресії.
Нелінійна кореляція.
1. Нехай задано дві випадкові величини – X і Y. Можливі такі ситуації.
1) X та Y – незалежні величини: зміна Х не впливає на розподіл Y.
2) X та Y пов’язані функціональною залежністю.
3) Між X та Y існує статистична (стохастична) залежність: одному й тому ж значенню величини X відповідає статистична сукупність значень величини Y. Якщо, зокрема, при зміні однієї величини (X) змінюється середнє значення другої (), то статистична залежність називається кореляційною. Таким чином, кореляційна залежність – це функціональна залежність між значеннями величини X та умовними середніми значеннями випадкової величини Y.
Кореляція називається неповною, коли одній величині (наприклад, X) надаються певні фіксовані значення х1, х2,…,хк і для кожного з них шляхом експерименту знаходять сукупність значень величини Y. Кореляція називається повною, коли кожен із відібраних елементів статистичної сукупності об’єктів досліджується відразу і по Х, і по Y.
а) питання про форму кореляційного зв’язку між Х і Y;
б) оцінка тісноти кореляційного зв’язку між Х і Y.
Розв’язання задачі а) зводиться до підбору певного виду функціональної залежності, а задачі б) – визначення того, наскільки близька досліджувана залежність до вибраної функціональної.
Задача а) розв’язується за допомогою регресій. Емпірична лінія регресії – це ламана лінія, яка з’єднує точки з координатами Aі (xі,) (тут –умовна середня (і=1,2,…,n)). Теоретично лінією регресії Y по Х називається лінія, яка “згладжує” емпіричну лінію регресії. Рівняння цієї лінії дає наближений аналітичний вираз регресії.
Кореляційна залежність між випадковими величинами Х та Y називається лінійною кореляцією, якщо теоретичні рівняння регресії Y по Х та Х по Y лінійні. В противному випадку кореляційна залежність називається нелінійною.
2. Параметри теоретичного рівняння прямої лінії регресії Y по Х знаходять у такий спосіб.
А) Якщо дано n точок () (і=1,2,…, n), шукають рівняння виду . Згідно з методом найменших квадратів, мінімізують суму квадратів відхилень виду. Виходячи з цієї вимоги, одержують:
.
Аналогічно можна знайти рівняння прямої лінії регресії Х по Y: Зауважимо, що коефіцієнт можна представити у вигляді деσх та σу – вибіркові середні квадратичні відхилення, а R вибірковий коефіцієнт кореляції:
Цей коефіцієнт – статистична оцінка теоретичного коефіцієнта кореляції p, який визначається за формулою:
Б) Якщо дані спостереження над випадковими величинами Х і Y задані кореляційною таблицею розмір n х m з рівновіддаленими варіантами, то рівняння прямої лінії регресії Y по Х зручно шукати у формі дета– вибіркові середні випадкових величинХ і Y відповідно, а rху – вибірковий коефіцієнт кореляції, представлений у вигляді причомуwij – емпірична ймовірність появи значення (хі, ) ,n – кількість спостережених варіант випадкової величини X, m – кількість спостережених варіант випадкової величини Y.
Нехай результати спостережень задані кореляційною таблицею з рівновіддаленими варіантами, причому h1 – крок варіант випадкової величини Х, а h2 – крок варіант випадкової величини Y. Для полегшення розрахунків переходять до умовних варіант U і V, користуючись співвідношенням деC1 і C2 – “хибні нулі” варіант випадкових величин Х і Y. Вибірковий коефіцієнт кореляції =, де причому
У рівняння прямої регресії виходять величини які обчислюють за допомогою формул
ПРИКЛАД. Знайти вибіркове рівняння прямої регресії Y по Х за даними кореляційної таблиці 1.
Таблиця 1
Х
|
Y |
nx | ||||
10 |
15 |
20 |
25 |
30 | ||
50 60 70 80 90 |
9 2 - - - |
9 10 3 - - |
- 11 15 6 - |
- - 12 10 1 |
- - - 7 5 |
18 23 30 23 6 |
ny |
11 |
22 |
32 |
23 |
12 |
100 |
Розв’язування. Перетворимо кореляційну таблицю 1, ввівши умовні варіанти Замінимо частоти емпіричними ймовірностями. Отримаємо таблицю 2.
Таблиця 2
U |
V |
wu | ||||
-2 |
-1 |
0 |
1 |
2 | ||
-2 -1 0 1 2 |
0,09 0,02 - - - |
0,09 0,10 0,03 - - |
- 0,11 0,15 0,06 - |
- - 0,12 0,10 0,01 |
- - - 0,07 0,05 |
0,18 0,23 0,30 0,23 0,06 |
wv |
0,11 |
0,22 |
0,32 |
0,23 |
0,12 |
1 |
Визначимо :
;
Знайдемо :
;
Обчислимо:
Далі знайдемо суму
Знайдемо вибірковий коефіцієнт кореляції:
Звідси маємо: ,Обчислюємо середні квадратичні відхилення:
Таким чином, вибіркове рівняння регресії має вигляд або
3. Припустимо, що точки кореляційного поля ґрупуються навколо деякої кривої лінії. У цьому випадку графік емпіричної лінії регресії співставляють з графіками відомих функцій. Невідомі параметри рівнянь регресії шукають методом найменших квадратів, провівши попередньо лінеаризацію (“випрямлення”) кривих. Так, наприклад, щоб піібрати параметри a і a1 степеневої залежності , лінеаризуємо це рівняння за допомогою логарифмування:
Якщо позначити то останнє рівняння набуває виду
Параметри і можна визначити методом найменших квадратів.
Оцінка точності апроксимації криволінійною залежністю проводиться за допомогою кореляційного відношення :
Якщо при цьому , то крива точніше апроксимує залежність, ніж пряма. Прилінійна кореляція буде точнішою. Зауважимо, що для прямої лінії.
Важливе значення у прогнозуванні має логістична залежність
,
причому B, k – сталі числа.
Якщо відомі результати n спостережень (ti, yi) (i=1,2,…,n), то ця залежність будується, як кореляційна. Заміною змінних
Вона лінеаризується у залежність де.
З використанням методу найменших квадратів для середніх значень параметрів В і k отримуємо формули:
ПРИКЛАД. За щоденними даними першої декади червня рівня забезпеченості y населення послугою туристичного агентства (таблиця 1) встановити логістичну залежність.
Таблиця 1
t (дні) |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
y |
0,195 |
0,200 |
0,205 |
0,210 |
0,220 |
0,230 |
0,240 |
0,255 |
0,270 |
0,285 |
Розв’язування. Обчислимо такі суми:
З використанням одержаних сум знаходимо:
Відповідь: логістична залежність має вигляд