- •Частина іі Математична статистика
- •Розділ іv. Статистична перевірка гіпотез
- •1.1 Статистичний розподіл вибірки
- •1.2 Емпірична функція розподілу
- •1.3 Полігон та гістограма
- •Приклад 3. Вибірку задано у вигляді розподілу частот
- •1.4 Тренувальні вправи
- •2.1 Точкові оцінки параметрів розподілу
- •Основні властивості вибіркової середньої
- •1) При множенні усіх варіант вибірки на однаковий множник вибіркова середня також множиться на цей множник:
- •Приклад 1. Вибіркова сукупність задана таблицею
- •2.2 Інтервальні оцінки параметрів розподілу
- •2.3 Тренувальні вправи
- •2.4 Обчислення параметрів розподілу методом добутків
- •2.5 Індивідуальне семестрове завдання №1 “Статистичний розподіл вибірки. Обчислення параметрів розподілу методом добутків”
- •2.6 Зразок виконання індивідуального семестрового завдання №1
- •2.7 Обробка вибірки методом найменших квадратів
- •2.8 Тренувальні вправи
- •2.9 Індивідуальне семестрове завдання №2 «Метод найменших квадратів»
- •2.10 Зразок виконання індивідуального семестрового завдання №2
- •Розділ ііі. Елементи теорії кореляції
- •3.2 Лінійна кореляція
- •3.3 Криволінійна кореляція
- •3.4 Рангова кореляція. Вибірковий коефіцієнт рангової кореляції Спірмена
- •3.5 Тренувальні вправи
- •3.6 Індивідуальне семестрове завдання №3 “Знаходження вибіркового коефіцієнта кореляції та прямих ліній регресії”
- •Варіант 5. Розподіл 50 за вартістю основних виробничих фондів (млн. Грн) та витратами (% до вартості основних фондів) на капітальний ремонт дано у таблиці:
- •Варіант 6. Розподіл 40 заводів кольорової металургії за середньодобовим виробленням металу (тис.Т) та затратами електроенергії на 1 тн. (тис. КВт-год) дано у таблиці:
- •Варіант 7. Розподіл 80 корів за живою вагою (кг) та надоями молока (кг) дано у таблиці:
- •Варіант 8. Розподіл 100 ткацьких фабрик за виробничими потужностями (тис. М. На рік) та собівартістю 1 м тканини (грн) дано у таблиці:
- •Варіант 9. Розподіл 100 прямокутних чавунних плиток за довжиною (см) та масою (кг) дано у таблиці:
- •Варіант 10. Розподіл 200 заводів за вартістю основних фондів (млн. Грн.) та вартістю готової продукції ( млн. Грн.) дано у таблиці:
- •Варіант 11. Розподіл підприємств за об’ємом продукції (грн) та за її собівартістю (грн) надано у таблиці:
- •Варіант 12. Розподіл 120 вагонних коліс за терміном служби (в роках) та величиною зносу ободу колеса (в мм) дано у таблиці:
- •Варіант 14. Розподіл 100 проб руди з вмістом окису заліза (%) та закису заліза (%) дано у таблиці:
- •Варіант 15. Розподіл однотипних підприємств за вартістю основних фондів (млн. Грн) та собівартістю одиниці продукції (грн) дано у таблиці:
- •Варіант 16. Розподіл 100 прямокутних плиток за їх довжиною (см) та масою (кг) дано у таблиці:
- •За відповідним рівнянням регресії оцінити середнє значення собівартості вугілля тих шахт, глибина виробок яких складає 800 м, та порівняти одержаний результат з відповідним груповим середнім.
- •За відповідним рівнянням регресії оцінити середнє значення газоносності тих шахт, глибина виробок яких складає 900 м, та порівняти його з відповідним груповим середнім.
- •3.7 Зразок виконання індивідуального семестрового завдання №3 Розподіл однотипних підприємств за вартістю основних фондів (млн. Грн) та собівартістю одиниці продукції (грн) дано у таблиці:
- •3.8 Питання для самоперевірки
- •Розділ іv. Статистична перевірка гіпотез
- •4.1 Поняття статистичної гіпотези
- •4.2 Критична область. Знаходження критичних областей
- •4.3 Критерій узгодження Пірсона
- •4.4 Тренувальні вправи
- •4.5 Питання для самоперевірки
- •Література
- •Додатки Додаток а Таблиця значень функції (х)
- •Додаток б
- •Додаток в
- •Додаток д
- •Додаток е Критичні точки розподілу 2
- •Додаток ж Критичні точки розподілу Стьюдента
- •Додаток и Критичні точки розподілу f Фішера – Снедекора
- •Додаток к Критичні точки розподілу Колмогорова
2.10 Зразок виконання індивідуального семестрового завдання №2
За наданими статистичними даними підібрати емпіричну функцію, та:
1. побудувати діаграму розсіювання,
2. записати емпіричну функцію,
3. записати систему нормальних рівнянь,
4. скласти розрахункову таблицю,
5. розв’язати отриману систему й записати емпіричну функцію зі знайденими параметрами.
Вважаючи, що залежність між змінними й має вигляд , знайти оцінки параметрів для вибірки:
|
90 |
110 |
120 |
130 |
180 |
200 |
180 |
|
25 |
28 |
31 |
32 |
36 |
42 |
55 |
За вибіркою спостереження побудуємо в системі координат діаграму розсіювання, тобто побудуємо точки (90; 25); (110; 28); (120; 31); (130; 32); (180; 36); (200; 42); (280; 55).
90 110 120 130 180 200 280
Аналіз дослідницьких даних показує, що в якості емпіричної функції можна використати лінійну функцію .
У виразі необхідно знайти параметри a і b, для цього застосуємо МНК. Тоді для визначення параметрів a і b будемо мати систему нормальних рівнянь.
Для зручності обчислень складемо наступну розрахункову таблицю ( ).
|
|
|
|
|
1 |
90 |
25 |
8100 |
2250 |
2 |
110 |
28 |
12100 |
3080 |
3 |
120 |
31 |
14400 |
3720 |
4 |
130 |
32 |
16900 |
4160 |
5 |
180 |
36 |
32400 |
6480 |
6 |
200 |
42 |
40000 |
8400 |
7 |
280 |
55 |
78400 |
15400 |
|
|
|
|
|
Підставимо дані останнього рядка таблиці в нормальну систему рівнянь.
Вирішуючи систему, одержимо
Підставляючи ці значення параметрів в лінійне рівняння, одержимо емпіричну функцію:
.
Розділ ііі. Елементи теорії кореляції
3.1 Основні поняття
Залежність величини y або х називають функціональною, якщо кожному значенню х відповідає єдине значення величини y. Якщо х – детермінована величина, тобто приймаюча цілком певне значення, то й y є детермінована, якщо ж х – випадкова величина, то й y також випадкова величина.
Однак же, частіше в навколишньому нас світі має місце не функціональна, а стохастична, або імовірнісна залежність, коли кожному фіксованому значенню незалежної змінної х відповідає не одне, а множина значень змінних у, причому сказати заздалегідь, яке саме значення прийме величина у не можна.
Припустимо, що існує стохастична залежність випадкової змінної y від х. Зафіксуємо деяке значення х змінної Х. При змінна y у силу її стохастичної залежності від х може прийняти будь-яке значення з деякої множини, причому яке саме, заздалегідь невідомо.
Середнє цієї множини називають груповим генеральним середнім змінної Y при Х = х , або математичним сподіванням випадкової величини Y, обчисленої за умови, що Х = х, це умовне математичне сподівання позначають як .
Якщо існує стохастична залежність Y від Х, то насамперед намагаються з'ясувати, змінюються чи ні при зміні Х умовні математичні сподівання .
Статистичною називають залежність, при якій зміна однієї з величин тягне зміну розподілу іншої.
Зокрема, статистична залежність проявляється в тім, що при зміні однієї з величин змінюється середнє значення іншої; у цьому випадку статистичну залежність називають кореляційною.
Говорять, що має місце кореляційна залежність Y від Х, якщо при зміні Х змінюються умовні математичні сподівання , якщо ж умовні математичні сподівання залишаються незмінними, то говорять, що кореляційна залежність Y від Х відсутня.
Функція , що описує зміну умовного математичного сподівання випадкової змінної Y при зміні значень х змінної Х, називається функцією регресії.
Умовним середнім називають середнє арифметичне значень , що спостерігалися при відповідних .
Наприклад, якщо при величина прийняла значення , то умовне середнє .
Умовним середнім називають середнє арифметичне значень , що спостерігалися при відповідних .
При великій кількості спостережень одне й те значення може зустрітися разів, одне й те значення – разів, одна й та сама пара чисел може зустрінеться раз. Тому дані спостережень групують, підраховуючи частоти , , . Всі згруповані дані записують у вигляді таблиці, що називають кореляційною, наприклад:
у |
х |
|
|||
0-20 |
20-40 |
40-60 |
60-80 |
||
9-11 |
5 |
5 |
|
|
10 |
11-13 |
8 |
6 |
1 |
|
15 |
13-15 |
4 |
8 |
5 |
|
17 |
15-17 |
|
7 |
12 |
6 |
25 |
17-19 |
|
4 |
10 |
6 |
20 |
19-21 |
|
|
4 |
9 |
13 |
|
17 |
30 |
32 |
21 |
100 |