- •Частина іі Математична статистика
- •Розділ іv. Статистична перевірка гіпотез
- •1.1 Статистичний розподіл вибірки
- •1.2 Емпірична функція розподілу
- •1.3 Полігон та гістограма
- •Приклад 3. Вибірку задано у вигляді розподілу частот
- •1.4 Тренувальні вправи
- •2.1 Точкові оцінки параметрів розподілу
- •Основні властивості вибіркової середньої
- •1) При множенні усіх варіант вибірки на однаковий множник вибіркова середня також множиться на цей множник:
- •Приклад 1. Вибіркова сукупність задана таблицею
- •2.2 Інтервальні оцінки параметрів розподілу
- •2.3 Тренувальні вправи
- •2.4 Обчислення параметрів розподілу методом добутків
- •2.5 Індивідуальне семестрове завдання №1 “Статистичний розподіл вибірки. Обчислення параметрів розподілу методом добутків”
- •2.6 Зразок виконання індивідуального семестрового завдання №1
- •2.7 Обробка вибірки методом найменших квадратів
- •2.8 Тренувальні вправи
- •2.9 Індивідуальне семестрове завдання №2 «Метод найменших квадратів»
- •2.10 Зразок виконання індивідуального семестрового завдання №2
- •Розділ ііі. Елементи теорії кореляції
- •3.2 Лінійна кореляція
- •3.3 Криволінійна кореляція
- •3.4 Рангова кореляція. Вибірковий коефіцієнт рангової кореляції Спірмена
- •3.5 Тренувальні вправи
- •3.6 Індивідуальне семестрове завдання №3 “Знаходження вибіркового коефіцієнта кореляції та прямих ліній регресії”
- •Варіант 5. Розподіл 50 за вартістю основних виробничих фондів (млн. Грн) та витратами (% до вартості основних фондів) на капітальний ремонт дано у таблиці:
- •Варіант 6. Розподіл 40 заводів кольорової металургії за середньодобовим виробленням металу (тис.Т) та затратами електроенергії на 1 тн. (тис. КВт-год) дано у таблиці:
- •Варіант 7. Розподіл 80 корів за живою вагою (кг) та надоями молока (кг) дано у таблиці:
- •Варіант 8. Розподіл 100 ткацьких фабрик за виробничими потужностями (тис. М. На рік) та собівартістю 1 м тканини (грн) дано у таблиці:
- •Варіант 9. Розподіл 100 прямокутних чавунних плиток за довжиною (см) та масою (кг) дано у таблиці:
- •Варіант 10. Розподіл 200 заводів за вартістю основних фондів (млн. Грн.) та вартістю готової продукції ( млн. Грн.) дано у таблиці:
- •Варіант 11. Розподіл підприємств за об’ємом продукції (грн) та за її собівартістю (грн) надано у таблиці:
- •Варіант 12. Розподіл 120 вагонних коліс за терміном служби (в роках) та величиною зносу ободу колеса (в мм) дано у таблиці:
- •Варіант 14. Розподіл 100 проб руди з вмістом окису заліза (%) та закису заліза (%) дано у таблиці:
- •Варіант 15. Розподіл однотипних підприємств за вартістю основних фондів (млн. Грн) та собівартістю одиниці продукції (грн) дано у таблиці:
- •Варіант 16. Розподіл 100 прямокутних плиток за їх довжиною (см) та масою (кг) дано у таблиці:
- •За відповідним рівнянням регресії оцінити середнє значення собівартості вугілля тих шахт, глибина виробок яких складає 800 м, та порівняти одержаний результат з відповідним груповим середнім.
- •За відповідним рівнянням регресії оцінити середнє значення газоносності тих шахт, глибина виробок яких складає 900 м, та порівняти його з відповідним груповим середнім.
- •3.7 Зразок виконання індивідуального семестрового завдання №3 Розподіл однотипних підприємств за вартістю основних фондів (млн. Грн) та собівартістю одиниці продукції (грн) дано у таблиці:
- •3.8 Питання для самоперевірки
- •Розділ іv. Статистична перевірка гіпотез
- •4.1 Поняття статистичної гіпотези
- •4.2 Критична область. Знаходження критичних областей
- •4.3 Критерій узгодження Пірсона
- •4.4 Тренувальні вправи
- •4.5 Питання для самоперевірки
- •Література
- •Додатки Додаток а Таблиця значень функції (х)
- •Додаток б
- •Додаток в
- •Додаток д
- •Додаток е Критичні точки розподілу 2
- •Додаток ж Критичні точки розподілу Стьюдента
- •Додаток и Критичні точки розподілу f Фішера – Снедекора
- •Додаток к Критичні точки розподілу Колмогорова
4.3 Критерій узгодження Пірсона
Критерій узгодження Пірсона ( -квадрат) ефективно використовують для перевірки гіпотези про розподіл генеральної сукупності, тобто що розподіл випадкової величини має певний функціональний вираз.
Обмежимось застосуванням цього критерію для перевірки гіпотези про нормальний розподіл генеральної сукупності.
Нехай вибірка має такий розподіл об’єму .
варіанти |
|
|
… |
|
частоти |
|
|
… |
|
або
варіанти |
|
|
… |
|
частоти |
|
|
… |
|
Потрібно з рівнем значущості перевірити основну гіпотезу : генеральна сукупність розподілена нормально.
Критерієм перевірки цієї гіпотези беруть випадкову величину , яка у різних випробуваннях приймає різні, наперед невідомі значення.
Критичне значення цієї випадкової величини залежить від рівня значущості та степенів вільності її розподілу
.
Ці критичні значення наведені в додатку для різних та .
Для розподілу генеральної сукупності за нормальним законом степінь вільності буде
,
де – кількість варіантів вибірки або часткових інтервалів варіант.
Правило Пірсона. Щоб при заданому рівні значущості перевірити основну гіпотезу : генеральна сукупність розподілена нормально, необхідно
1) обчислити теоретичні частоти для варіант вибірки;
2) обчислити спостережне значення критерія за формулою
;
3) знайти степінь вільності за формулою
;
4) знайти з таблиці критичну точку , яка відповідає заданому рівню значущості та степені вільності ;
5) порівняти та і зробити висновок:
якщо , то гіпотезу треба прийняти;
якщо , то гіпотезу треба відхилити.
Приклад 1. При рівні значущості 0,05 перевірити гіпотезу про нормальний розподіл генеральної сукупності, якщо відомі емпіричні й теоретичні частоти
емпіричні частоти |
6 |
13 |
38 |
74 |
106 |
85 |
30 |
14 |
теоретичні частоти |
3 |
14 |
42 |
82 |
99 |
76 |
37 |
13 |
Розв’язання. Знаходимо степінь вільності, з огляду на те, що число груп вибірки (число різних варіант) .
Заповнимо розрахункову таблицю.
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
|
|
|
|
|
|
|
|
1 |
6 |
3 |
3 |
9 |
3 |
36 |
12 |
2 |
13 |
14 |
-1 |
1 |
0,07 |
169 |
12,07 |
3 |
38 |
42 |
-4 |
16 |
0,38 |
1444 |
34,38 |
4 |
74 |
82 |
-8 |
64 |
0,78 |
5476 |
66,78 |
5 |
106 |
99 |
7 |
49 |
0,49 |
11236 |
113,49 |
6 |
85 |
76 |
9 |
81 |
1,07 |
7225 |
95,07 |
7 |
30 |
37 |
-7 |
49 |
1,32 |
900 |
24,32 |
8 |
14 |
13 |
1 |
1 |
0,08 |
196 |
15,08 |
|
366 |
366 |
|
|
|
|
373,19 |
Контроль: .
Розрахунки зроблені вірно.
Висновок: за таблицею критичних точок розподілу за рівнем значущості і числа степені вільності знаходимо .
Маємо , або , тому немає підстав відкидати нульову гіпотезу. Розбіжність емпіричних і теоретичних частот незначне. Отже, дані спостережень погодяться з гіпотезою про нормальний розподіл генеральної сукупності.
Приклад 2. Використовуючи критерій узгодження Пірсона, при рівні значущості 0,05, перевірити, чи погодиться гіпотеза про нормальний розподіл генеральної сукупності з емпіричним розподілом вибірки об'єму .
|
5 |
9 |
13 |
17 |
21 |
25 |
29 |
|
1 |
8 |
11 |
12 |
9 |
7 |
2 |
Розв’язання.
1. Використовуючи метод добутків, знайдемо вибіркову середню й вибіркове середнє квадратичне відхилення .
2. Обчислимо теоретичні частоти, з огляду на, що , , , за формулою
Значення поміщені в додатку 1.
|
|
|
|
|
1 |
5 |
-2,0376 |
0,0498 |
1,702 |
2 |
9 |
-1,3538 |
0,1604 |
5,4837 |
3 |
13 |
-0,6701 |
0,3187 |
4,5083 |
4 |
17 |
0,0136 |
0,3989 |
13,64 |
5 |
21 |
0,6974 |
0,3123 |
10,68 |
6 |
25 |
1,3811 |
0,1539 |
5,26 |
7 |
29 |
2,0649 |
0,0478 |
1,634 |
3. Порівняємо емпіричні й теоретичні частоти.
4. Складемо розрахункову таблицю й знайдемо
.
|
|
|
|
|
|
1 |
1 |
1,7 |
-0,7 |
0,49 |
0,29 |
2 |
8 |
5,5 |
2,5 |
6,25 |
1,14 |
3 |
11 |
4,5 |
6,5 |
42,25 |
9,39 |
4 |
12 |
13,6 |
-1,6 |
2,56 |
0,19 |
5 |
9 |
1,7 |
-1,7 |
2,89 |
0,27 |
6 |
7 |
5,3 |
1,7 |
2,89 |
0,55 |
7 |
2 |
1,6 |
0,4 |
0,16 |
0,1 |
|
200 |
|
|
|
|
5. За таблицею критичних точок розподілу за рівнем значущості й числу степені вільності знаходимо критичну точку .
Висновок: тому що — гіпотезу про нормальний розподіл генеральної сукупності відкидаємо. Інакше кажучи, емпіричні й теоретичні частоти розрізняються суттєво.
Приклад 3. Використовуючи критерій узгодження Пірсона, з рівнем значущості 0,05, перевірити, чи погодиться гіпотеза про нормальний розподіл генеральної сукупності з емпіричним розподілом вибірки об'єму .
Номер інтервалу |
Границі інтервалу |
Частота
|
|
|
|
||
1 |
3 |
7 |
1 |
2 |
7 |
11 |
8 |
3 |
11 |
15 |
11 |
4 |
15 |
19 |
12 |
5 |
19 |
23 |
9 |
6 |
23 |
27 |
7 |
7 |
27 |
30 |
2 |
Для перевірки гіпотези складемо таку розрахункову таблицю (перші три стовпчика цієї таблиці запозичені зі згаданої раніше таблиці); крім того, тут використаємо обчислені там та .
|
|
|
|
|
|
|
|
|
|
3 |
7 |
1 |
|
-1,69 |
-1 |
-0,909 |
2,28 |
0,72 |
0,44 |
7 |
11 |
8 |
-1,69 |
-1,01 |
-0,909 |
-0,687 |
5,54 |
1,09 |
11,55 |
11 |
15 |
11 |
-1,01 |
-0,33 |
-0,687 |
-0,258 |
10,72 |
0,007 |
11,29 |
15 |
19 |
12 |
-0,38 |
0,35 |
-0,258 |
0,273 |
13,31 |
0,13 |
10,82 |
19 |
23 |
9 |
0,35 |
1,04 |
0,273 |
0,701 |
10,7 |
0,27 |
7,57 |
23 |
27 |
7 |
1,04 |
1,72 |
0,701 |
0,914 |
5,32 |
0,53 |
9,21 |
27 |
30 |
2 |
1,72 |
|
0,916 |
1 |
2,14 |
0,009 |
1,87 |
|
|
50 |
|
|
|
|
50 |
2,756 |
52,756 |
Останній стовпчик цієї таблиці наведено, щоб проконтролювати правильність обчислень. Якщо обчислення виконані без помилок, то сума чисел, які знаходяться у 8-му та 9-му стовпчиках останнього, підсумкового рядка, дорівнює підсумковому числу 10-го стовпчика. Для розрахункової таблиці це виконується: 50 + 2,756 = 52,756. Отже, обчислення виконані вірно.
З цієї таблиці (підсумкове значення 9-го стовпчика) одержуємо шукане .
Число степенів вільності .
У додатку при знаходимо .
Висновок: тому що — то немає підстав відкидати нульову гіпотезу. Інакше кажучи, емпіричні й теоретичні частоти розрізняються незначимо.