- •Частина іі Математична статистика
- •Розділ іv. Статистична перевірка гіпотез
- •1.1 Статистичний розподіл вибірки
- •1.2 Емпірична функція розподілу
- •1.3 Полігон та гістограма
- •Приклад 3. Вибірку задано у вигляді розподілу частот
- •1.4 Тренувальні вправи
- •2.1 Точкові оцінки параметрів розподілу
- •Основні властивості вибіркової середньої
- •1) При множенні усіх варіант вибірки на однаковий множник вибіркова середня також множиться на цей множник:
- •Приклад 1. Вибіркова сукупність задана таблицею
- •2.2 Інтервальні оцінки параметрів розподілу
- •2.3 Тренувальні вправи
- •2.4 Обчислення параметрів розподілу методом добутків
- •2.5 Індивідуальне семестрове завдання №1 “Статистичний розподіл вибірки. Обчислення параметрів розподілу методом добутків”
- •2.6 Зразок виконання індивідуального семестрового завдання №1
- •2.7 Обробка вибірки методом найменших квадратів
- •2.8 Тренувальні вправи
- •2.9 Індивідуальне семестрове завдання №2 «Метод найменших квадратів»
- •2.10 Зразок виконання індивідуального семестрового завдання №2
- •Розділ ііі. Елементи теорії кореляції
- •3.2 Лінійна кореляція
- •3.3 Криволінійна кореляція
- •3.4 Рангова кореляція. Вибірковий коефіцієнт рангової кореляції Спірмена
- •3.5 Тренувальні вправи
- •3.6 Індивідуальне семестрове завдання №3 “Знаходження вибіркового коефіцієнта кореляції та прямих ліній регресії”
- •Варіант 5. Розподіл 50 за вартістю основних виробничих фондів (млн. Грн) та витратами (% до вартості основних фондів) на капітальний ремонт дано у таблиці:
- •Варіант 6. Розподіл 40 заводів кольорової металургії за середньодобовим виробленням металу (тис.Т) та затратами електроенергії на 1 тн. (тис. КВт-год) дано у таблиці:
- •Варіант 7. Розподіл 80 корів за живою вагою (кг) та надоями молока (кг) дано у таблиці:
- •Варіант 8. Розподіл 100 ткацьких фабрик за виробничими потужностями (тис. М. На рік) та собівартістю 1 м тканини (грн) дано у таблиці:
- •Варіант 9. Розподіл 100 прямокутних чавунних плиток за довжиною (см) та масою (кг) дано у таблиці:
- •Варіант 10. Розподіл 200 заводів за вартістю основних фондів (млн. Грн.) та вартістю готової продукції ( млн. Грн.) дано у таблиці:
- •Варіант 11. Розподіл підприємств за об’ємом продукції (грн) та за її собівартістю (грн) надано у таблиці:
- •Варіант 12. Розподіл 120 вагонних коліс за терміном служби (в роках) та величиною зносу ободу колеса (в мм) дано у таблиці:
- •Варіант 14. Розподіл 100 проб руди з вмістом окису заліза (%) та закису заліза (%) дано у таблиці:
- •Варіант 15. Розподіл однотипних підприємств за вартістю основних фондів (млн. Грн) та собівартістю одиниці продукції (грн) дано у таблиці:
- •Варіант 16. Розподіл 100 прямокутних плиток за їх довжиною (см) та масою (кг) дано у таблиці:
- •За відповідним рівнянням регресії оцінити середнє значення собівартості вугілля тих шахт, глибина виробок яких складає 800 м, та порівняти одержаний результат з відповідним груповим середнім.
- •За відповідним рівнянням регресії оцінити середнє значення газоносності тих шахт, глибина виробок яких складає 900 м, та порівняти його з відповідним груповим середнім.
- •3.7 Зразок виконання індивідуального семестрового завдання №3 Розподіл однотипних підприємств за вартістю основних фондів (млн. Грн) та собівартістю одиниці продукції (грн) дано у таблиці:
- •3.8 Питання для самоперевірки
- •Розділ іv. Статистична перевірка гіпотез
- •4.1 Поняття статистичної гіпотези
- •4.2 Критична область. Знаходження критичних областей
- •4.3 Критерій узгодження Пірсона
- •4.4 Тренувальні вправи
- •4.5 Питання для самоперевірки
- •Література
- •Додатки Додаток а Таблиця значень функції (х)
- •Додаток б
- •Додаток в
- •Додаток д
- •Додаток е Критичні точки розподілу 2
- •Додаток ж Критичні точки розподілу Стьюдента
- •Додаток и Критичні точки розподілу f Фішера – Снедекора
- •Додаток к Критичні точки розподілу Колмогорова
2.2 Інтервальні оцінки параметрів розподілу
Якщо об’єм вибірки досить великий, то точкові оцінки задовольняють практичні потреби точності.
Якщо об’єм вибірки малий, то точкові оцінки можуть давати значні похибки, тому питання точності оцінок у цьому випадку дуже важливе і використовують інтервальні оцінки.
Інтервальною називають оцінку, яка визначається двома числами – кінцями інтервалу.
Ймовірність того, що абсолютна величина відхилення вибіркової середньої (або частки) від генеральної середньої (відповідно частки) не перевищить додатного числа , називається надійною ймовірністю (довірчою ймовірністю).
Надійністю (довірчою ймовірністю) оцінки параметра за називають імовірність
,
з якою виконується нерівність .
Найчастіше число задається наперед і, залежно від обставин, воно дорівнює 0,95 або 0,99 або 0,999.
Формулу надійності можна записати у вигляді
.
З цієї рівності випливає, що інтервал містить невідомий параметр генеральної сукупності.
Інтервал називають довірчим, якщо він покриває невідомий параметр із заданою надійністю .
Нехай кількісна ознака Х генеральної сукупності розподілена за нормальним законом, середньоквадратичне відхилення відомо. Треба знайти довірчий інтервал, що покриває математичне сподівання генеральної сукупності із заданою надійністю .
Згідно із властивістю нормально розподіленої випадкової величини Х маємо
,
де
– функція Лапласа.
Але випадкова величина, , тому при заміні Х на , на одержимо
,
де
– точність оцінки (гранична похибка),
тобто з надійністю довірчий інтервал
покриває невідомий параметр а.
Точність оцінки (гранична похибка) буде
.
Число визначається із рівності
з використанням таблиці значень інтегральної функції Лапласа.
Зауваження. З аналізу точності оцінки випливає, що при зростанні об’єму вибірки п число зменшується, а це означає, що точність оцінки збільшується. Коли надійність збільшується, функція зростає і згідно її властивістю зростає і, як наслідок, зростає . Отже, збільшення надійності оцінки зменшує її точність.
Знаходження об’єму вибірки
Нехай ознака Х генеральної сукупності розподілена за нормальним законом з параметром і треба знайти об’єм вибірки п, який із заданою точністю та надійністю дозволить знайти оцінку параметра .
Із формули знаходимо
,
звідки випливає
.
Для надійності , використовуючи
та таблицю значень інтегральної функції Лапласа, знайдемо відповідне число .
Тепер, коли , , відомі, можна знайти потрібний об’єм вибірки п.
Застосування цих формул розглянемо на прикладі.
Приклад 1. Випадкова величина розподілена за нормальним законом з параметром . Знайти мінімальний об’єм п вибірки, щоб з надійністю та точністю виконувалась рівність , якщо .
Розв’язання.
Для маємо
.
Використовуючи формулу знаходження об’єму вибірки, знайдене , та задані , , одержуємо
.
Отже, мінімальний об’єм вибірки .
Приклад 2. Вибірковим шляхом одержано такі дані про урожайність жита:
урожайність ц/га |
12–14 |
14–16 |
16–18 |
18–20 |
20–22 |
22–24 |
24–26 |
разом |
число га |
18 |
57 |
109 |
136 |
105 |
50 |
25 |
500 |
а) Знайти ймовірність того, що середня урожайність, отримана у вибірці, відрізняється за абсолютною величиною від середньої урожайності на всій площі, зайнятій під житом (2000 га), не більше ніж на 0,2 ц, якщо вибірка безповторна.
б) Знайти необхідний об’єм безповторної вибірки, щоб з ймовірністю 0,9545 відхилення середньої урожайності у вибірці від середньої урожайності на всій площі не перевершувало 0,3 ц за абсолютною величиною.
Розв’язання.
Для визначення вибіркових середньої та дисперсії складемо розрахункову таблицю.
|
|
середина інтервалу
|
|
|
|
|
|
12 |
14 |
13 |
18 |
-3 |
-54 |
162 |
72 |
14 |
16 |
15 |
57 |
-2 |
-144 |
228 |
57 |
16 |
18 |
17 |
109 |
-1 |
-109 |
109 |
0 |
18 |
20 |
19 |
136 |
0 |
0 |
0 |
136 |
20 |
22 |
28 |
105 |
1 |
105 |
105 |
420 |
22 |
24 |
23 |
50 |
2 |
100 |
200 |
450 |
24 |
26 |
25 |
25 |
3 |
75 |
225 |
400 |
сума |
|
|
500 |
|
3 |
1029 |
1535 |
Контроль: .
.
.
.
.
.
1. Підрахуємо спочатку середню квадратичну похибку для вибіркової середньої без повторної вибірки:
.
Тоді шукана ймовірність за формулою
.
.
2. Знайдемо граничну похибку вибірки за формулою
.
Для повторної вибірки .
Число визначимо з умови
.
З таблиці функції знаходимо значення . Підставивши його у формулу, одержимо:
.
3. Знайдемо спочатку об’єм повторної вибірки
( )
.
Тоді шуканий об’єм безповторної вибірки:
.
Приклад 3. З лісового масиву в 20000 дерев за допомогою власне-випадкової безповторної вибірки відібрано 500 дерев, для яких одержано такі дані про кількість ділової деревини в одному дереві:
кількість деревини в одному дереві; м3 |
0,4-0,6 |
0,6-0,8 |
0,8-1,0 |
1,0-1,2 |
1,2-1,4 |
1,4-1,6 |
разом |
число дерев |
19 |
68 |
140 |
162 |
85 |
26 |
500 |
Знайти:
а) ймовірність того, що середня кількість деревини в одному дереві в усьому лісовому масиві і у вибірці відрізняються за абсолютною величиною не більше ніж на 0,02 м3 ;
б) межі, в яких знаходяться середня кількість ділової деревини в одному дереві всього масиву, які можна гарантувати з ймовірністю 0,9973.
Розв’язання.
Для визначення вибіркових середньої та дисперсії складемо розрахункову таблицю.
|
|
середина інтервалу
|
|
|
|
|
|
0,4 |
0,6 |
0,5 |
19 |
-3 |
-57 |
171 |
76 |
0,6 |
0,8 |
0,7 |
68 |
-2 |
-136 |
272 |
68 |
0,8 |
1,0 |
0,9 |
140 |
-1 |
-140 |
140 |
0 |
1,0 |
1,2 |
1,1 |
162 |
0 |
0 |
0 |
162 |
1,2 |
1,4 |
1,3 |
85 |
1 |
85 |
85 |
340 |
1,4 |
1,6 |
1,5 |
26 |
2 |
52 |
104 |
234 |
сума |
|
|
500 |
|
-196 |
772 |
880 |
Контроль: .
.
.
.
.
.
1. Підрахуємо спочатку середню квадратичну похибку для вибіркової середньої:
.
Тоді шукана ймовірність
;
.
2. Знайдемо граничну похибку вибірки за формулою
.
Число визначимо з умови
.
Отже, . Тоді:
.
3. Отже, межами, в яких знаходяться середня кількість ділової деревини в одному дереві всього масиву, які можна гарантувати з ймовірністю 0,9973, будуть числа та , тобто інтервал .
Приклад 4. Знайти надійний (довірчий) інтервал для оцінки з надійністю 0,95 невідомого математичного сподівання нормально розподіленої величини генеральної сукупності, якщо генеральне середнєквадратичне відхилення , вибіркове середнє , а об’єм вибірки .
Розв’язання. Треба знайти довірчий інтервал:
.
Знайдемо із співвідношення
.
За таблицею 2 знайдемо : .
Підставляючи у формулу, знаходимо довірчий інтервал:
;
.
Приклад 5. Знайти мінімальний об’єм вибірки, при якому з надійністю 0,975 точність оцінки математичного сподівання генеральної сукупності за вибірковим середнім дорівнює , якщо відоме середнє квадратичне відхилення нормально розподіленої генеральної сукупності.
Розв’язання. Скористаємось формулою, яка визначає точність оцінки (граничну похибку) математичного сподівання генеральної сукупності за вибірковим середнім
,
звідки
.
За умовою .
За таблицею значень
,
звідки .
Підставляючи дані значення, знайдемо шуканий об’єм вибірки:
.