архив прош.сесий / архив прош.сесий / Tochkovi_ta_interv_otsinki_2014
.pdf1
Точкові та інтервальні оцінки параметрів розподілу
Поняття про основні задачі та методи математичної статистики
Математична статистика - наука, яка за допомогою математичних ме-
тодів встановлює закономірності масових явищ, їхні взаємозв'язки, система-
тизує та обробляє результати експериментів. В математичній статистиці ма-
совим називається явище, яке описується сукупністю однорідних елементів,
що мають деякі спільні властивості. Завдання математичної статистики поля-
гає у тому, щоб за результатами обмеженого числа спостережень над масо-
вими явищами скласти уявлення про ті ймовірнісні закономірності, яким ці явища підлягають, і передбачити протікання їх у майбутньому. Математична статистика базується на поняттях та методах теорії ймовірностей. В теорії ймовірностей вивчаються різні поняття, пов’язані з випадковими подіями і випадковими величинами; найважливішими з них є поняття ймовірності по-
дії, функції розподілу випадкової величини, математичного очікування тощо.
Але в більшості випадків, що зустрічаються на практиці, точне значення ймовірності або точний вираз функції розподілу нам невідомі. Тому постає питання про їх експериментальне визначення.
Предметом математичної статистики є розробка методів реєстрації,
опису та аналізу статистичних експериментальних даних, отриманих в ре-
зультаті спостережень масових випадкових явищ, щоб у подальшому отри-
мати науково обґрунтовані практичні висновки. Використання фактично отриманих даних і є особливою рисою статистичного методу.
Генеральною сукупністю в математичній статистиці називається мно-
жина однотипних об’єктів, кількісна чи якісна ознака яких підлягає вивчен-
ню. Підмножина об’єктів, дібраних у відповідний спосіб із генеральної суку-
пності, називається вибірковою сукупністю.
2
Число одиниць (елементів) статистичної сукупності називається її
об’ємом. Об’єм генеральної сукупності позначають N, а об’єм вибіркової су-
купності – n. Якщо об’єм сукупності великий, то його вважають рівним не-
скінченності.
Випадкова вибірка з n елементів – це такий відбір, при якому елементи вилучаються по одному з усієї генеральної сукупності і кожний з них має од-
накові шанси бути відібраним. Вимога випадковості забезпечується відбором за таблицями випадкових чисел чи за жеребом. Така вибірка називається ви-
падковою. Одним з прикладів використання власне-випадкової вибірки є проведення тиражів виграшів грошово-речових лотерей, при яких забезпечу-
ється однакова можливість попадання в тираж будь-якого номера лотерейно-
го білета. За способом відбору елементів розрізняють два типи випадкових вибірок: випадкова повторна (вилучений у вибірку елемент реєструється і повертається до генеральної сукупності, звідки знову може бути вилучений випадковим чином); випадкова безповторна (вилучений елемент не повер-
тається до генеральної сукупності після реєстрації). Але незалежно від спо-
собу організації вибірки вона повинна являти собою зменшену копію генера-
льної сукупності, тобто бути представницькою (репрезентативною).
Числові характеристики генеральної сукупності, які правило, неві-
домі (середнє значення, дисперсія та інші), називають параметрами генера-
|
|
|
|
льної сукупності (позначають Xген , 2 |
ген ). |
||
За даними вибірки розраховують числові характеристики, які назива- |
|||
~ |
2 |
||
ють статистиками (позначають Xвиб |
, виб ). Статистики, які отримують по |
різних вибірках, як правило, відрізняються одна від одної. Тому статистика,
отримана за вибіркою, є тільки оцінкою невідомого параметра генеральної сукупності. Оцінка параметра – певна числова характеристика, отримана за вибіркою. Коли оцінка визначається одним числом, її називають точковою оцінкою. Як точкові оцінки параметрів генеральної сукупності використо-
3
вують відповідні вибіркові характеристики. Теоретичне обґрунтування можливості використання цих вибіркових оцінок для характеристики генера-
льної сукупності дають закон великих чисел та центральна гранична теорема Ляпунова.
Вважаємо, що досліджувана ознака генеральної сукупності є випадко-
вою величиною Х із функцією розподілу F x (теоретична функція розпо-
ділу). Результати вибірки розглядатимемо як послідовність незалежних одна-
ково розподілених випадкових величин X1, X2 ,..., Xn . Закон розподілу для всіх
X i визначається функцією F x . Результати вибірки — реалізації випадкових величин — позначатимемо відповідно через х1, х2 ,..., хn Розмістивши ці числа в
порядку зростання і записавши частоти ni , |
з якими зустрічаються ці значен- |
||||||||
ня, дістанемо варіаційний, або статистичний, ряд: |
|||||||||
|
|
|
|
|
|
|
|
|
|
xi |
x1 |
|
|
x2 |
|
… |
|
xk |
|
|
|
|
|
|
|
|
|
|
|
Частоти |
n1 |
|
|
n2 |
|
… |
|
nk |
|
|
|
|
|
|
|
|
|||
На підставі такого ряду можна побудувати статистичну функцію |
|||||||||
розподілу |
Fn x |
n xi |
. Якщо |
n , то |
статистична функція розподілу |
||||
|
|||||||||
|
xi X |
|
n |
|
|
|
|
збігається до теоретичної функції розподілу.
Статистичний ряд графічно подається полігоном розподілу. Щоб побу-
дувати його, на осі абсцис відкладають значення реалізацій, а на осі ординат
– відповідні їм частоти (або відносні частоти). Здобуті точки сполучають відрізками прямих.
У разі, коли Х — неперервна величина і обсяг вибірки великий, резуль-
тати вибірки подають інтервальним рядом. Для цього область реалізацій розбивають на k інтервалів і для кожного інтервалу визначають частоти. Здо-
бутий ряд геометрично подається гістограмою. Для побудови її на осі абсцис
4
відкладають інтервали, а на них як на основах будують прямокутники, висота яких пропорційна до частоти (відносної частоти) інтервалу. Гістограма дає певне уявлення про графік густини розподілу.
Для вибіркової сукупності обчислюють числові характеристики — вибіркові випадкові функції: вибіркову середню X , вибіркову дисперсію Dв
тощо. Формули зрозрахунку аналогічні тим, які мають місце для відповідних теоретичних характеристик випадкової величини, що розглядаються в базо-
вому курсі теорії ймовірностей.
Для того щоб вибіркові характеристики були ”гарними” оцінками параметрів ге-
неральної сукупності, потрібно, щоб вони мали низку властивостей: незміщеності, ефе-
ктивності, обґрунтованості.
Оцінка Q параметра Q розподілу генеральної сукупності у загальному випадку
є випадковою величиною, яка визначається за даними вибірки і використовується замість невідомого значення параметра, який потрібно оцінити.
|
|
|
|
||
Оцінка Q називається обґрунтованою, якщо при збільшенні об’єму вибірки n во- |
|||||
на збігається за ймовірністю до значення параметра Q розподілу генеральної сукупності: |
|||||
|
p |
|
|
)) 1, |
0 . |
Q Q lim (P |
Q Q |
||||
|
n |
n |
|
|
|
|
|
|
|
|
Оцінка Q називається незміщеною, якщо її математичне очікування точно рівне параметру Q для будь-якого об’єму n вибірки:
M(Q) Q, n .
|
|
Незміщена оцінка Q називається ефективною, якщо її дисперсія мінімальна порі- |
|
вняно з дисперсією будь-якої іншої оцінки цього параметра. |
|
Всім переліченим властивостям відповідає вибіркова середня. Отже, вибіркова се- |
|
~ |
Хген . |
редня є точковою оцінкою генеральної середньої, тобто Xвиб |
5
Генеральна дисперсія має дві точкові оцінки: 2 виб - вибіркова дисперсія; |
S2 - ви- |
|||||||||
правлена вибіркова дисперсія. 2 виб обчислюється при |
n 30, |
а S2 - при n 30. При- |
||||||||
чому в математичній статистиці доводиться, що S2 |
|
n |
σ2 |
|
(поправка |
n |
|
|
вво- |
|
|
|
|
виб |
|
|
|
||||
|
n 1 |
n 1 |
||||||||
|
|
|
|
|
||||||
|
|
|
|
|
|
диться для усунення зміщеності у малих вибірках). При великих об’ємах вибірки 2 виб та
S2 практично співпадають.
Генеральне середнє квадратичне відхилення ген також має дві точкові оцінки:
виб - вибіркове середнє квадратичне відхилення та S - виправлене вибіркове середнє
квадратичне відхилення. виб використовується для оцінювання ген |
при n 30 , а S для |
||||
|
|
|
|
|
|
оцінювання ген при n 30; при цьому виб |
2 виб , а S S2 . |
|
Інтервальною оцінкою називають оцінку, яка визначається двома числами – кін-
цями інтервалу, який з певною ймовірністю покриває невідомий параметр генеральної су-
купності– довірчий інтервал.
Інтервал, який містить оцінюваний параметр генеральної сукупності, називають
довірчим інтервалом. Для визначення довірчого інтервалу обчислюють граничну похиб-
ку вибірки , яка дозволяє встановити граничні межі, в яких із заданою ймовірністю (на-
дійністю) має знаходитись параметр генеральної сукупності.
Гранична похибка вибірки рівна t - кратному числу середніх похибок вибірки. Ко-
ефіцієнт t дозволяє встановити, наскільки надійне твердження про те, що заданий інтер-
вал містить параметр генеральної сукупності. Якщо ми виберемо коефіцієнт таким, що твердження в 95% випадків виявиться правильним і тільки в 5% - неправильним, то ми говоримо: зі статистичною надійністю в 95% довірчий інтервал вибіркової статистики містить параметр генеральної сукупності. Статистичній надійності в 95% відповідає дові-
рча ймовірність – 0,95. В 5% випадків твердження „параметр належить довірчому інтерва-
лу” буде неправильним, тобто 5% задає рівень значущості ( ) або 0,05 – ймовірність по-
хибки. Зазвичай в статистиці рівень значущості вибирають таким, щоб він не перевищував
5% ( 0.05 ). Довірча ймовірність та рівень значущості доповнюють один одного до 1 (або 100%) і визначають надійність статистичного твердження.
Для оцінки генеральної середньої або математичного очікування а нормально роз-
поділеної кількісної ознаки Х за вибірковою середньою xB з відомим середнім квадрати-
6
чним відхиленням σген генеральної сукупності (на практиці – при великому об’ємі вибір-
ки, тобто при n 30) |
справедлива формула: |
|
|||||||||||||
|
|
|
σ |
|
|
|
|
|
|
t |
σ |
ген |
|
) 2 Ф(t) γ , |
|
P(x |
|
t |
ген |
|
а X ген x |
|
(1) |
||||||||
B |
|
|
|
B |
|
|
|
||||||||
|
|
||||||||||||||
|
|
n |
|
n |
|
||||||||||
|
|
|
|
|
|
де t визначається за таблицею функції Лапласа із співвідношення 2 Ф(t) ; n - об’єм
вибірки.
Для оцінки математичного сподівання а (генеральної середньої) нормально
розподіленої кількісної ознаки Х за вибірковою середньою xB з невідомим середнім квад-
ратичним відхиленням генеральної сукупності (на практиці – при малому об’ємі
вибірки, тобто при n 30) |
|
та власне-випадковому повторному відборі застосовують |
|||||||||||||
формулу: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
s |
|
|
|
|
|
|
s |
|
) 2 S(t) γ , |
|
||
P(x |
B |
t |
|
а X ген x |
B |
t |
(2) |
||||||||
|
|
|
|
|
|
||||||||||
|
|
|
|||||||||||||
|
|
n |
|
|
|
|
|
n |
|
||||||
|
|
|
|
|
|
|
|
|
|
де t визначається за таблицею Стьюдента (див. додаток) за надійністю та числом сту-
пенів свободи |
k n 1; |
|
s - виправлене вибіркове середнє квадратичне відхилення; n - |
||
об’єм вибірки; |
t |
s |
|
– гранична похибка. |
|
|
|
|
|||
|
n |
||||
|
|
|
|
|
Для оцінки математичного сподівання а (генеральної середньої) нормально розподіленої кількісної ознаки Х за вибірковою середньою xB з невідомим середнім квадратичним відхиленням генеральної сукупності (при малому об’ємі вибірки, тобто при n 30 )
та власне-випадковому безповторному відборі застосовують формулу:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
s |
|
|
|
n |
|
|
|
|
|
s |
|
1 |
n |
) 2 S(t) γ ; |
|
||||
|
|
|
|
P(x |
B |
t |
|
1 |
а X ген x |
B |
t |
(3) |
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
n |
|
|
N |
|
|
|
|
n |
|
|
N |
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
t |
s |
|
1 |
|
n |
|
– гранична похибка. |
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
N |
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
За допомогою довірчого інтервалу можна оцінити не тільки генеральну серед-
ню, але й інші невідомі параметри генеральної сукупності.