Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

архив прош.сесий / Tochkovi_ta_interv_otsinki_2014

.pdf
Скачиваний:
8
Добавлен:
19.02.2016
Размер:
451.4 Кб
Скачать

1

Точкові та інтервальні оцінки параметрів розподілу

Поняття про основні задачі та методи математичної статистики

Математична статистика - наука, яка за допомогою математичних ме-

тодів встановлює закономірності масових явищ, їхні взаємозв'язки, система-

тизує та обробляє результати експериментів. В математичній статистиці ма-

совим називається явище, яке описується сукупністю однорідних елементів,

що мають деякі спільні властивості. Завдання математичної статистики поля-

гає у тому, щоб за результатами обмеженого числа спостережень над масо-

вими явищами скласти уявлення про ті ймовірнісні закономірності, яким ці явища підлягають, і передбачити протікання їх у майбутньому. Математична статистика базується на поняттях та методах теорії ймовірностей. В теорії ймовірностей вивчаються різні поняття, пов’язані з випадковими подіями і випадковими величинами; найважливішими з них є поняття ймовірності по-

дії, функції розподілу випадкової величини, математичного очікування тощо.

Але в більшості випадків, що зустрічаються на практиці, точне значення ймовірності або точний вираз функції розподілу нам невідомі. Тому постає питання про їх експериментальне визначення.

Предметом математичної статистики є розробка методів реєстрації,

опису та аналізу статистичних експериментальних даних, отриманих в ре-

зультаті спостережень масових випадкових явищ, щоб у подальшому отри-

мати науково обґрунтовані практичні висновки. Використання фактично отриманих даних і є особливою рисою статистичного методу.

Генеральною сукупністю в математичній статистиці називається мно-

жина однотипних об’єктів, кількісна чи якісна ознака яких підлягає вивчен-

ню. Підмножина об’єктів, дібраних у відповідний спосіб із генеральної суку-

пності, називається вибірковою сукупністю.

2

Число одиниць (елементів) статистичної сукупності називається її

об’ємом. Об’єм генеральної сукупності позначають N, а об’єм вибіркової су-

купності – n. Якщо об’єм сукупності великий, то його вважають рівним не-

скінченності.

Випадкова вибірка з n елементів – це такий відбір, при якому елементи вилучаються по одному з усієї генеральної сукупності і кожний з них має од-

накові шанси бути відібраним. Вимога випадковості забезпечується відбором за таблицями випадкових чисел чи за жеребом. Така вибірка називається ви-

падковою. Одним з прикладів використання власне-випадкової вибірки є проведення тиражів виграшів грошово-речових лотерей, при яких забезпечу-

ється однакова можливість попадання в тираж будь-якого номера лотерейно-

го білета. За способом відбору елементів розрізняють два типи випадкових вибірок: випадкова повторна (вилучений у вибірку елемент реєструється і повертається до генеральної сукупності, звідки знову може бути вилучений випадковим чином); випадкова безповторна (вилучений елемент не повер-

тається до генеральної сукупності після реєстрації). Але незалежно від спо-

собу організації вибірки вона повинна являти собою зменшену копію генера-

льної сукупності, тобто бути представницькою (репрезентативною).

Числові характеристики генеральної сукупності, які правило, неві-

домі (середнє значення, дисперсія та інші), називають параметрами генера-

 

 

 

 

льної сукупності (позначають Xген , 2

ген ).

За даними вибірки розраховують числові характеристики, які назива-

~

2

ють статистиками (позначають Xвиб

, виб ). Статистики, які отримують по

різних вибірках, як правило, відрізняються одна від одної. Тому статистика,

отримана за вибіркою, є тільки оцінкою невідомого параметра генеральної сукупності. Оцінка параметра певна числова характеристика, отримана за вибіркою. Коли оцінка визначається одним числом, її називають точковою оцінкою. Як точкові оцінки параметрів генеральної сукупності використо-

3

вують відповідні вибіркові характеристики. Теоретичне обґрунтування можливості використання цих вибіркових оцінок для характеристики генера-

льної сукупності дають закон великих чисел та центральна гранична теорема Ляпунова.

Вважаємо, що досліджувана ознака генеральної сукупності є випадко-

вою величиною Х із функцією розподілу F x (теоретична функція розпо-

ділу). Результати вибірки розглядатимемо як послідовність незалежних одна-

ково розподілених випадкових величин X1, X2 ,..., Xn . Закон розподілу для всіх

X i визначається функцією F x . Результати вибірки — реалізації випадкових величин — позначатимемо відповідно через х1, х2 ,..., хn Розмістивши ці числа в

порядку зростання і записавши частоти ni ,

з якими зустрічаються ці значен-

ня, дістанемо варіаційний, або статистичний, ряд:

 

 

 

 

 

 

 

 

 

 

xi

x1

 

 

x2

 

 

xk

 

 

 

 

 

 

 

 

 

 

 

Частоти

n1

 

 

n2

 

 

nk

 

 

 

 

 

 

 

 

На підставі такого ряду можна побудувати статистичну функцію

розподілу

Fn x

n xi

. Якщо

n , то

статистична функція розподілу

 

 

xi X

 

n

 

 

 

 

збігається до теоретичної функції розподілу.

Статистичний ряд графічно подається полігоном розподілу. Щоб побу-

дувати його, на осі абсцис відкладають значення реалізацій, а на осі ординат

– відповідні їм частоти (або відносні частоти). Здобуті точки сполучають відрізками прямих.

У разі, коли Х — неперервна величина і обсяг вибірки великий, резуль-

тати вибірки подають інтервальним рядом. Для цього область реалізацій розбивають на k інтервалів і для кожного інтервалу визначають частоти. Здо-

бутий ряд геометрично подається гістограмою. Для побудови її на осі абсцис

4

відкладають інтервали, а на них як на основах будують прямокутники, висота яких пропорційна до частоти (відносної частоти) інтервалу. Гістограма дає певне уявлення про графік густини розподілу.

Для вибіркової сукупності обчислюють числові характеристики — вибіркові випадкові функції: вибіркову середню X , вибіркову дисперсію Dв

тощо. Формули зрозрахунку аналогічні тим, які мають місце для відповідних теоретичних характеристик випадкової величини, що розглядаються в базо-

вому курсі теорії ймовірностей.

Для того щоб вибіркові характеристики були ”гарними” оцінками параметрів ге-

неральної сукупності, потрібно, щоб вони мали низку властивостей: незміщеності, ефе-

ктивності, обґрунтованості.

Оцінка Q параметра Q розподілу генеральної сукупності у загальному випадку

є випадковою величиною, яка визначається за даними вибірки і використовується замість невідомого значення параметра, який потрібно оцінити.

 

 

 

 

Оцінка Q називається обґрунтованою, якщо при збільшенні об’єму вибірки n во-

на збігається за ймовірністю до значення параметра Q розподілу генеральної сукупності:

 

p

 

 

)) 1,

0 .

Q Q lim (P

Q Q

 

n

n

 

 

 

 

 

 

 

 

Оцінка Q називається незміщеною, якщо її математичне очікування точно рівне параметру Q для будь-якого об’єму n вибірки:

M(Q) Q, n .

 

 

Незміщена оцінка Q називається ефективною, якщо її дисперсія мінімальна порі-

вняно з дисперсією будь-якої іншої оцінки цього параметра.

 

Всім переліченим властивостям відповідає вибіркова середня. Отже, вибіркова се-

~

Хген .

редня є точковою оцінкою генеральної середньої, тобто Xвиб

5

Генеральна дисперсія має дві точкові оцінки: 2 виб - вибіркова дисперсія;

S2 - ви-

правлена вибіркова дисперсія. 2 виб обчислюється при

n 30,

а S2 - при n 30. При-

чому в математичній статистиці доводиться, що S2

 

n

σ2

 

(поправка

n

 

 

вво-

 

 

 

виб

 

 

 

 

n 1

n 1

 

 

 

 

 

 

 

 

 

 

 

диться для усунення зміщеності у малих вибірках). При великих об’ємах вибірки 2 виб та

S2 практично співпадають.

Генеральне середнє квадратичне відхилення ген також має дві точкові оцінки:

виб - вибіркове середнє квадратичне відхилення та S - виправлене вибіркове середнє

квадратичне відхилення. виб використовується для оцінювання ген

при n 30 , а S для

 

 

 

 

 

оцінювання ген при n 30; при цьому виб

2 виб , а S S2 .

 

Інтервальною оцінкою називають оцінку, яка визначається двома числами – кін-

цями інтервалу, який з певною ймовірністю покриває невідомий параметр генеральної су-

купності– довірчий інтервал.

Інтервал, який містить оцінюваний параметр генеральної сукупності, називають

довірчим інтервалом. Для визначення довірчого інтервалу обчислюють граничну похиб-

ку вибірки , яка дозволяє встановити граничні межі, в яких із заданою ймовірністю (на-

дійністю) має знаходитись параметр генеральної сукупності.

Гранична похибка вибірки рівна t - кратному числу середніх похибок вибірки. Ко-

ефіцієнт t дозволяє встановити, наскільки надійне твердження про те, що заданий інтер-

вал містить параметр генеральної сукупності. Якщо ми виберемо коефіцієнт таким, що твердження в 95% випадків виявиться правильним і тільки в 5% - неправильним, то ми говоримо: зі статистичною надійністю в 95% довірчий інтервал вибіркової статистики містить параметр генеральної сукупності. Статистичній надійності в 95% відповідає дові-

рча ймовірність – 0,95. В 5% випадків твердження „параметр належить довірчому інтерва-

лу” буде неправильним, тобто 5% задає рівень значущості ( ) або 0,05 – ймовірність по-

хибки. Зазвичай в статистиці рівень значущості вибирають таким, щоб він не перевищував

5% ( 0.05 ). Довірча ймовірність та рівень значущості доповнюють один одного до 1 (або 100%) і визначають надійність статистичного твердження.

Для оцінки генеральної середньої або математичного очікування а нормально роз-

поділеної кількісної ознаки Х за вибірковою середньою xB з відомим середнім квадрати-

6

чним відхиленням σген генеральної сукупності (на практиці – при великому об’ємі вибір-

ки, тобто при n 30)

справедлива формула:

 

 

 

 

σ

 

 

 

 

 

 

t

σ

ген

 

) 2 Ф(t) γ ,

 

P(x

 

t

ген

 

а X ген x

 

(1)

B

 

 

 

B

 

 

 

 

 

 

 

n

 

n

 

 

 

 

 

 

 

де t визначається за таблицею функції Лапласа із співвідношення 2 Ф(t) ; n - об’єм

вибірки.

Для оцінки математичного сподівання а (генеральної середньої) нормально

розподіленої кількісної ознаки Х за вибірковою середньою xB з невідомим середнім квад-

ратичним відхиленням генеральної сукупності (на практиці – при малому об’ємі

вибірки, тобто при n 30)

 

та власне-випадковому повторному відборі застосовують

формулу:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s

 

 

 

 

 

 

s

 

) 2 S(t) γ ,

 

P(x

B

t

 

а X ген x

B

t

(2)

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

де t визначається за таблицею Стьюдента (див. додаток) за надійністю та числом сту-

пенів свободи

k n 1;

 

s - виправлене вибіркове середнє квадратичне відхилення; n -

об’єм вибірки;

t

s

 

– гранична похибка.

 

 

 

 

n

 

 

 

 

 

Для оцінки математичного сподівання а (генеральної середньої) нормально розподіленої кількісної ознаки Х за вибірковою середньою xB з невідомим середнім квадратичним відхиленням генеральної сукупності (при малому об’ємі вибірки, тобто при n 30 )

та власне-випадковому безповторному відборі застосовують формулу:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s

 

 

 

n

 

 

 

 

 

s

 

1

n

) 2 S(t) γ ;

 

 

 

 

 

P(x

B

t

 

1

а X ген x

B

t

(3)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

N

 

 

 

 

n

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

s

 

1

 

n

 

– гранична похибка.

 

 

 

 

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

За допомогою довірчого інтервалу можна оцінити не тільки генеральну серед-

ню, але й інші невідомі параметри генеральної сукупності.

Соседние файлы в папке архив прош.сесий