Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Звіт вал СС

.pdf
Скачиваний:
3
Добавлен:
23.02.2016
Размер:
2.35 Mб
Скачать

2.2 ( )

2.3( ) |

2.4

( )

неспадною функцією аргументу х, тобто

( )

( )

 

 

2.4 Графічне зображення статистичних розподілів

Полігоном

частот називають ламану, відрізки якої сполучають

точки (x 1,n 1), (x 2,

n 2),..., (x k,n k). Для побудови полігону частот на осі абсцис

відкладають варіанти х i, а на осі ординат – відповідні їм частоти n i.. Точки

(x i, n i) з'єднують відрізками прямих і отримують полігон частот.

Гістограмою частот називають ступінчасту фігуру, яка складається з прямокутників, основами яких є інтервали довжиною h, а висоти дорівнюють

(щільність частоти). Площа гістограми частот дорівнює об’єму вибірки

[4, с.12].

Зауваження 1 Гістограму можна побудувати тільки для інтервального статистичного розподілу.

Зауваження 2 Очевидно, що при збільшенні n можна вибрати все більш малі інтервали (h), при цьому гістограма буде наближатися до деякої кривої,

яка обмежує площу близьку до 1. Ця крива є графіком щільності розподілу випадкової величини X.

Зауваження 3 Полігон і гістограма – аналогічні криві розподілу ознаки

X, а емпірична функція розподілу F * (x) – функція розподілу випадкової вели– чини X.

2.5 Числові характеристики вибіркової сукупності

11

Числові характеристики варіаційних рядів – набір значень, які зображають деякі сталі величини,що подають варіаційний ряд в цілому і відображають властивості, сукупності закономірностей, що вивчаються. До таких числових характеристик відносяться середня величина ряду розподілу,

величини, які відображають варіацію змін – розмах, дисперсія, середнє квад-

ратичне відхилення та інші [4, c.34–42].

Математичне сподівання – це середнє арифметичне значень випадкової величини. Його знайдемо за формулою:

( )

 

∑ ̅

(2.5.1)

 

Дисперсія – це числова характеристика випадкової величини, яка вказує ступінь розсіювання цієї величини навколо її математичного сподівання.

Дисперсія обчислюється за формулою:

∑(

̅)

(2.5.2)

Середнє квадратичне відхилення – індикатор мінливості об’єкта, що

показує на скільки в середньому відхиляються індивідуальні значення ознаки від їх середньої величини.

Середнє квадратичне обчислимо за формулою:

 

√ ( ),

(2.5.3)

Мода – найбільш ймовірне значення випадкової величини.

Випадкова величина, яка має лише одну моду, називається унімодальною.

Випадкова величина, яка має дві і більше моди, називається полі – модальною.

Моду обчислюємо за формулою [3, c.14]:

12

, (2.5.4)

де початок модального інтервалу;

довжина модального інтервалу;

частота модального інтервалу

частота інтервалу, що передує модальному;

частота інтервалу, що після модального.

Медіана – варіанта, що поділяє варіаційний ряд на дві рівні частини за кількістю варіант.

Медіана обчислюється за наступною формулою:

 

(

)

 

,

(2.5.5)

 

 

 

 

 

 

 

( ) (

)

де

 

– довжина інтервалу.

 

 

Коефіцієнт варіації – це характеристика однорідності вибірки.

Визначається за формулою:

 

 

 

 

 

 

 

 

 

,

 

 

 

 

(2.5.6)

 

 

 

 

 

 

Асиметрія – це числова характеристика, яка визначає ступінь скошеності розподілу і обчислюється за формулою:

(2.5.7)

Якщо =0 – розподіл симетричний.

 

Якщо

– правостороння асиметрія (

).

Якщо

– лівостороння асиметрія (

).

13

Ексцес – числова характеристика, яка характеризує «крутість» розподілу та обчислюється за формулою:

 

 

,

(2.5.8)

 

 

 

Ексцес, як правило, використовується

при

дослідженні

неперервних ознак генеральних сукупностей, оскільки він оцінює крутизну

закону розподілу

випадкової величини порівняно з нормальним. Для

нормального закону

.

2.1Абсолютна та відносна похибки

Абсолютна похибка – це абсолютна різниця (модуль різниці) між результатом вимірювання та умовно істинним значенням вимірювальної величини. Абсолютна похибка обчислюється за формулою:

|

̃|

(2.6.1)

де а – істинне значення генеральної сукупності;

̃ – значення числової характеристики вибірки.

Відносна похибка – це відношення абсолютної похибки до істинного значення випадкової величини. Відносну похибку можна знайти за формулою:

 

(2.6.2)

̃

 

2.6Закони розподілу

Звище зазначених законів розподілу найбільш відповідним до генеральної сукупності є нормальний розподіл.

Нормальний розподіл

14

Нормальний закон розподілу відіграє виключно важливу роль в теорії ймовірностей і займає серед інших законів розподілу особливий стан.

Це закон, який найчастіше зустрічається на практиці. Головна особливість, яка виділяє нормальний закон серед інших законів, полягає в тому,

що він є граничним законом, до якого наближаються інші закони розподілу.

Нормальний розподіл – розподіл ймовірностей випадкової величини, що характеризуються де математичне сподівання,

дисперсія випадкової величини. Параметр також відомий, як стандартний відхил. Розподіл із μ = 0 та σ 2 = 1 називають стандартним нормальним розподілом.

2.7Статистичні гіпотези

Для практичного використання методів теорії вірогідності та математи-

чної статистики знання закона розподілу є дуже важливим. Знаючи закон розподілу, можливо вирішувати безліч практичних завдань. Саме тому будь яка обробка результатів досліджень повинна починатись з відповіді на питання:

котрий закон розподілу відповідає наявній вибірці.

Ця проблема, зазвичай, вирішується за допомогою створення гіпотез.

Статистична гіпотеза – це припущення, що висувається щодо особливостей розподілу ймовірностей випадкової величини, яке перевіряється за результатами спостережень над нею.

Перевірка будь–якої статистичної гіпотези виконується наступним

чином:

по наявній вибірці підраховується статистичний критерій;

на основі принципу значущості встановлюється рівень значущості – най-

більше значення вірогідності, котре несумісне з визнанням випадковості експериментально обчисленого значення статистики критерію [5, 202-203].

Перевіряєма гіпотеза називається нульовою та позначається як .

Конкуруючу (альтернативну) гіпотезу називають

15

Існують як прості, так і складні гіпотези. Простою називають гіпотезу,

яка містить всього одне припущення. Складною – яка складається зі скінчен-

ного або нескінченного числа простих гіпотез.

Статистичним критерієм називають випадкову величину k, яка слугує

для перевірки гіпотези.

Емпіричним критерієм називають те значення критерію, яке обчислено

по вибірках.

Критичною областю називають сукупність значень критерію, при яких

нульову гіпотезу приймають.

Областю прийняття гіпотези називають сукупність значень критерію,

при яких нульову гіпотезу приймають.

 

Правосторонньою називають критичну область, яка визначається нерів-

ністю

, де

– додатнє число.

 

Лівосторонньою називають критичну область, яка визначається нерів-

ністю

, де

– від’ємне число.

2.8 Критерії узгодження Критерій узгодження Пірсона ( )

Критерій ґрунтується на порівнянні емпіричної гістограми розподілу випадкової величини з її теоретичною густиною. Діапазон зміни експери-

ментальних даних розбивається на k інтервалів, та розраховується статистика

[5, c.204–209]:

( )

( )

 

де – кількість значень випадкової величини, що входять в i-тий інтервал;

16

( ) – гіпотетичний теоретичний закон розподілу випадкової

величини;

 

 

 

 

(

)

( ) – теоретична вірогідність потрапляння випадкової

величини в і-тий інтервал.

 

 

Для знаходження

необхідно знайти ступінь свободи за

формулою:

 

 

 

 

 

 

 

 

(2.9.2)

За [6] знаходимо значення

при

. За умови, якщо

, то H0

відхиляється з достовірністю (

).

Критерій Колмогорова – Смірнова У статистиці критерій узгодження Колмогорова (також відомий, як

критерій згоди Колмогорова - Смірнова) [5, c. 214-216] використовується для того, щоб визначити, чи підпорядковуються два емпіричних розподіли одному закону, або визначити, чи підпорядковується отриманий розподіл передбачу-

ваній моделі.

Критерій Колмогорова - Смірнова про перевірку гіпотези на однорід-

ність двох емпіричних законів розподілу є одним з основних і найбільш широко використовуваних непараметричних методів тому, що досить чутливий до від-

мінностей у досліджуваних вибірках.

Цей критерій також дозволяє оцінити суттєвість відмінностей між двома вибірками, у тому числі можливе його застосування для порівняння емпіричного розподілу з теоретичним.

Алгоритм критерію

1)записуємо інтервальний ряд ni 5;

2)знаходимо середини інтервалів за формулою (2.9.2);

3)записуємо щільність розподілу f(x,c);

4)знаходимо параметри c;

5)записуємо F(x), f(x);

6)знаходимо

17

 

 

 

 

 

 

(

 

),

(2.9.3)

7)

Шукаємо .

 

 

 

 

 

8)

Шукаємо

різницю між

 

накопиченими

частотами відповідного

порядку

 

 

 

 

 

 

 

 

 

 

 

di

 

Swi

 

Swi

 

,

(2.9.4)

 

 

 

 

 

 

 

 

 

9)

Знаходимо

;

 

 

 

 

 

 

 

10)

За таблицями критерію знаходимо

( );

 

11)

Якщо

< ( ) H0 приймається.

 

18

Розділ 3

Хід роботи

3.1Підготовка даних до подальшої обробки

Отримано генеральну сукупність, округлено отримані значення до 4

знаків після коми (табл. А.1). Створено вибірки ВБВ, ВПВ, ВМВ та ВГВ на 200

елементів кожна, а також МБВ, МПВ, ММВ, МГВ на 25 елементів кожна (табл.

B.1–B.8).

Знайдено мінімальний та максимальний елементи для кожної вибірки та генеральної сукупності. Знайдено крок розбиття вибірки на інтервали [див.

формулу (2.2.1)].

Велика вибірка (200 од.) методом випадкового безповторного

відбору При побудові інтервального ряду з великої вибірки методом

випадкового повторного не була виконана умова, при якій в кожному інтервалі має міститись 5 та більше значень. Було вирішино скоротити вибірку до 185

елементів. Після зменшення кількості елементів до 185, всі умови були виконані. За отриманим інтервальним рядом було побудовано необхідні гістограми частот, графік полігону та емпірична функція розподілу.

Велика вибірка (200 од.) методом випадкового повторного

відбору При побудові інтервального ряду з великої вибірки методом

випадкового повторного не була виконана умова, при якій в кожному інтервалі має міститись 5 та більше значень. Було вирішино скоротити вибірку до 185

елементів. Після зменшення кількості елементів до 185, всі умови були виконані. За отриманим інтервальним рядом було побудовано необхідні гістограми частот, графік полігону та емпірична функція розподілу.

Велика вибірка (200 од.) методом механічного відбору Побудова інтервального ряду методом механічного відбору виявила не

виконання первинно заданої умови. Також останні інтервали містили значення в межах 0-1. Саме тому було прийняте рішення зменшення верхньої межі

19

інтервального ряду. Згідно з правил зменшення верхньої межі інтервального ряду (не меньше 20% тобто 40 елементів) було поступово досягнуто 199 ел.

Велика вибірка (200 од.) методом групового відбору При побудові інтервального ряду з групової вибірки не була виконана

умова, при якій в кожному інтервалі має міститись 5 та більше значень. Було вирішино скоротити вибірку до 199 елементів. Після зменшення кількості елементів до 199, всі умови були виконані. За отриманим інтервальним рядом було побудовано необхідні гістограми частот, графік полігону та емпірична функція розподілу.

3.2Графічне представлення інтервальних рядів

Було проаналізовано полігони частот великих вибірок та зауважено, що ВМВ , ВГВ , ВБВ та ВПВ мають тенденції до поступового зростання,піку та спадання.

β–Розподіл За результатами порівняння полігону ВМВ, ВГВ та кривої β–розподілу

ми точно можемо відкинути даний розподіл.

Рівномірний розподіл За результатами візуального спостереження було виявлено, що даний

розподіл має тенденції монотонної стабільності без будь-яких відхилень, що дало підстави відкинути даний розподіл.

Експоненціальний розподіл За результатами візуального спостереження було виявлено, що даний

розподіл має тенденції повільного спадання і це дало можливість відкинути даний розподіл.

Отже, сказане дає підстави зробити висновок, що ми точно можемо відкинути β–Розподіл, експоненціальний розподіл та рівномірний розподіли.

Логарифмічно–нормальний розподіл мав схожі тенденції тільки з певними вибірками. Внаслідок цього було припущено, що дана генеральна сукупність розподілена за нормальним розподілом.

20