Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Danilyuk_20TV_20i_20MS

.pdf
Скачиваний:
39
Добавлен:
21.02.2016
Размер:
4.66 Mб
Скачать

51

n

m

M X xi pix ,

M Y yj pjy ,

i 1

j 1

n m

xy xi M X yj M Y xi,yj .

i 1 j 1

Обчислення коефіцієнта кореляції проводиться по формулі

 

 

n m

 

 

 

 

 

 

n

 

m

 

 

 

 

 

xi yj xi,yj

 

xi pix

 

yj pjy

 

 

 

rxy

 

i 1 j 1

 

 

 

 

 

i 1

j 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

n

 

 

n

2

m

 

 

m

 

 

 

 

 

 

 

 

 

 

xi2 pix

 

 

xi pix

 

 

 

y2j pjy

yj pjy

 

 

 

 

i 1

 

i 1

 

 

 

j 1

 

j 1

 

 

 

РОЗДІЛ 4. ЕЛЕМЕНТИ МАТЕМАТИЧНОЇ СТАТИСТИКИ

4.1. ПОНЯТТЯ СТАТИСТИЧНОЇ ВИБІРКИ. ВАРІАЦІЙНИЙ РЯД.

Для отримання наукових і практичних висновків, встановлення закономірностей, яким підкоряються масові випадкові явища, необхідні збір і опрацювання статистичних даних – результатів спостерігання за кількісними або якісними критеріями об’єктів, які інтересують дослідника.

Інколи проводиться обстеження кожного об’єкту з деякої сукупності об’єктів відносного критерію, який інтересує дослідника. Якщо сукупність містить дуже велике число об’єктів або дослідження об’єкту зв’язане з його руйнуванням або знищенням, то провести дослідження кожного об’єкту важко, а деколи і просто не можливо. В таких випадках із всієї сукупності об’єктів випадковим чином вибирають їх облажену кількість і обстежують тільки вибрані об’єкти.

Вибіркова сукупність (статистична вибірка) – сукупність випадково відібраних об’єктів.

Генеральна сукупність сукупність об’єктів, з якої проводиться вибірка. Об’єм сукупності (випадковий або генеральний) – число об’єктів даної

сукупності.

Повторною називають вибірку, при якій відібраний об’єкт повертається в генеральну сукупність перед відбором наступного.

Безповоротною називають вибірку, при якій відібраний об’єкт в генеральну сукупність не повертається.

Для того, щоб по даних вибірки можна було достатньо впевнено робити висновки про інтерисуючий достатника критерій генеральної сукупності

52

необхідно, щоб об’єкт правильно його представляли, тобто вибірка повина бути представницькою (репрезативною).

Припустимо, що з генеральной сукупності взята вибірка, в якій значення х1 спостерігалось n1 раз, х2- n2 рази, х3 – n3 рази і т.д. Тоді n ni називається

об’ємом вибірки, значення хі називаються варіантами вибірки, а послідовність варіант, записаних в зростаючому порядку, називається варіаційним рядом.

Числа спостережень називають частотами, а їх відношення до об’єму

вибірки ni i - відносними частотами. n

Статистичним розподілом вибірки називають перелік варіант і відповідних частот або відносних частот. Статистичний розподіл можна задати також у вигляді послідовності інтервалів і відповідних їм частот (в якості, що відповідає інтервалу, приймають суму частот, варіант, що попали в цей інтервал).

Емпіричною функцією розподілу (функцією розподілу вибірки) називають функцію F* x , визначену для кожного значення x відносну частоту події

X x.

Отже, по означенню

F* x nx , n

де nx - число варіант, менших x, n - об’єм вибірки.

 

 

Для наглядності будують різні графіки статистичного розподілу.

 

Полігоном

частот називають ломану,

відрізки

якої з’єднюють точки

x1,n1 , x2,n2 , , xn,nn .

Для

побудови

полігону

частот на осі

абсцис

відкладають варіанти xi ,

а на осі ординат – відповіді їм частоти ni

. Точки

xi,ni з’єднують відрізками прямих і отримують полігон частот.

 

Полігоном

відносних частот

називають ломану,

відрізки якої з’єднюють

точки x1, 1 , x2, 2 , , xk , k .

Задача 4.1.1. Для даного статистичного розподілу знайти емпіричну функцію і побудувати графіки емпіричної функції, полігони частот і відносних частот.

Розв’язання. Емпірична функція розподілу.

 

0,

 

x 1

 

 

2

 

 

 

 

,

1 x 3

 

 

 

20

 

 

*

 

7

 

 

 

 

 

F x

 

, 3 x 5

20

 

 

 

 

 

 

16

,

5 x 7

 

 

 

 

20

 

 

 

7 x

 

 

 

 

1,

 

 

 

 

 

 

53

Графік емпіричної функції розподілу

Полігон частот.

Полігон відносних частот

54

4.2. ВИБІРКОВІ ХАРАКТЕРИСТИКИ (ВИБІРКОВІ СЕРЕДНІ І ДИСПЕРСІЯ)

Нехай потрібно вивчити кількісний критерій генеральної сукупності. Припустимо, що з теоретичних міркувань вдалося встановити, який саме розподіл має критерій. Виникає задача оцінки параметрів, які визначають цей розподіл. В якості оцінок для математичного сподівання і дисперсії можуть служити вибіркові середні і дисперсія.

“Нехай є вибірка із генеральної сукупності об’ємом n, варіанти х1, х2, …, хк

 

 

 

 

k

 

 

 

 

спостерігаються відповідно n1, n2, …,

nк раз, nk

n.Дана вибірка може бути

записана у вигляді

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

варіанта xi

x1

 

x2

 

 

xk

 

варіанта ni

n1

 

n2

 

 

nk

 

Вибірковим середнім називається величина

x n1x1 n2x2 ... nk xx 1 k nixi,

nni 1

авибірковою дисперсією називають величину

 

 

 

 

2

 

1 k

 

 

 

2

 

 

 

1 k 2

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Dв

в

 

 

i 1(xi x)

 

ni

 

 

i 1xi

ni x .

 

 

 

 

n

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Задача 4.2.1. Для вибірки об’ємом

 

n=30 знайти вибіркові середню і

дисперсію

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

варіанта xi

1

 

 

2

 

4

 

 

 

 

5

 

6

8

 

 

варіанта n1

2

 

 

4

 

5

 

 

 

 

9

 

7

3

 

55

Розвязання. Знаходимо

 

 

 

 

1

 

 

 

 

 

1

 

 

 

141

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

xini

 

 

(12 2 4 45 59 67 83)

 

 

4,7;

 

 

 

n

30

30

 

 

 

1

2

 

 

 

2

 

1

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

D

 

xi

ni

x

 

 

 

(12 4 4 165 259 367 643) 4,7

 

 

n

 

30

 

767 4,72 25,566 22,09 3,477. 30

Для спрощення обчислення вибіркових характеристик застосовують різні методики.

А. МЕТОД ДОБУТКІВ ОБЧИСЛЕННЯ ВИБІРКОВИХ СЕРЕДНЬОЇ І ДИСПЕРСІЇ В ВИПАДКУ РІВНОВІДДАЛЕНИХ ВАРІАНТ.

Припустимо, що вибірка задана у вигляді рівновіддалених варіант і відповідних їм частот. В цьому випадку практичніше знаходити вибіркові середню і дисперсію методом добутків з допомогою формул

 

M*h c,

D M* (M*)2

h2

 

x

,

в

1

в

2 1

 

 

де h – крок (різниця між двома сусідніми варіантами); С – хибний нуль

(варіанта, яка має найбільшу частоту); u

i

 

1

(x

i

C)- умовна варіанта;

 

 

h

 

 

M2* 1n niui2 - умовний момент другого порядку.

Як практично користуватися методом добутків, вказано в наступній задачі.

Задача 4.2.2. Знайти методом здобутків вибіркову середню і вибіркову дисперсію по заданому розподілу вибірки об’ємом n=100:

варіанта

xi

12

14

16

18

20

22

варіанта

ni

5

15

50

16

10

4

Розв’язання. Приведемо дані задачі і її розв’язання у вигляді таблиці

x

n

u

nu

nu

2

u 1

ni ui 1

2

i

i

i

i i

 

i

 

 

 

 

 

i i

 

 

 

 

 

 

 

 

 

 

12

5

-2

-10

20

-1

5

 

 

 

 

 

 

 

 

 

14

15

-1

-15

15

0

0

 

 

 

 

 

 

 

 

 

 

16

50

0

0

0

 

1

50

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

56

18

16

1

16

16

2

64

 

 

 

 

 

 

 

 

 

 

 

20

10

2

20

40

3

90

 

 

 

 

 

 

 

 

 

 

 

22

4

3

12

36

4

64

 

 

 

 

 

 

 

 

 

 

 

 

n 100

 

nu 23

nu2 127

 

ni ui 1

2

273

 

 

 

i i

i i

 

 

Для контролю обчислень

ni (ui 1)2 niui2 2 niui n

Контроль: ni(ui 1)2 273,

niui2 2 niui n 127 2 23 100 273.

Співпадання контрольних сум говорить про правильність обчислень.

Обчислюємо тепер умовні моменти першого і другого порядків:

 

*

 

1

 

 

23

 

 

*

1

2

 

127

 

M

1

 

 

niui

 

 

 

0,23;

M

2

 

 

niui

 

 

 

1,27 .

 

100

n

100

 

 

 

n

 

 

 

 

 

 

 

 

Знаходимо крок h (різницю міже любими двома сусідніми варіантами): h=14-12=2.

Обчислюємо тепер шукані вибіркові середню і дисперсію, враховуючи, що хибний нуль (варіанта, має найбільшу частоту) С=16:

xв M1*h C 0,23 2 16 16,46;

Dв M2* (M1*)2 h2 1,27 0,232 4 4,87.

Б. МЕТОД ДОБУТКІВ ОБЧИСЛЕННЯ ВИБІРКОВИХ СЕРЕДНЬОЇ І ДИСПЕРСІЇ В ВИПАДКУ НЕРІВНОВІДДАЛЕНИХ ВАРІАНТ.

Якщо початкові варіанти нерівновіддалені, інтервал, в якому знаходиться всі варіанти вибірки, ділять на декілька рівних, довжиною h, частинних інтервалів. Потім знаходять середини частинних інтервалів, які і утворюють послідовність рівновіддалених варіант. В якості частоти кожної середини

57

інтервалу приймають суму частот варіант, які попали у відповідний частинний інтервал.

При обчисленні вибіркової дисперсії для зменшення помилки, визваної

групуванням, роблять “поправку Шеппорда”, що дорівнює 1 h2 . З врахуванням

12

поправки Шеппорда дисперсія обчислюється так: Dв Dв 1 h2.

12

Задача 4.2.3. Знайти методом добутків вибіркові середню і дисперсію по заданому розподілу вибірки:

Варіанта хі

2

3

7

9

11

12,5

16

18

23

25

26

 

 

 

 

 

 

 

 

 

 

 

 

Частота ni

3

5

10

6

10

4

 

12

13

8

20

 

 

 

 

 

 

 

 

 

 

 

 

Розв’язання. а) Розіб’ємо інтервал (2,26) на наступні 4 частини інтервали

довжиною

h 6: 2 8,8 14,

8-14, 14-20, 20-26; б) Прийнявши середини

частинних

інтервалів в

якості

нових варіант yi , отримаємо рівновіддалені

варіанти:

y1 5,

y2 11,

y3 17,

y4 23. Підставивши відповідні їм частоти

n1 3 5 10 18,

n2 6 10 4 20,

n3 12 13 25,

n4 8 20 9 37,

будемо

мати розподіл

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

варіанта yi

 

5

 

11

 

17

 

23

 

 

 

 

 

 

 

 

 

 

 

 

 

частота ni

 

18

 

20

 

25

 

37

 

 

 

 

 

 

 

 

 

 

 

 

в) Користуючись методом добутків для рівновіддалених варіант, знаходимо yв 15,86, Dв 45,14.

З врахування поправки Шеппорда, маємо

D45,14 1 62 42,14.

в12

Задачі для самостійного розв’язання.

Задача 4.2.4. Знайти методом добутків вибіркові середню і дисперсію по заданому розподілу:

А)

варіанта х1

7

7,3

7,6

7,9

8,2

8,5

 

 

 

 

 

 

 

частота ni

13

25

41

11

1

9

 

 

 

 

 

 

 

58

Б)

варіанта х1

0,2

 

0,9

 

1,6

 

2,3

3,0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

частота

ni

8

 

12

 

 

35

 

17

28

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

варіанта х1

3,5

 

3,7

 

3,9

 

4,1

 

4,3

 

4,5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

частота

ni

10

 

8

 

17

 

33

 

14

 

18

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Г)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

варіанта х1

78

 

87

 

96

 

105

 

114

 

123

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

частота

ni

4

 

3

 

7

 

10

 

11

 

15

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Задача 4.2.5. Знайти методом добутків вибіркові середню і дисперсію по заданому розподілу нерівновіддалених варіант вибірки

а)

варіанта хi

23

 

 

30,5

 

7

 

 

 

 

18

 

9

 

 

 

11

 

13

20

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

частота

ni

7

 

 

8

 

 

12

 

 

 

 

13

 

10

 

 

 

23

 

7

20

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

б)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

варіанта хi

9

 

20,3

17

 

18,1

 

 

7

 

6

3,5

 

 

4

 

2

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

частота

ni

3

 

6

 

19

 

 

21

 

 

1

 

23

7

 

 

8

 

11

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

варіанта хi

8,1

 

3,2

 

4

 

7

 

10

11

 

13

 

18

 

21,5

3

7,1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

частота

ni

7

 

8

 

10

 

12

 

16

25

 

31

 

1

 

20

 

13

7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4.3. ІНТЕРВАЛЬНІ ОЦІНКИ.

Інтервальною називається оцінка, яка визнається двома числами – кінцями інтервалу, який покриває оцінюваний параметр.

Надійним називається інтервал, який із заданою надійністю (ймовірністю) покриває оцінюваний параметр.

А. Для оцінки математичного споживання, а нормально розподіленого критерія Х по вибірковій середній хв при відомому середньо квадратичному відхиленні генеральної сукупності служить надійний інтервал

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

59

 

 

 

 

 

t

 

 

 

a

 

t

 

 

,

 

(4.3.1)

 

xв

xв

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

де t

 

 

 

- точність оцінки; n - об’єм вибірки; t – таке значення аргументу

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

функції Лапласа Ф(t), при якому (t)

(із цього рівняння визначається по

 

 

 

 

 

 

 

 

 

 

2

 

таблиці значення t).

Б. Для оцінки математичного сподівання, а нормально розподіленого

критерія по вибірковій середній хв

 

при невідомому (і об’єм вибірки n>30)

служить надійний інтервал

s

 

 

 

 

s

 

 

 

 

 

 

 

 

 

 

 

 

 

xв t

 

 

a xв t

 

,

 

 

 

 

 

 

 

 

 

 

n

n

де s – рідправлене середнє квадратичне відхилення,

Sn1 1 i ni(xi xв)2,

аt знаходять по заданих u і з допомогою спеціальних таблиць

(Додаток 2).

В. Для оцінки середнього квадратичного відхилення нормально розподіленого критерія Х з надійністю по підправленому вибірковому середньому квадратичному відхиленню s служить наданні інтервали

S(1 q) S(1 q),q 1;

0 q S(1 q),q 1,

де q знаходять по заданих u і з допомогою спеціальних таблиць (Додаток 3).

Задача 4.3.1. Знайти надійний інтервал для оцінки з надійністю 0,95 невідомого математичного сподівання а нормально розподіленого критерія Х генеральної сукупності, якщо задані об’єм вибірки n=25, вибірка середня хв 14 і середнє квадратичне відхилення 5.

Розв’язання. Будемо користуватись співвідношенням (4.3.1)

 

t

 

 

a

 

t

 

 

xв

xв

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

n

 

Тут невідома величина t. Знайдемо її. Із співвідношення 2 (t) 0,95. Знаходимо (t) 0,475. По таблиці (Додаток 1) знаходимо t=1,96. Підставивши в формулу (17.1) значення n=25, 5, хв 14, t 1,96, будемо мати надійний інтервал

12,04<a<15,96

Задачі для самостійного розв’язання.

Задача 4.3.2. Одним і тим же прибором із середнім квадратичним відхилення випадкових помилок 40м проведемо 5 рівноточних вимірів віддалі від гармати до цілі. Знайти надійний інтервал для оцінки справжньої

60

віддалі а до цілі з надійністю 0,95, знаючи середнє арифметичне результатів вимірів хв 2000м .

Задача 4.3.3. Вибірка із великої партії електроламп містить 100 ламп. Середня тривалість горіння лампи вибірки виявилась рівною 1000 год. Знайти з надійністю 0,95 надійний інтервал для середньої тривалості а горіння лампи всієї партії, якщо відомо, що середнє квадратичне відхилення горіння лампи40 год.

Задача 4.3.4. По даних 16 незалежних рівноточних вимірювань деякої фізичної величини знайдені середнє арифметичне результатів вимірювань хв 42,8 і підправлене середнє квадратичне відхилення S=8. Оцінити справжнє значення вимірюваної величини з надійністю 0,999.

Задача 4.3.5. По даних вибірки об’ємом n=10 із генеральної сукупності нормально розподіленого кількісного критерія знайдено підправлене середнє квадратичне відхилення S=5,1. Знайти надійний інтервал, який покриває генеральне середнє квадратичне відхилення з надійністю 0,999.

4.4.ВИБІРКОВИЙ КОЕФІЦІЄНТ КОРЕЛЯЦІЇ

ІРІВНЯННЯ ПРЯМОЇ ЛІНІЇ РЕГРЕСІЇ.

1.Вибірковий коефіцієнт кореляції rв характеризує тісноту зв’язку між критеріями Х і Y. Для коефіцієнта кореляції має місце оцінка: rв 1; чим

 

ближче

rв

 

 

до одиниці, тим тісніше зв’язані Х і Y. Якщо

rв

близький до

 

нуля, то Х і Y можна вважати незалежними один від одного.

Вибірковий коефіцієнт кореляції

 

rв

 

двох критеріїв Х і Y визначається з

 

 

допомогою формули

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

r

mxy

 

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

1 n

 

 

1

n

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

де

mXY

 

 

 

 

 

(xi x)(yi

y)

 

xi yi

 

 

 

xi yi - емпірична коваріація;

n

 

 

n

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

n i 1

 

 

i 1

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

n

 

 

 

 

2 ,

 

 

 

 

 

 

 

 

X

 

(xi

 

 

 

)2

xi2

 

 

 

 

 

 

 

 

 

 

x

x

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

n i 1

 

 

 

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

n

 

 

 

 

 

2 - вибіркові середні квадратичні відхилення;

Y

 

 

(yi

 

y

)2

yi2

 

y

 

 

n

 

 

 

 

n i 1

 

 

 

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x, y - вибіркові середні критерії в Х і Y відповідно.

Якщо дані спостережень за критеріями Х і Y приведені у вигляді кореляційної таблиці з рівновіддаленими варіантами, то вигідно перейти до умовних варіант

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]