Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Міністерство освіти та науки Україн1.doc
Скачиваний:
42
Добавлен:
02.05.2019
Размер:
9.22 Mб
Скачать

Критерій Пірсона

критерій Пірсона застосовується як для перевірки узгодженості емпіричного розподілу із заданим теоретичним, так і для перевірки узгодженості емпіричних розподілів. Критерій є непараметричним.

У першому випадку критерій служить для перевірки наступних гіпотез:

Н0: розподіл ознаки збігається із заданим теоретичним;

Н1: ознака розподілена за відмінним від заданого законом.

Якщо — емпірична частота варіанти , а , де — ймовірність , а — об’єм вибірки, то величину

називають емпіричним значенням критерію Пірсона. Критичну точку для заданого рівня значущості α і ν ступенів вільності визначають з таблиць критичних значень розподілу (таблиця 4 додатка) або в EXCEL за формулою =ХИ2ОБР(α;ν)).

Кількість ступенів вільності ν визначають за формулою

,

де k — кількість варіант, l — кількість незалежних параметрів розподілу, які визначаються за вибіркою.

Якщо для рівня значущості , то приймається гіпотеза Н0, у випадку, коли для рівня значущості , приймається альтернативна гіпотеза Н1.

Приклад 20. Групі учнів 10–11 класів (90 чоловік) пропонували впорядкувати за важливістю такі риси ідеального учня: І — акуратність, ІІ — самостійність, ІІІ — уважність, ІV — творчість, V — допитливість, VI — активність, VII — обов'язковість, VIII — наполегливість, ІХ — сміливість, Х — відкритість, ХІ — почуття гумору, ХІІ — товариськість, ХІІІ — рішучість, XIV — впевненість у своїх діях, XV — дружелюбність. Результати впорядкування подано в таблиці:

І

ІІ

ІІІ

ІV

V

VI

VII

VIII

IX

X

XI

XII

XIII

XIV

XV

1

18

12

6

0

1

6

2

24

2

3

5

3

0

4

5

2

12

8

9

5

3

7

4

16

7

2

4

3

2

4

4

3

11

6

6

4

5

8

4

7

6

8

5

5

5

7

3

4

10

10

3

2

11

9

2

4

2

6

8

6

6

4

6

5

3

9

6

5

8

11

2

8

5

4

7

11

1

4

5

6

11

8

9

2

10

7

1

3

4

14

4

6

3

7

1

7

6

4

6

5

10

5

5

4

9

7

13

5

3

4

3

8

5

8

10

5

3

6

6

4

1

6

7

6

7

6

10

9

5

5

6

8

7

7

6

3

4

8

6

12

4

7

2

10

2

5

2

9

2

6

11

6

10

6

4

9

7

6

7

11

1

3

8

6

5

2

7

0

11

5

7

5

8

11

12

12

2

3

7

5

9

3

14

3

4

4

10

7

5

6

9

13

2

4

5

6

4

2

12

3

5

6

4

5

7

7

14

14

2

1

2

12

6

10

3

1

13

7

3

4

10

9

6

15

0

4

5

16

6

1

11

4

7

4

3

3

22

4

3

Чи можна стверджувати, що учні не надавали переваги уважності? Чи можна те ж саме стверджувати про наполегливість?

Розв’язання: Якщо наше припущення правильне, то вибір даної ознаки мав би рівномірно розподілитись між п’ятнадцятьма місцями, тобто на кожне місце припало б по шість виборів. Розрахуємо емпіричне значення критерію Пірсона.

Кількість ступенів вільності дорівнює 15 – 1 = 14. Критичні значення для ν = 14 і α = 0,05 та α = 0,01, відповідно дорівнюють та . Оскільки, 10,69 < 23,68, то приймається нульова гіпотеза, яка стверджує, що розподіл виборів ознаки за місцями статистично не відрізняється від рівномірного, тобто в характеристиці ідеального учня опитувані не надали переваги цій ознаці.

Розрахуємо емпіричне значення критерію для восьмої ознаки

Оскільки, 90,33 > 29,14, то розподіл восьмої ознаки за 15 місцями нерівномірний. Можна стверджувати, що більшість опитаних віддавали перевагу цій ознаці ідеального учня.

Для неперервного розподілу порівнюємо емпіричні і теоретичні частоти попадання значень досліджуваної величини у відповідні класи.

Зазначимо, що в цьому випадку статистика тим точніше апроксимується розподілом Пірсона, чим більші є теоретичні частоти у кожному класі. Як правило, вимагається, щоб частоти в кожному класі були не менші, ніж 5. А це іноді вимагає укрупнення класів.

Приклад 21. Чи можна стверджувати, що час, затрачений учнями на розв’язування поставленої задачі (приклад 16), розподілений за нормальним законом?

Розв’язання: Об’єм вибірки п = 124. Побудуємо інтервальний варіаційний ряд, розбивши проміжок [8,195) на 11 інтервалів:

[8; 25)

[25; 42)

[42; 59)

[59; 76)

[76; 93)

[93; 110)

[110; 127)

[127; 144)

[144;161)

[161;178)

[178; 195)

15

38

33

17

9

4

1

4

2

0

1

Оскільки на деяких інтервалах частоти менші, ніж 5, то зробимо укрупнення крайніх інтервалів:

[8; 25)

[25; 42)

[42; 59)

[59; 76)

[76; 93)

[93; 195)

15

38

33

17

9

12

Вибіркове середнє та оцінка стандартного відхилення відповідно дорівнюють . Теоретичні частоти для інтервалу знаходимо за формулою . Отже, для заданих проміжків

[8; 25)

[25; 42)

[42; 59)

[59; 76)

[76; 93)

[93; 195)

ni

15

38

33

17

9

12

fi

13,4

21,4

25,9

23,8

16,6

13,5

Обчислимо емпіричне значення критерію .

Кількість ступенів вільності , бо накладено дві додаткові в’язі для визначення та s. Критичні значення критерію відповідно дорівнюють та . Оскільки 20,66 > 11,35, то гіпотеза про те, що час розв’язання задачі розподілений за нормальним законом з параметрами , відхиляється.

У випадку перевірки узгодженості двох (чи кількох) емпіричних розподілів критерій Пірсона служить для перевірки наступних гіпотез:

Н0: закони розподілів ознак не відрізняються між собою;

Н1: ознаки розподілені за різними законами.

Гіпотеза Н0 у цьому випадку фактично означає, що вибірки належать до однієї генеральної сукупності, тому в якості теоретичних частот у критерії беруть усереднені за сукупністю вибірок частоти. Кількість ступенів вільності визначається за формулою , де k — кількість розрядів ознаки, с — кількість розподілів, що порівнюються.

Приклад 22. За методикою Спілберга опитано дві групи віруючих: формально віруючі християни (ФВХ) та практикуючі християни (ПХ). Розподіл рівня особистісної тривожності у цих групах подано в таблиці.

Низький

Середній

Високий

ПХ

7

22

4

ФВХ

3

10

24

Чи можна стверджувати, що рівень особистісної тривожності в обох групах розподілений однаково?

Розв’язання: Сформулюємо статистичні гіпотези для нашої задачі.

Н0: Відмінності у розподілах рівнів особистісної тривожності є випадковими.

Н1: Відмінності у розподілах рівнів особистісної тривожності закономірні.

Вибірка практикуючих християн містить 33 елементи, а формально віруючих християн — 37 елементів. Тому у припущенні, що вибірки отримані з однієї генеральної сукупності, теоретичні частоти розраховуються так:

Низький

Середній

Високий

ПХ

ФВХ

Обчислимо значення статистики .

Кількість ступенів вільності . Знаходимо критичні значення критерію: , . Оскільки 20,22 > 9,21, то нульова гіпотеза відхиляється. Можемо стверджувати, що відмінності у розподілі рівнів особистісної тривожності в обох групах мають закономірний характер, зокрема у групі формально віруючих християн переважає високий рівень особистісної тривожності.