Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

readmsg

.pdf
Скачиваний:
46
Добавлен:
12.02.2016
Размер:
1.48 Mб
Скачать

Так як величина L < 3(0,25 < 3) , то з ймовірністю 0,997 можна стверджувати,

що розподіл господарств за врожайністю озимої пшениці є нормальним.

Всі розглянуті нами критерії згоди дають загальну оцінку ступеня відхилення емпіричного розподілу від нормального, але не визначають його характеру, а тому при суттєвих їх відхиленнях аналіз розподілу доцільно доповнювати характеристиками асиметрії і ексцесу.

Таким чином, для перевірки висунутої гіпотези про відповідність чи невідповідність теоретичного закону розподілу емпіричному можна використати любий із наведених критеріїв, які забезпечують дослідження законів розподілу з різною точністю, надійністю і трудоємкістю.

11.4. Перевірка гіпотези про величину центру розподілу

Припустимо, що ми маємо дані про витрачання повного виду сировини на одиницю продукції до і після модернізації устаткування. До модернізації устаткування таке витрачання становило 30 кг, після модернізації – 28 кг. Середня помилка вибірки 1 кг. Потрібно встановити, чи привела модернізація устаткування до зниження витрат сировини на одиницю продукції.

Нульова гіпотеза заключається в тому, що виробництво продукції до і після модернізації устаткування з точки зору впливу на матеріалоємкість суттєво не змінилось, тобто що між генеральними середніми до і після модернізації устаткування немає суттєвої різниці. Тобто нульова гіпотеза означає, що z 0 = z1 ,

де z 0 і z1 – середнє витрачання сировини на одиницю продукції відповідно до і після модернізації устаткування.

Альтернативна гіпотеза в даному випадку може бути сформульована двояко. 1. Модернізація устаткування веде до зміни витрачання сировини на одинцю

продукції, тобто нульова

гіпотеза заключається в тому, що

 

z

1

z

0 . Приймемо

рішення значущості

α =

0,05 , тоді

Р(

 

 

 

1

 

0

 

)tµ

 

= 0,05, і

 

критична ділянка

 

 

 

 

 

z

z

 

 

 

 

z

 

задається нерівністю

 

 

 

1

 

0

 

 

> tµ

 

.

За таблицями інтегральної функції Лапласа

 

 

z

z

 

 

 

 

 

z

використовуємо коефіцієнт

довір’я

t =1,96. Таким чином,

розмір граничного

211

розходження двох середніх з ймовірністю 0,95, не повинен перевищувати tµz =1,96(1,96 1,00) . Отже, з ймовірністю 0,95 можна стверджувати, що довірчі

межі для генеральної середньої дорівнюватимуть: 28,04 z1 31,96. Середнє

витрачання матеріалів після модернізації устаткування складає 28 кг і попадає в критичну ділянку. Дані спостереження не співпадають з висунутою нульовою гіпотезою про те, що між виробництвом продукції до і після модернізації устаткування відсутні суттєві розбіжності з точки зору їх впливу на матеріалоємкість.

2. Модернізація устаткування веде до зниження витрат сировини на виробництво одиниці продукції, тобто нульова гіпотеза заключається в тому, що z1 < z 0 . В цьому випадку розглядається ділянка великих від’ємних відхилень,

тобто при α = 0,05 (

 

1

<

 

 

0 tµ

 

)=0,05. В цьому варіанті

 

z

z

критична ділянка

z

 

 

 

1 <

 

0 tµ

 

. Нульова гіпотеза не

 

визначається нерівністю

 

z

z

буде відхилятись,

 

z

якщо середні витрати матеріалу на одиницю продукції будуть більші за 28,36 кг (30 1 1,64). Після модернізації устаткування витрачання сировини на одиницю продукції склало 28 кг, тобто з ймовірністю 0,995 можна стверджувати, що нульова гіпотеза повинна бути відхилена і що модернізація устаткування привела до зниження витрачання сировини на виготовлення продукції.

Якщо гіпотеза про величину центру розподілу перевіряється за результатами малої вибірки, то потрібно врахувати, що відношення різниці середніх до

стандартної помилки вибірки t = x1 µx2 має розподіл Стьюдента з п-1

x

ступенями волі. Припустимо, що дані про витрачання сировини на одиницю продукції були отримані за результатами перевірки 17 виробів. За результатами спостережень значення емпіричного середнього кореляційного відношення склало 5,0. Обчислимо величину t-критерію за формулою:

tф =

z1 z0

=

 

 

28 30

 

4

=1,6.

 

 

 

 

 

 

 

 

S

5

 

 

 

 

 

 

 

n 1

212

За таблицею розподілу Стьюдента значення t-критерію для числа для числа ступенів вільності (п-1)=16 і рівня значущості 0,05 дорівнює tT = 2,12. Так як фактичне значення не перевищує табличне [tф < tT (1,6 < 2,12)], то нульова

гіпотеза не відхиляється, тобто у нас відсутні достатні підстави вважати, що модернізація устаткування веде до зниження матеріалоємності.

На наступному прикладі розглянемо перевірку гіпотези про суттєвість різниці двох вибіркових середніх (для випадку малої вибірки).

Маємо дані про живу вагу телят дослідної і контрольної групи в 3-місячному

віці (табл. 11.5.).

 

 

 

 

 

 

Таблиця 11.5

 

Жива вага телят, кг

 

Спостереження

 

дослідна група, х1

контрольна група, х2

 

1

94

 

66

2

99

 

74

3

108

 

78

4

115

 

76

5

99

 

69

6

100

 

75

7

128

 

73

8

96

 

77

9

110

 

70

10

111

 

72

Разом

1060

 

730

Потрібно встановити

різницю між двома середніми живої

ваги телят в

дослідній і контрольній групах і в якій мірі ця різниця викликана згодовуванням в дослідній групі крім незбираного молока ще й канцкормів.

Визначимо середню вагу телят по групах:

~х1 = пх1 = 106010 =106 кг; ~х2 = пх2 = 73010 = 73кг.

Знайдемо різницю між середніми двох вибірок:

ф = ~х1 ~х2 =106 73 = 33кг .

Обчислимо середнє квадратичне відхилення ваги для кожної групи телят:

S

 

 

~

2

988 =10,45 кг;

1

= (x1 x1 )

=

 

n1

1

 

9

 

 

 

213

 

~

2

 

 

S2 =

(x2 x2 )

=

130

= 3,80 кг.

 

n2 1

 

9

 

Розрахуємо середні помилки вибіркових середніх по групах:

µ = S1

= 10,45 = 3,3кг;

µ

2

= S2

= 3,8 =1,2 кг.

1

n1

3,162

 

n2

3,162

 

 

 

Середню помилку різниці двох вибіркових середніх визначаємо за формулою:

µ

12

= µ2

+ µ2

= 3,32 +1,22 = 12,33 = 3,51.

 

1

2

 

Число ступенів вільності двох вибірок буде становити:

(п1 1) + (п2 1) = 9 +9 =18.

При рівні значущості 0,05 і 18 ступенях вільності: tT = 2,1009 2,1.

Гранична помилка для двох вибіркових середніх становитиме:

0,05 = t µ12 = 2,1 3,51 = 7,37 кг.

Порівнявши фактичну різницю між обома середніми ф = 33 кг, з граничною похибкою 0,05 = 7,37 кг, бачимо, що перша значно перевищує другу. Це свідчить про те, що різниця в середній вазі телят в дослідній і контрольній групах зумовлена дією досліджуваного чинника.

До такого самого висновку можна прийти зіставивши фактичне нормоване відхилення з табличним. Для нашого прикладу фактичне нормоване відхилення становить:

tф =

 

ф

=

33,0

= 9,4.

 

 

 

3,51

µ

12

 

 

 

 

 

 

 

 

 

 

Табличне нормоване відхилення

tT

= 2,1 показує максимальну величину

відношень граничних помилок вибіркових середніх до їх середньої помилки. В нашому прикладі фактичне нормоване відхилення значно перевищує табличне, а тому можна зробити висновок, що різниця ваги двох середніх є не випадковою, а цілком достовірна.

214

11.5. Елементи дисперсійного аналізу

Основною метою дисперсійного аналізу є виявлення на основі загальної дисперсії впливу окремих чинників чи умов, які визначають варіацію ознаки. Для оцінки частки варіації, зумовленої тією чи іншою ознакою, сукупність розподіляють на групи за ознакою, вплив якої досліджується. Це дозволяє розкласти загальну варіацію ознаки на дві дисперсії, з яких одна частина варіації визначається впливом чинника, закладеного в основу групування, а друга – варіацією, зумовленою впливом усіх інших чинників, крім того, що вивчається. Отже, згідно з правилом складання дисперсій для розрахунку використовують загальну, міжгрупову і внутрішньогрупову (залишкову) дисперсії.

Загальна дисперсія характеризує варіацію ознаки у статистичній сукупності в результаті впливу усіх чинників, міжгрупова – вплив чинника, покладеного в основу групування, залишкова – впливом усіх інших чинників.

Таким чином, загальна дисперсія результативної ознаки складається з двох частин: міжгрупової та середньої з групових (залишкової).

Для кількісної ознаки зв’язку між явищами на базі матеріалів аналітичного групування вираховують коефіцієнт детермінації і емпіричне кореляційне відношення.

Коефіцієнт детермінації показує ступінь варіації ознаки під впливом чинника покладеного в основу групування. Він визначається як відношення міжгрупової дисперсії до загальної.

η2 = δ 2 ,

σз2

де η2 – коефіцієнт детермінації;

δ 2 – міжгрупова дисперсія;

σз2 – загальна дисперсія.

Критерієм суттєвості і сили зв’язку між факторною і результативною ознаками виступає емпіричне кореляційне відношення, яке визначається за формулою:

η= δ 2 .

σз2

215

Розглянемо приклад. Нехай маємо згруповані дані (5 груп) за стажем робітників-відрядників і їх місячною виробіткою (табл. 11.6).

Таблиця 11.6

Розрахунок міжгрупової дисперсії

 

Групи

 

 

 

 

Середня

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

робітників-

Число

 

 

 

місячна

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

відрядників

робітників,

 

 

виробітка

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

2

 

 

 

 

yi y з

( yi y з )

( yi y з )

fi

за стажем

чол. fi

 

 

 

одного

 

 

 

 

 

роботи,

 

робітника,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

років

 

 

тис. грн.

y

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

І

 

1-4

3

154,67

 

 

 

 

-27,93

780,08

 

2340,25

 

ІІ

 

4-7

6

171,83

 

 

 

 

-10,77

115,99

 

695,96

 

ІІІ

 

7-10

5

191,00

 

 

 

 

8,40

 

 

70,56

 

352,80

 

ІV

 

10-13

4

193,50

 

 

 

 

10,90

118,81

 

475,24

 

V

 

13-16

2

214,00

 

 

 

 

31,40

985,96

 

1971,52

 

 

 

 

 

 

 

з =182,60

 

 

 

 

 

 

 

 

 

 

 

 

 

Разом:

20

 

y

 

 

 

 

х

 

 

х

 

5936,17

 

 

 

Міжгрупову дисперсію визначаємо за формулою:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

δ 2 =

(

 

і

 

з )2 fi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

у

у

 

=

5936,17

= 291,81.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

fi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

20

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Обчислимо загальну дисперсію за формулою:

σз2 = y2 ( y)2 = 33666,40 33342,76 = 323,64.

Визначимо коефіцієнт детермінації і емпіричне кореляційне відношення:

η

2

=

δ 2

=

 

291,81

= 0,9, або 90 %;

 

σз2

323,64

 

 

 

 

 

 

 

η =

δ 2

=

291,81

= 0,9 = 0,95.

 

σ з2

323,64

 

 

 

 

 

 

Коефіцієнт детермінації показує, що середня місячна виробітка робітниківвідрядників на 90 % залежить від стажу їх роботи і на 10 % від інших чинників.

Емпіричне кореляційне відношення свідчить про те, що зв'язок між стажем роботи і середньою місячною виробіткою робітників-відрядників дуже сильний.

Емпіричне кореляційне відношення повинно мати високий рівень надійності. Для оцінки надійності кореляційних характеристик використовують критерій Р. Фішера (F-критерій), або Стьюдента (t-критерій).

216

Критерій Р. Фішера (F-критерій) визначається за формулою:

 

 

F =

δ 2

 

k

2

, або

F =

δ 2

k

2

,

 

 

 

 

 

 

 

 

 

 

 

 

ф

2

 

k

1

 

ф

2

k1

 

 

 

σі

 

 

 

 

σі

де δ 2

– міжгрупова дисперсія;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σі2

– середня групова (залишкова) дисперсія;

 

 

 

 

 

k1 , k2 – ступені вільності для великої і малої дисперсії.

Р. Фішер встановив розподіл відношень дисперсій і розробив відповідні математичні таблиці. В них наводиться F-критерій теоретичний ( FT ) при двох ймовірностях 0,95 і 0,99. Якщо Fф > FT , то з прийнятим ступенем ймовірності можна стверджувати про наявність впливу чинника, який вивчається. Коли ж

Fф FT , можна стверджувати, що різниця між дисперсіями обумовлена впливом

випадкових чинників.

Розподіл в таблицях Фішера для знаходження FT залежить від ступенів вільності міжгрупової ( k1 ) і середньої з групових ( k2 ) дисперсій. В аналітичному групуванні вони обчислюються за формулами:

 

 

 

 

 

k1 = т1;

k2 = пт,

де п – кількість елементів досліджуваної сукупності;

т – число груп.

 

 

За даними нашого прикладу:

 

 

 

 

 

 

 

 

=σ з2 δ 2

 

 

 

 

 

 

 

 

σі2

 

= 323,64 291,81 = 31,83.

Тоді F

=

δ 2

 

k2

=

291,81 15

= 34,38.

 

 

 

 

 

ф

σі2

 

k1

 

31,83 4

 

 

Для оцінки отриманого відношення, його порівнюють з табличним.

Ступінь вільності для великої (міжгрупової) дисперсії k1 = т1 = 5 1 = 4, для малої (внутрішньогрупової) – k2 = пт = 20 5 =15.

Знаходимо FT при ймовірності 0,95 і даних ступенях вільності по математичній таблиці Р. Фішера. Воно становить FT ( 0 , 95 ) = 3,06 .

217

3(tη < 3),

Таким чином Fф > FT (34 ,38 > 3,06 ) , що свідчить про суттєвість впливу стажу роботи робітників-відрядників на середньомісячну виробітку.

До аналогічного висновку можна прийти за оцінкою надійності кореляційного відношення за критерієм Стьюдента (t-критерієм), який визначається за формулою:

tη = µη ,

η

де µη – середня похибка кореляційного відношення.

Вона визначається за формулою:

µη = 1 ηη2 .

Якщо критерій Стьюдента дорівнює або більший 3(tη 3) показник

кореляційного відношення вважають вірогідним (тобто зв'язок між досліджуваними явищами є доведеним). Якщо ж цей критерій менший то не можна зробити висновок про вірогідність зв’язку між досліджуваними явищами.

Для нашого прикладу:

µ

=

1 η2

=

1 0,9

= 0,1026;

t

=

η

=

0,9487

= 9,25.

 

0,95

µη

0,1026

η

 

η

 

 

η

 

 

 

Так як критерій Стьюдента значно більший за 3, то кореляційне відношення вважається вірогідним, а зв'язок між стажем роботи робітників-відрядників і середньомісячною виробіткою доведеним.

218

Тематичний план з курсу «Статистика»

Номер

Назва теми

Кількість годин

теми

 

лекційних

практичних

Тема 1.

Статистика як наука. Статистичне

4

2

 

спостереження.

6

 

Тема 2.

Зведення і групування статистичних

4

 

даних. Статистичні таблиці.

4

 

Тема 3.

Абсолютні, відносні та середні

6

 

величини.

4

 

Тема 4.

Показники варіації.

4

Тема 5.

Ряди розподілу.

6

6

Тема 6.

Статистичні методи вимірювання

6

6

 

взаємозв’язку.

6

 

Тема 7.

Ряди динаміки.

6

Тема8.

Індекси.

4

6

Тема 9.

Вибіркове спостереження.

4

6

Тема 10.

Статистичні графіки.

4

4

Тема 11.

Статистична перевірка гіпотез.

4

4

Разом:

48

48

219

Глосарій

1.Абсолютний показник – це показник у формі абсолютної величини, яка відображає фізичні властивості, часові та вартісні характеристики соціальноекономічних процесів та явищ.

2.Агрегатний індекс – складний відносний показник, що характеризує середню зміну соціально-економічних явищ, але досліджується з декількох видів одиниць (однорідних або неоднорідних).

3.Відносний показник – показник у формі відносної величини; результат порівняння одного абсолютного показника з іншими; характеризує співвідношення між кількісними характеристиками процесів і явищ, що вивчаються, чи міру кількісного співвідношення різнойменних чи однойменних показників.

4.Групування в статистиці – це розподіл одиниць об’єкта спостереження на однорідні групи за суттєвими для них ознаками.

5.Зведений (загальний) індекс – показник, що характеризує динаміку складного явища, елементи якого не підлягають безпосередньому підсумовуванню в часі, просторі чи порівняно з планом.

6.Звітність – це форма спостереження, при якій кожний об’єкт діяльності подає свої дані в державні органи статистик та відомств у вигляді документів, звітів соціально затвердженої теми.

7.Зведення – це науково організована обробка матеріалів спостереження (згідно з наперед розробленою програмою), яка містить систематизацію, класифікацію або групування матеріалу, складання таблиць, отримання підсумкових результатів і похідні показники (середні, відносні величини і т.д.).

8.Зведення – це комплекс послідовних операцій, спрямованих на упорядкування первинного статистичного матеріалу з метою виявлення характерних рис та певних типових знак тих чи інших явищ, а також закономірностей процесі, що досліджуються.

9.Індекс – це відносний показник, що характеризує зміну рівня будь-якого явища чи процесу в часі, просторі або порівняно з планом, нормою, стандартом.

10.Основна тенденція (тренд) – це достатньо стійка зміна рівня явища в часі, більш-менш вільна від випадкових коливань. Основну тенденцію можна подати аналітично – у вигляді рівняння (моделі, тренду або графічно.

11.Показник варіації – це ті показники, що вивчають міру варіації (коливання) окремих значень ознаки від середньої величини.

12.Ряд динаміки – це розміщення в часі значення явища, тобто послідовність чисел, які характеризують зміни розмірів суспільних явищ в часі.

13.Ряд динаміки – це ряд статистичних показників, що розташовані в хронологічній послідовності і характеризують зміну явища в часі.

14.Ряд розподілу – це упорядкований розподіл одиниць сукупності на групи за певною варіаційною ознакою.

15.Середня величина – це узагальнюючий показник, що характеризує рівень варіаційної ознаки в якісно однорідній сукупності.

220

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]