Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
3 модуль.doc
Скачиваний:
130
Добавлен:
23.02.2016
Размер:
3.32 Mб
Скачать

Семінарське заняття 25

Тема 24. Точкові та інтервальні оцінки. Тема 25. Перевірка статистичних гіпотез

Питання для усного опитування та дискусії

24.1. Основні поняття про точкові та інтервальні оцінки.

24.2. Метод моментів.

24.3. Метод найбільшої правдоподібності.

25.1. Основний принцип перевірки статистичних гіпотез.

25.2. Критерії, що використовуються в управлінській практиці.

25.3. Застосування критерію “хі-квадрат” при обробці кількісних і якісних даних.

Аудиторна письмова робота

Виконання студентами тестових завдань з питань теми заняття. Методичні вказівки

Ключовими термінами, на розумінні яких базується засвоєння навчального матеріалу теми, є : точкова оцінка, інтервальна оцінка, метод моментів, метод найбільшої правдоподібності, статистична гіпотеза, критерій «хі-квадрат».

З метою глибокого засвоєння навчального матеріалу при самостійному вивченні теми студенту варто особливу увагу зосередити на таких аспектах.

  1. Точкові та інтервальні оцінки.

  2. Метод моментів.

  3. Метод найбільшої правдоподібності.

  4. Основний принцип перевірки статистичних гіпотез.

  5. Критерії, що використовуються в управлінській практиці.

  6. Застосування критерію “хі-квадрат” при обробці кількісних і якісних даних.

1. Для оцінки невідомих параметрів того чи іншого розподілу користуються точковими та інтервальними статистичними оцінками. Точковою називають оцінку, яка визначається одним числом. Нехай θ* – точкова статистична оцінка невідомого параметра θ теоретичного розподілу. Якщо М(θ*)=θ, то статистична оцінка називається незміщеною. Оцінка, яка при заданому об’ємі вибірки має найменшу можливу дисперсію, називається ефективною. Справджуваною (конзистентною) називають статистичну оцінку, яка при прямує за ймовірністю до оцінюваного параметра.

Можна довести, що вибіркова середня є незміщеною оцінкою генеральної середньої. Вибіркова середня характеризуєтьсястійкістю (різні вибіркові середні з однієї і тієї ж генеральної сукупності при досить великих n наближено рівні між собою).

Вибіркова дисперсія DB є зміщеною оцінкою генеральної дисперсії DГ, але “виправлена” дисперсія S2, яка визначається за формулою

,

є незміщеною оцінкою генеральної дисперсії (М(S2)=DГ).

Якщо об’єм вибірки невеликий, користуються, як правило, інтервальними оцінками, що характеризуються двома числами - кінцями інтервалу.

Нехай δ>0 – деяка невелика стала величина. Якщо |θ-θ*|< δ, то чим менше δ, тим точніша оцінка. Надійністю оцінки θ по θ* називають ймовірність γ, з якою справджується нерівність |θ-θ*|< δ. Отже, р(|θ-θ*|< δ)=γ, або р(θ*- δ<θ<θ*+δ)=γ.

Інтервал (θ*-δ;θ*) називають надійним інтервалом (інтервалом довір’я). Зазначимо, що найчастіше беруть γ=0,95, γ=0,99, γ=0,999.

Нехай, наприклад, ознака Х розподілена нормально, але величина параметра а невідома. Якщо відомі σ, , n,то має місце класична оцінка:

причому число t визначається із рівності 2Ф(t)=γ (тут Ф(t) – функція Лапласа).

Якщо теоретична дисперсія σ2 невідома, то її замінюють незміщеною оцінкою S2, і надійний інтервал для а набуває виду .

Якщо n <30, то для а при рівні надійності γ використовують надійний інтервал , де величину параметраtγ=t(k, γ) знаходять з таблиці розподілу Стьюдента, причому k=n-1 – число степенів свободи.

2. Для знаходження точкових оцінок можна використовувати метод моментів: для визначення невідомих параметрів заданого розподілу прирівнюють відповідні теоретичні та емпіричні моменти.

Якщо розподіл характеризується лише одним параметром (наприклад, розподіл Пуассона), то для знаходження його оцінки користуються співвідношенням . Якщо розподіл визначається двома параметрами, то для знаходження їх точкових оцінок користуються системою рівнянь.

Для нормального розподілу, зокрема, отримаємо: .

ПРИКЛАД. Випадкова величина Х (кількість бракованих деталей у партії товару) розподілена за законом Пуассона з параметром λ. У результаті статистичних досліджень отримано такий статистичний розподіл кількості бракованих деталей у n=1000 партіях товару.

Кількість бракованих деталей

0

1

2

3

4

5

6

Кількість партій товару

501

273

126

68

24

5

3

Знайти методом моментів точкову оцінку невідомого параметра λ розподілу Пуассона.

Розв’язування. Для розподілу Пуассона M(Х)=

Визначаємо :

Таким чином, точковою оцінкою невідомого параметра λ розподілу Пуассона є оцінка λ*=(0,868)-1=1,152.

3. Метод найбільшої правдоподібності зводиться до знаходження максимуму функції одного або кількох оцінюваних параметрів.

Функцію правдоподібності дискретної випадкової величини називають функцію аргументу θ

L(х1, х2…,хn, θ)=p(х1, θ) p(х2, θ)… p(хn, θ),

де p(хі, θ) – ймовірність того, що у результаті випробування випадкова величина Х набуде значення хі (і = 1, 2, …, n).

Для ілюстрації розглянемо приклад, розв’язаний вище іншим методом – методом моментів.

Маємо: функція правдоподібності (у випадку закону Пуассона) має вигляд

.

Логарифмічна функція правдоподібності lnL досягає максимуму при тому ж значенні λ, що і функція L. Маємо:

lпL =868lnλ-1000λ-ln(2293·3103·58)при λ=λ*=0,868. При цьому і при λ=λ* дійсно досягається максимальне значення логарифмічної функції правдоподібності.

Таким чином, точкові оцінки, отриманні методом моментів і методом найбільшої правдоподібності, співпали.

Аналогічно розв’язується задача побудови і дослідження функції правдоподібності неперервної випадкової величини.

4. Під статистичною гіпотезою розуміють будь-яке твердження про генеральну сукупність, яке перевіряється по вибірці. Розрізняють основну (нульову) гіпотезу H0 і альтернативну (конкуруючу) гіпотезу H1. Наприклад гіпотеза про те, що θ=θ0 (θ – невідомий параметр відомого розподілу) – основна; гіпотеза про те, що θ=θ1 – альтернативна.

Якщо нульова гіпотеза вірна, але вона помилково відкидається, говорять про помилку 1-го роду (її ймовірність позначають через α). Якщо гіпотеза H0 невірна, але вона помилково приймається, говорять про помилку 2-го роду (її ймовірність позначають через β).

Якщо спостережуване значення спеціально підібраної випадкової величини належить області прийняття гіпотези H0, то цю гіпотезу приймають. Якщо ж спостережуване значення критерію належить критичній області, то нульову гіпотезу відкидають.

Критичні області бувають одно – і двохсторонні. Для кожного критерію існують таблиці, за якими знаходять критичні точки, що відокремлюють критичну область від області прийняття гіпотези.

5. Наведемо критерії а) і б) tω , які дозволяють визначити, чи вплинула та чи інша зміна в технології, в сировині або в організації виробництва істотнім чином на зміну а) середньої величини деякої ознаки Х (відповідно б) – частоти якісної ознаки Х) чи ця зміна знаходиться у межах випадковості.

Необхідно провести вибіркові випробування досить великих об’ємів n1 і n2 ознаки X до і після зміни того чи іншого фактора.

У випадку а) підраховують вибіркові середні іта обчислюють величинуза формулою:

де і– вибіркові виправлені дисперсії до і після зміни певного фактора. Якщо виявиться, що, то з ймовірністю 0,954 можна стверджувати, що зміна факторасуттєво вплинула на зміну середньої величини ознаки. У противному випадку така зміна могла бути випадковою.

У випадку б) підраховують частоти ω1 і ω 2 появи ознаки Х до і після зміни певного фактора. З ймовірністю 0,954 можна стверджувати, що величина

не перевищуватиме число 2, якщо зміна фактора неістотно вплинула на зміну долі ω ознаки. У противному випадку (якщо tω>2), з ймовірністю 0,954 можна стверджувати, що зміна фактора суттєво вплинула на зміну долі ω ознаки.

6. Для перевірки гіпотези про нормальний розподіл генеральної сукупності застосовують критерій “хі-квадрат” Пірсона. Суть критерію – у порівнянні емпіричних частот ni і теоретичних частот ´, обчислених у припущенні, що закон розподілу генеральної сукупності нормальний.

ПРИКЛАД. Перевірити при рівні значущості α=0,05 за критерієм згоди Пірсона гіпотезу про нормальний розподіл ціни на деяку продукцію для даних, представлених у таблиці 1.

Таблиця 1.

хіі+1 (ціна товару (грн.))

4-5

5-6

6-7

7-8

8-9

ni (частота)

1

2

3

2

2

Розв’язування. Розглянемо допоміжний статистичний розподіл, в якому за значення варіант беруть середини інтервалів [хі; хі+1]- значення хі*(див. таблицю 2)

Таблиця 2.

хі*

4,5

5,5

6,5

7,5

8,5

ni

1

2

3

2

2

Обчислюємо та σ*:

Нормуємо випадкову величину Х (переходимо до величини Z):

Найменше значення zі покладаємо рівним -∞, а найбільше – (+∞). За таблицею значень функції Лапласа визначаємо Ф(zі) і обчислюємо pі= Ф(zі+1)- Ф(zі). Ці дані занесемо в таблицю 3.

Таблиця 3.

і

Границі інтервалів

Ф(zі)

Ф(zі+1)

pі

zі

zі+1

1

2

3

4

5

-∞

-0,63

-0,26

0,11

0,49

-0,63

-0,26

0,11

0,49

-0,5

-0,2357

-0,1026

0,0438

0,1879

-0,2357

-0,1026

0,0438

0,1879

0,5

0,2643

0,1331

0,1464

0,1441

0,3121

Σ pі=1

Далі розраховуємо теоретичні частоти за формулою: , а також

Х2спост =(таблиця 4).

Таблиця 4.

і

pі

=10pі

1

2

3

4

5

0,2463

0,1331

0,1464

0,1441

0,3121

2,643

1,331

1,464

1,441

3,121

-1,643

0,669

1,536

0,559

-1,121

2,699

0,448

2,359

0,312

1,251

1,02

0,34

1,61

0,22

0,40

Σ pі=1

Σ npі=10

χ2спост=3,59

За таблицею критичних точок розподілу χ 2 визначаємо: χ 2кр (0,05; 2) =6 (тут α =0,05 – рівень значущості, 2-число степенів свободи, яке визначають як різницю l-r-1, де l –число інтервалів статистичного ряду (5), r – число параметрів закону теоретичного розподілу (r=2)). Зауваживши, що критична область правостороння і що χ 2спост < χ 2кр., приходимо до висновку: гіпотеза про нормальний розподіл ціни на продукцію підтверджується.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]