Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
20080504182756.doc
Скачиваний:
9
Добавлен:
21.09.2019
Размер:
1.72 Mб
Скачать

Weryfikacja hipotez statystycznych

Hipoteza statystyczna jest założeniem badawczym , sformułowanym przez użytkownika, które dotyczy:

  1. poziomu nieznanych parametrów w populacji generalnej ( hipotezy parametryczne )

  2. kształtu rozkładów teoretycznych dla obserwowanych zmiennych losowych ( hipotezy nieparametryczne )

Złożenia badawcze , zwane parametrycznymi lub nieparametrycznymi hipotezami statystycznymi są formułowane w równoległych i nierozłącznych postaciach, a mianowicie jako :

  • hipoteza zerowa ( ), przez którą należy rozumieć sformułowanie założenia o braku jakiejkolwiek różnicy pomiędzy ocenami z prób losowych a parametrami lub rozkładami w populacji generalnej

  • hipotezy alternatywne ( ) , które są wszystkimi pozostałymi i możliwymi założeniami, poza sformułowaną hipotezą zerową

Hipotezy alternatywne mogą być sformułowane względem hipotezy zerowej

  • dwustronnie i wtedy

  • lewostronnie i wtedy

  • prawostronnie i wtedy

Stopień sformułowania hipotezy alternatywnej względem hipotezy zerowej ma wpływ na stopień jednoznaczności podejmowanych decyzji weryfikacyjnych.

Metody weryfikacji hipotez są skierowane wyłącznie na sprawdzenie hipotez zerowych.

Hipotezy zerowe , decyzje weryfikacyjne oraz błędy i ich prawdopodobieństwa

Hipoteza zerowa

( H0)

Odrzucenie

H0

Przyjęcie

H0

Prawdziwa

Błąd I – rodzaju (BI)

P(BI) = , 0<<1

Decyzja bezbłędna

Fałszywa

Decyzja bezbłędna

Błąd II rodzaju ( BII)

P(BII )= ,

Błąd I rodzaju polega na odrzuceniu sądu prawdziwego , a ryzyko popełnienia błędu mierzone prawdopodobieństwem nazywa się poziomem istotności i wynosi .

Przyjęcie hipotezy, gdy w rzeczywistości jest ona fałszywa, prowadzi do błędu II rodzaju, a ryzyko popełnienia błędu wynosi .

Prawdopodobieństwo 1- nazywa się mocą test i jest miarą ryzyka odrzucenia sprawdzanej hipotezy, a więc H0 , gdy prawdziwa jest H1.

W praktyce dąży się do minimalizacji obydwu błędów. Nie jest to możliwe, bo dla danej liczebności próby n ,zmniejszenie spowoduje wzrost . Okazuje się ,że nie można zbudować testu ( reguły postępowania ) , który dla danego n minimalizowałby jednocześnie i . Ponieważ ustalenie jest łatwiejsze , obszar krytyczny K powinien być tak ustalony, aby prawdopodobieństwo zdarzenia

Weryfikacja hipotez statystycznych Podstawowe pojęcia

Hipoteza statystyczna - Założenie dotyczące wartości parametru lub rodzaju rozkładu zmiennej w zbiorowości generalnej.

Hipoteza zerowa ( H0 ) - Hipoteza formułowana często w testach istotności w taki sposób , aby na podstawie wyników próby mogła być odrzucona ( wbrew zdrowemu rozsądkowi ), tak aby można było ją łatwo odrzucić. Na przykład stawiamy ( hipoteza prosta ) . Częściej jednak chodzi o zapis lub ( hipotezy złożone ).

Hipoteza alternatywna ( H1 ) - Hipoteza odnośnie której przypuszczamy , że jest prawdziwa ( zgodnie ze zdrowym rozsądkiem ). Jeżeli H0 zostanie odrzucona , wówczas przyjmujemy H1, w przeciwnym przypadku nie mamy podstaw do stwierdzenia , że hipoteza alternatywna jest prawdziwa, np. dla nieznanej średniej zbiorowości generalnej .

Błąd I rodzaju () - Jeśli hipoteza zerowa w rzeczywistości jest prawdziwa ( choć tego nie wiemy ) , ale na podstawie wyników hipotezę tę odrzucamy, to popełniamy błąd I rodzaju .

Błąd II rodzaju () - Jeśli hipoteza zerowa w rzeczywistości jest fałszywa ( choć tego nie wiemy ), ale na podstawie wyników z próby nie mamy podstaw do jej odrzucenia ( co w praktyce oznacza jej akceptację , czyli przyjęcie ) to wówczas popełniamy błąd II rodzaju.

Sprawdzian testu ( statystyka testu ) – zmienna losowa o określonym rozkładzie z próby ( najczęściej normalnym , t-Studenta lub chi – kwadrat ), której wartość wpada lub nie do obszaru odrzucenia hipotezy zerowej ( H0 ) , w zależności od tego , jaka będzie krytyczna wartość testu .

Wartość krytyczna testu - Wartość zmiennej losowej o określonym rozkładzie ( najczęściej normalnym , t- Studenta lub chi – kwadrat ) , która przy danym ( poziomie istotności ) jest porównywalna z wartością statystyki testu dla potrzeb ustalenia , czy H0 może być odrzucona czy też nie .

Zbiór krytyczny - Zbiór takich wartości sprawdzianu testu , które przemawiają za odrzuceniem H0.

Poziom istotności - Maksymalne prawdopodobieństwo popełnienia błędu I rodzaju , na które godzi się badacz przeprowadzający test statystyczny .Zazwyczaj jest ono małe i przyjmuje wartości 0,01 ; 0,02 ; 0,05 ; lub 0,10 .

Test jednostronny - Sytuacja , w której zbiór krytyczny hipotezy zerowej znajduje się tylko na lewo lub tylko na prawo od wartości oczekiwanej danej zmiennej losowej. Zbiór krytyczny testu usytuowany jest zatem po jednej stronie wartości oczekiwanej.

Test dwustronny - Sytuacja , w której zbiór krytyczny hipotezy zerowej umieszczony jest symetrycznie na lewo i na prawo od wartości oczekiwanej danej statystyki testu.

Wybór rodzaju testu - Zbiór krytyczny testu , jeśli to możliwe, powinno się wyznaczyć w taki sposób , aby przy ustalonym prawdopodobieństwie popełnienia błędu I rodzaju minimalizować prawdopodobieństwo ( popełnienia błędu II rodzaju ).

Moc testu - Prawdopodobieństwo odrzucenia hipotezy zerowej H0 , gdy hipoteza alternatywna H1 jest prawdziwa. Moc testu oznaczony jest przez M=1-.

Wykres mocy testu - wykres prawdopodobieństwa odrzucenia hipotezy zerowej dla wszystkich możliwych wartości nieznanego parametru zbiorowości generalnej.

Wartość p – minimalna wartość , dla której H0 może być odrzucona na podstawie wyników próby Hipoteza zerowa powinna być odrzucona tylko wtedy , gdy wartość p jest mniejsza od przyjętego dla danego testu poziomu istotności ( H0 odrzucamy , gdy wartość p < ) . Wartość p często jest nazywana obserwowalnym poziomem istotności . Jest to miara oceniająca , na ile wyniki z próby skłaniają do założenia prawdziwości hipotezy zerowej. Im mniejsze p , tym jest to mniej prawdopodobne.

Uwaga ! – Komputerowy poziom istotności lub poziom prawdopodobieństwa jest w pakiecie Statistica oznaczony jako p. Jeżeli >p , to na danym poziomie odrzucamy hipotezę zerową , natomiast gdy < p , to na danym poziomie istotności nie ma podstaw do odrzucenia hipotezy zerowej.

Hipoteza parametryczna – założenie odnoszące się do nieznanego poziomu parametru ( parametrów ) zbiorowości generalnej.

Hipoteza nieparametryczna – założenia odnoszące się do nieznanej postaci rozkładu zmiennej losowej w zbiorowości generalnej ( czasami dotyczy to równań nieznanych wartości parametrów tego rozkładu ).

Standardowa procedura testu istotności – jest to sposób weryfikacji hipotezy statystycznej składający się z następujących po sobie czynności :

  • przyjęcie określonego poziomu istotności

  • sformułowanie hipotezy zerowej H0

  • sformułowanie hipotezy alternatywnej ( w zależności od H1 test może być jednostronny lub dwustronny )

  • ustalenie sprawdzianu testu ( statystyki ) i jego wartości na podstawie dostępnych informacji o zbiorowości generalnej i próbie

  • odczytanie wartości krytycznej sprawdzianu testu ( głównie z tablic rozkładu normalnego , t- Studenta lub chi – kwadrat ) przy danym poziomie i informacjach pochodzących z próby losowej

  • ustalenie obszaru odrzucenia ( krytycznego ) H0 przy danym ( obszar ten może być jednostronny lub dwustronny )

  • podjęcie decyzji o odrzuceniu lub brak podstaw do odrzucenia hipotezy zerowej ( na podstawie porównania wartości statystyki testu z wartością krytyczną )

  • porównanie wartości p z

Test dla wartości średniej

Załóżmy , że cecha X posiada w populacji rozkład N( ) i parametry tego rozkładu nie są znane. W postępowaniu weryfikacyjnym , gdy nieznana jest wartość drugiego parametru , tzn. , należy wyróżnić dwa przypadki :

  1. wykorzystuje się statystykę Zn , której dokładny rozkład w określonych warunkach jest znany. W tym przypadku mamy do czynienia z małą próbą.

  2. wykorzystuje się statystykę Zn, której znany jest rozkład graniczny ( asymptotyczny ). Przypadek ten dotyczy dużych prób , tzn. gdy

W przypadku pierwszym – formułujemy hipotezy : wobec

( albo , albo )

Pobieramy próbę losową prostą liczącą n jednostek. Jeżeli próba jest mała , w praktyce n<30 , to do weryfikacji hipotezy H0 , wykorzystuje się statystykę :

Statystyka t ma rozkład t- Studenta o v=n-1 stopniach swobody wtedy , gdy prawdziwa jest hipoteza zerowa . W celu podjęcia decyzji względem H0, z tablic rozkładu t- Studenta odczytujemy wartość krytyczną t,v spełniającą warunek:

gdzie : - ustalony z góry poziom istotności

Zbiór wartości jest obszarem ( zbiorem ) krytycznym. Wiadomo, że dla danego , n , Zn zbiór krytyczny K określa także postać hipotezy alternatywnej . Jeżeli hipoteza konkurencyjna jest postaci :

, to obszar krytyczny wyznaczony z równości

natomiast dla hipotezy , zbiór krytyczny określa równość

W każdym rozważanym przypadku liczba stopni swobody v wynosi n-1 . Jeżeli obliczona wartość statystyki testu t znajdzie się w zbiorze krytycznym K , to hipotezę H0 odrzucamy z prawdopodobieństwem  i przyjmujemy hipotezę alternatywną. Gdy stwierdzimy, że wartość statystyki testu nie znajduje się w obszarze krytycznym ( jej wartość należy do zbioru dopuszczalnego ), wstrzymamy się od podjęcia decyzji mówiąc, że nie ma podstaw do odrzucenia H0 na poziomie istotności  .