Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Метод7(2003).doc
Скачиваний:
12
Добавлен:
09.02.2015
Размер:
1.83 Mб
Скачать

А. Определение достоверности отличия дисперсии от ожидаемого значения.

Пусть имеются следующие данные:

Полученная оценка среднеквадратичного отклонения

15,9

Ожидаемая величина среднеквадратичного отклонения

12

Число наблюдений N

35

Определим достоверность отличия полученной величины от ожидаемой.

Рассчитаем дисперсии как квадраты среднеквадратичного отклонения:

Полученная оценка среднеквадратичного отклонения

15,9

Ожидаемая величина среднеквадратичного отклонения

12

Число наблюдений N

35

Полученная оценка дисперсии

 =В1*В1

Ожидаемая дисперсия

 =В2*В2

Рассчитаем отношение оценки дисперсии к ее ожидаемому значению:

Полученная оценка среднеквадратичного отклонения

15,9

Ожидаемая величина среднеквадратичного отклонения

12

Число наблюдений N

35

Полученная оценка дисперсии

252,81

Ожидаемая дисперсия

144

Отношение оценки и ожидаемого значения

 =В4/В5

При истинности проверяемого предположения полученная величина должна быть распределена как . Умножив отношение наN-1, получим величину, которая должна быть распределена как хи-квадрат:

Полученная оценка среднеквадратичного отклонения

15,9

Ожидаемая величина среднеквадратичного отклонения

12

Число наблюдений N

35

Полученная оценка дисперсии

252,81

Ожидаемая дисперсия

144

Отношение оценки и ожидаемого значения

1,755625

Полученная величина хи-квадрат

 =В6*(В3-1)

Рассчитаем вероятность того, что хи-квадрат распределение с данным числом степеней свободы (которое на 1 меньше числа наблюдений) принимает такие или меньшие значения:

Так как мы проверяем гипотезу не о том, что дисперсия меньше ожидаемой, а о равенстве, то рассчитаем и вероятность того, что полученная величина меньше ожидаемой:

Полученная оценка среднеквадратичного отклонения

15,9

Ожидаемая величина среднеквадратичного отклонения

12

Число наблюдений N

35

Полученная оценка дисперсии

252,81

Ожидаемая дисперсия

144

Отношение оценки и ожидаемого значения

1,755625

Полученная величина хи-квадрат

59,69125

Вероятность того, что хи-квадрат будет больше полученного

0,00418088

Вероятность того, что хи-квадрат будет меньше полученного

 =1-В8

Теперь доверительная вероятность будет равна минимуму из вероятностей того, что мы получили столько, сколько ожидали, или меньше, и что мы получили столько, сколько ожидали, или больше:

Б. Определение доверительных границ к дисперсии.

Пусть имеются следующие данные:

Полученная оценка среднеквадратичного отклонения

15,9

Число наблюдений N

35

р

0,05

Рассчитаем доверительные границы.

Для начала рассчитаем дисперсию

=

15,9

Число наблюдений N

35

р

0,05

Полученная оценка дисперсии

252,81

Так как отношение дисперсии и ее оценки распределено как , то для начала рассчитаем для заданного р минимальные и максимальные ожидаемые величины хи-квадрат распределения. Это можно сделать при помощи функции ХИ2ОБР.

Так как эта функция рассчитывает процентили для заданной вероятности , то, чтобы получить доверительные границы с доверительной вероятностью 1-р нам надо слева и справа «отщипнуть» по р/2, то есть рассчитать процентили с=р/2 и=1-р/2

Так как распределение оценки дисперсии Sимеет вид, то есть еслиожидается в пределах отaдоb, то при заданномSвеличина дисперсииDожидается в пределах отдо. Отсюда имеем:

Полученная оценка среднеквадратичного отклонения

15,9

Число наблюдений N

35

р

0,05

Полученная оценка дисперсии

252,81

Ожидаемое значение хи-квадрат распределения:

 

От

51,9660216

До

19,8062372

Ожидаемое значение дисперсии:

 

От

 =В4*(В2-1)/В6

До

 =В4*(В2-1)/В7

Взяв квадратный корень из границ для дисперсии, получим доверительные границы для среднеквадратичного отклонения:

Полученная оценка среднеквадратичного отклонения

15,9

Число наблюдений N

35

р

0,05

Полученная оценка дисперсии

252,81

Ожидаемое значение хи-квадрат распределения:

 

От

51,9660216

До

19,8062372

Ожидаемое значение дисперсии:

 

От

165,406928

До

433,981474

Ожидаемое значение среднеквадратичного отклонения

 

От

 =корень(В9)

До

 =корень(В10)

А там и рассчитать погрешности (понимаемые как расстояния до границ доверительного интервала):

Полученная оценка среднеквадратичного отклонения

15,9

Число наблюдений N

35

р

0,05

Полученная оценка дисперсии

252,81

Ожидаемое значение хи-квадрат распределения:

 

От

51,9660216

До

19,8062372

Ожидаемое значение дисперсии:

 

От

165,406928

До

433,981474

Ожидаемое значение среднеквадратичного отклонения

 

От

12,8610625

До

20,832222

Погрешность -

 =В1-В12

Погрешность +

 =В13-В1

В результате получим:

Полученная оценка среднеквадратичного отклонения

15,9

Число наблюдений N

35

р

0,05

Полученная оценка дисперсии

252,81

Ожидаемое значение хи-квадрат распределения:

 

От

51,9660216

До

19,8062372

Ожидаемое значение дисперсии:

 

От

165,406928

До

433,981474

Ожидаемое значение среднеквадратичного отклонения

 

От

12,8610625

До

20,832222

Погрешность -

3,03893752

Погрешность +

4,93222202

В. Определение достоверности отличия двух оценок дисперсий.

Воспользуемся данными таблицы PNEVMO. Рассчитаем параметры температуры на момент госпитализации с делением пациентов по исходу, используя командыAnalyze/CompareMeans/Means

В результате получим следующее:

Report

temperature of the patient

УМЕР

Mean

N

Std. Deviation

,00

38,504

923

,798

1,00

38,569

108

1,233

Total

38,511

1031

,854

Скопируем таблицу в Excelи рассчитаем дисперсию:

Report

 

 

 

 

temperature of the patient

 

 

 

 

УМЕР

Mean

N

Std. Deviation

Дисперсия

0

38,50394

923

0,798284

 =D4*D4

1

38,56944

108

1,232766

 

Total

38,5108

1031

0,853647

 

Рассчитаем отношение дисперсий. При этом будем брать отношение дисперсии в той группе, где она больше, к меньшей:

Report

 

 

 

 

temperature of the patient

 

 

 

 

УМЕР

Mean

N

Std. Deviation

Дисперсия

0

38,50394

923

0,798284

0,637257

1

38,56944

108

1,232766

1,519712

Total

38,5108

1031

0,853647

0,728714

Отношение дисперсий

 =Е5/Е4

 

 

 

В выборочных совокупностях дисперсии могут существенно отличаться друг от друга. Пусть мы производим две выборки объемами N1 и N2 из одной генеральной совокупности с известной дисперсией D и для каждой выборки вычисляем оценки выборочной дисперсии SN1-1 и SN2-1. Поскольку выборочные дисперсии распределены как величины, их отношение будет подчиняться распределению Фишера-Снедекора с числом степеней свободы (N1-1, N2-1). Иными словами, различие между выборочными дисперсиями проводится по критерию Фишера-Снедекора с числом степеней свободы (N1-1, N2-1). Для вычисления достоверности отличия дисперсий, используя этот критерий, можно пользоваться затабулированной функцией, которая называется FРАСП:

В результате получили, что дисперсия в группе умерших достоверно больше, чем у выживших, причем степень достоверности различий очень высока. И это при том, что средняя температура в этих группах практически одинакова.

Для исследования этой связи округлим температуру с шагом в полградуса:

Рассчитаем летальность в зависимости от этой переменной. Используем команды:

Analyze  Descriptive Statistics  Crosstabs…

Получаем таблицу:

ТЕМП_05 * УМЕР Crosstabulation

Count

УМЕР

Total

,00

1,00

ТЕМП_05

36,00

3

3

36,50

2

2

37,00

62

16

78

37,50

89

5

94

38,00

303

32

335

38,50

152

3

155

39,00

197

11

208

39,50

14

14

40,00

104

34

138

41,00

2

2

4

Total

923

108

1031

Анализируя полученную таблицу видим, что наибольшая летальность у больных с нормальной, и очень высокой температурой.

Соседние файлы в предмете Медицинская статистика