Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Планирование эксперимента - лекция07

.pdf
Скачиваний:
44
Добавлен:
03.06.2015
Размер:
944.53 Кб
Скачать

Ошибки 1-го и 2-го рода

! Величину доверительной вероятности следует выбирать на основании ущерба от совершения ошибок обоих типов.

Пример. В медицине принято использовать p=0.05, тогда как в технических дисциплинах выбирают доверительные вероятности от 0.001 и меньше. Почему врачи столь легковерны?

Ошибки 1-го и 2-го рода

Использование современных вычислительных средств дало возможность проводить сравнения с большим количеством переменных, из-за чего ложноположительные результаты стали неизбежными. Например, в средней кандидатской диссертации модель охарактеризована по паре сотен параметров. Поэтому если проводится сравнение достоверности различий с p=0.05, то ожидается 10 ложноположительных различий.

В каждой работе ложноположительные связи неизбежны. Выявить их можно потом в результате работы по сопоставлению и обобщению результатов, полученных разными группами исследователей –

кроссанализу.

Достоверность различий

Задача (достоверность различий частоты и вероятности). На устном экзамене к Беклемишеву обычно попадает 12% студентов, а на экзамене в зимнюю сессию из 40 студентов к нему попало только 2, т.е. 2/40 = 5%. Является ли это различие достоверным?

Достоверность различий

Решение. Количество студентов, попавших к Беклемишеву, есть случайная величина, распределенная биномиально с p=0,12 и N=40:

P n C40n 0,12 n 1 0,12 40n

Вероятность того, что при ожидаемой частоте 12% из 40 студентов попадет к нему 2 или меньше (и тогда различия будут достоверны), равна 0,126 (функция БИНОМРАСП в Excel).

Следовательно, достоверных различий с p=0,05 нет.

Достоверность различий

Задача. Пусть теперь на экзамене из 40 студентов к Беклемишеву попало 10, т.е. 10/40=25%. Как изменится ответ?

Решение. Вероятность того, что при вероятности 0,12 из 40 студентов к нему попадет 10 или больше, равна 1–0,9825=0,0125.

Следовательно, различия достоверны с p=0,0125.

Достоверность различий

Задача. На экзамене к Беклемишеву попало 10 студентов из 40, т.е. частота 10/40=25%. В каких пределах может находиться вероятность попасть к нему?

Решение. Примем доверительную вероятность p=0,05.

oОценка сверху. Вероятность того, что при вероятности x на экзамене к Беклемишеву из 40

студентов попадет 10 или менее, равна 0,05:

10

10

P n C40n xn 1 x 40n 0, 05

n0

n0

Подбором находим x=0,387.

Достоверность различий

oОценка снизу. Вероятность того, что из 40 студентов к Беклемишеву попадут 10 или более, равна 0,05:

40

40

P n C40n xn 1 x 40n 0, 05

n10

n10

Подбором находим x=0,142.

Определение. Полученные оценки вероятностей, не отличающихся достоверно от экспериментальной частоты, называются односторонними доверительными интервалами.

Достоверность различий

Поскольку вероятность не может быть одновременно больше 38,7% и меньше 14,2%, то измеряемая вероятность лежит в пределах между 14,2% и 38,7% с доверительной вероятностью 0,10 (по 0,05 на каждую сторону).

Определение. Полученная оценка возможной вероятности называется двусторонним доверительным интервалом.

С доверительной вероятностью 0,10 вероятность попасть к Беклемишеву на экзамене заключена между 14,2% и 38,7% со средним 25%.

P X p

Процентили

Определение. Если ξ – непрерывная числовая случайная величина, то процентилем вероятности p (p-

процентилем) называется такая величина X p, что

p

Например, 0.1-процентиль – такое число, что в 10% наблюдений мы получаем величины, меньшие этого процентиля, а в 90% наблюдений – большие.

Определение. Если ξ – числовая случайная величина, то процентилем вероятности p (p-процентилем) называется величина

X p

min P x p

 

x

Процентили

o0.25-, 0.50- и 0.75-процентили также называют

квартилями;

o 0.50-процентиль называется медианой.

Оценка

Кол-во

Кум. кол-во

%

Кум. %

10

107345

438668

24,5%

100,0%

9

97572

331323

22,2%

75,5%

 

 

8

111938

233751

25,5%

53,3%

 

 

 

7

68123

121813

15,5%

27,8%

 

6

28268

53690

6,4%

12,2%

 

5

10978

25422

2,5%

5,8%

 

4

4697

14444

1,1%

3,3%

 

3

2809

9747

0,6%

2,2%

 

2

1773

6938

0,4%

1,6%

 

1

5165

5165

1,2%

1,2%

Всего:

 

438668

 

100,0%

 

 

 

o

(по материалам сайта IMDb.com)