Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Зайцев_книга2[1].doc
Скачиваний:
647
Добавлен:
15.03.2015
Размер:
8.87 Mб
Скачать
      1. Доверительная значимость, доверительная вероятность, доверительный интервал, доверительный предел.

Оценки, рассмотренные выше, являются точечными. В связи с этим возникает вопрос: можно ли по результатам точечной оценки одной лишь выборки судить о свойствах всей генеральной совокупности. На первый взгляд кажется, что нельзя. На приведенном примере (Таблица 97) видно, что выборочные средние не совпадают с генеральным средним. Однако каждый результат, полученный в отдельной выборке, можно рассматривать как случайную величину. Соответственно, при увеличении числа выборок, распределение точечных оценок будет принимать характер нормального распределения. Это значит, что в случае средних арифметических относительные отклонения выборочных средних от генерального среднего (то есть характеристик непосредственно генеральной совокупности) распределяются так же, как относительные отклонения нормально распределенных вариант от среднего арифметического вариационного ряда.

Отсюда в частности следует, что 68,3% всех выборочных средних находятся в пределах =Мm. Иными словами имеется вероятность 0,683 , что выборочное среднее отличается от генерального не более, чем на m . В этой формуле - предельная ошибка выборки,М- среднее выборочное, m - стандартное отклонение среднего значения (по аналогии со стандартным отклонением вариант от среднего вариационного ряда). В медико-биологической литературе параметр m принято называть «стандартная ошибка среднего» или «ошибка среднего»,. Вычисляется этот параметр в случае повторного отбора по формуле , где  - среднеквадратическое отклонение выборки , n- число наблюдений в выборке (объем выборки), или , гдеD=2- дисперсия.

Если выборка, объем которой известен (n), сформирована из генеральной совокупности бесповторным отбором, то в формулу вводится поправочный множитель, и она приобретает вид . Очевидно, что при большой генеральной совокупности, когдаN , этот множитель стремится к единице.

При определении ошибки выборочной доли (например : 0,25 или 0,47) используется формула . В случаях, когда доля выражена в % (например : 25% или 47%), . Указанным способом ошибки доли определяются, если число наблюдений достаточно велико. Необходимую величину выборки в этом случае можно найти из неравенстваPn>500, то есть произведение доли (в %) на число наблюдений не должно быть меньше 500. Кроме того, чтобы использовать указанную формулу сами выборочные доли не должны намного отличаться от 0,5 (50%). В случае, когда доля меньше 0,2 (20%) или больше 0,8 (80%) , следует использовать другую методику.

Поскольку параметр m характеризует ошибку утверждения (ошибку прогноза) о том, что выборочное среднее равно генеральному среднему, то чем выше требование к вероятности этого вывода, тем шире должен быть обеспечивающий точность такого прогноза интервал, называемый «доверительный интервал».

Статистическая оценка, которая определяется двумя числами - концами интервала, называется интервальной оценкой.

Величина доверительного интервала задается вероятностью безошибочного прогноза, эту вероятность принято называть «доверительная вероятность» или вероятностью безошибочного прогноза, а иногда надежностью. Величина доверительной вероятности может задаваться доверительным параметрическим коэффициентом t - коэффициентом Стьюдента (псевдоним английского химика У.Госсета, 1908).

При достаточно большом числе наблюдений (n>30), значения доверительного коэффициента t и доверительной вероятности соотносятся следующим образом:

Таблица 98

Соотношение статистических критериев достоверности

выборочных характеристик

Доверительный

критерий t

Доверительная вероятность (%)

Уровень

значимости (Р)

1

68,3

0,32

2

95,5

0,05

3

99,7

0,01

При малых числах наблюдений значения коэффициента Стьюдента с учетом уровня доверительной вероятности можно установить по специальным таблицам.

Выбор того или иного уровня значимости или , соответственно, доверительной вероятности в общем является произвольным. В медико-биологических исследованиях допускается доверительная вероятность не менее 95,5%. В этом случае доверительный интервал для средних при достаточно большом числе наблюдений (n>30), равен 2m. Предельная ошибка выборки = М2m . При доверительной вероятности 99,7% доверительный интервал составит 3m, =М3m. В целом, чем больше доверительная вероятность, тем больше доверительный интервал и предельная ошибка.

Граничные точки доверительного интервала называются доверительными пределами.

Каждому значению доверительной вероятности соответствует свой уровень значимости (Р). Уровень значимости выражает вероятность нулевой гипотезы, то есть вероятность того, что выборочная и генеральные средние не отличаются друг от друга. Иначе говоря, чем выше уровень значимости, тем меньше можно доверять утверждению, что различия существуют. Для доверительной вероятности 0,95 (95%), например, уровень значимости Р=1-0,95=0,05.

Таблица 99

Интервальная оценка среднего арифметического

М=25,2. m=3,1 n=50

Критерий Стьюдента t

1

2

3

Доверительная вероятность

68,3%

95,5%

99,7%

Уровень значимости Р

0,32

0,05

0,01

Доверительный интервал t m

3,1

6,2

9,3

Предельная ошибка выборки

25,23,1

25,26,2

25,29,3

Доверительные пределы М+ t m М- t m

28,322,1

31,419,0

34,515,9

Если выборки небольшие по объему, то распределение вероятностей не следует точно нормальному закону распределения. В этом случае для определения величины доверительного коэффициента соответствующей определенному значению доверительной вероятности или уровню значимости пользуются специальными таблицами. Очевидно, что в реальных исследованиях желательно иметь как можно меньший доверительный интервал при достаточно высокой доверительной вероятности.

Таким образом, статистическая значимость выборочных характеристик представляет собой меру уверенности в их "истинности". Уровень значимости находится в убывающей зависимости от надежности результата. Более высокая статистическая значимость соответствует более низкому уровню доверия к найденной в выборке характеристике. Именно уровень значимости представляет собой вероятность ошибки, связанной с распространением наблюдаемого результата на всю генеральную совокупность.

Выбор порога уровня значимости, выше которого результаты отвергаются как статистически не подтвержденные, во многом произвольный. Как правило, окончательное решение обычно зависит от традиций и накопленного практического опыта в данной области исследований. Верхняя граница Р<0,05 статистической значимости содержит довольно большую вероятность ошибки (5%). Поэтому в тех случаях, когда требуется особая уверенность в достоверности полученных результатов, принимается значимость Р<0,01 или даже Р<0,001.

В практике медико-биологических исследований наиболее часто используются следующие значения показателей значимости 0,1; 0,05; 0,01; 0,001. Традиционная интерпретация уровней значимости, принятая в этих исследованиях представлена в таблице.

Таблица 100

Интерпретация уровней значимости(Р)

Показатели значимости(Р)

Интерпретация

 0,1

Данные согласуются с нулевой гипотезой Но

 0,05

Есть сомнения в истинности как нулевой Но, так и альтернативной гипотезН1.

 0,05

Нулевая гипотеза может быть отвергнута Но

 0,01

Нулевая гипотеза (Но)может быть отвергнута. Сильный довод

 0,001

Нулевая гипотеза (Но) почти наверняка не подтверждается. Очень сильный довод.

Из формулы стандартной ошибки среднего (m), от которой во многом зависит величина интервала, следует, что эта ошибка зависит как от числа наблюдений в выборке (n), так и от однородности выборки.

Интервальные оценки коэффициентов асимметрии, эксцесса и коэффициента вариации проводятся на основе стандартных ошибок этих коэффициентов.

Ошибка показателя асимметрии при очень малых объемах выборки может производиться по формуле . Ошибка показателя эксцесса. Ошибка коэффициента вариации.

В медико-биологических исследованиях объекты наблюдения, как правило, весьма вариабельны и не поддаются регулированию. Поэтому там, где это возможно, желательно брать выборки большего объема, что к сожалению в большинстве исследований весьма трудно или вообще невозможно. Поэтому значение выборочных статистических оценок в медико-биологических исследованиях не может быть определено с высокой точностью. Это в свою очередь делает бессмысленным точное измерение исходных данных. Поэтому при планировании исследований указанное обстоятельство необходимо обязательно учитывать, что позволит избежать ненужных материальных затрат (чем точнее измерения, тем они дороже) и неоправданных потерь времени при сборе данных.

Иногда при статистических расчетах необходимо вычислять сумму, разность, произведение и частное от деления средних величин. В этих ситуациях необходимо соответствующим образом оперировать и с ошибками средних.

Для определения суммарной ошибки суммы средних М1,+М2,+ … +Мn можно использовать формулу: . Следует иметь в виду, что более точный результат суммарной ошибки получается при пересчете объединенного массива исходных данных (всех вариант), а указанной формулой следует пользоваться в случае невозможности такого перерасчета.

Формула ошибка разности средних арифметических М1,-М2,- … -Мn вычисляется аналогично: .

Ошибка деления средних арифметических:

Ошибка произведения средних арифметических: