Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

stat021012

.pdf
Скачиваний:
11
Добавлен:
11.06.2015
Размер:
1.57 Mб
Скачать

 

5

 

 

 

 

 

 

Частота

4

 

 

 

 

 

 

3

 

 

 

 

 

 

2

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

4

5

6

7

8

9

10

 

 

 

 

Варианта

 

 

 

 

 

 

 

Рис. 2.

Вариационная кривая.

Показатели описательной статистики можно разбить на несколько групп:

-показатели положения описывают положение экспериментальных данных на числовой оси. Примеры таких данных – максимальный и минимальный элементы выборки, среднее значение, медиана, мода и др.;

-показатели разброса описывают степень разброса данных относительно своего центра (среднего значения). К ним относятся: выборочная дисперсия, разность между минимальным и максимальным элементами (размах, интервал выборки) и

др.

-показатели асимметрии: положение медианы относительно среднего и др.

-гистограмма и др.

Приведем формулы расчета и определения основных показателей.

Модальным классом или модой (Мо) называют класс или варианту, которым отвечает наибольшая частота. Медианой (Ме) называют варианту, расположенную по середине ранжированного ряда. Наиболее часто используют для характеристики центральной тенденции ряда среднюю арифметическую, которую определяют по формуле:

 

 

x

1

+ x

2

+K+ x

n

 

n

xi

, (1)

 

 

 

 

x =

 

 

 

=

i=1

 

 

 

 

 

n

 

n

 

 

 

 

 

 

 

 

 

где xi – варианты ряда, і = 1, 2, 3, …, n;

n – количество вариант в ряду (объем выборки).

Среднюю арифметическую в медицине часто обозначают M.

В том случае, если в ряду некоторые варианты встречаются несколько раз с частотами n1, n2, …, nk, то

 

 

x

 

n

 

+ x

 

n

 

+ K + x

 

n

 

 

k

xi ni

x =

1

1

2

2

k

k

=

i =1

 

(2)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

11

Если члены ряда возрастают в геометрической прогрессии (ах, ах2,…,ахn), то средняя арифметическая плохо характеризует среднюю тенденцию ряда. В этом случае усредняют произведение вариант

n

xg =n x1 x2 x3 K xn =n xi (3)

i=1

x g называют средней геометрической. Среднюю геометрическую используют при изучении темпов роста организмов или роста целых популяций.

Вариационный размах

х = хmax – хmin,

(4)

где хmax – максимальное значение варианты в ряду, хmin – минимальное значение варианты. Величина х указывает на степень вариации.

Среднее абсолютное отклонение (среднее отклонение), средняя абсолютная ошибка (в теории ошибок)

 

 

 

n

 

 

 

xi

 

 

 

 

 

x

 

(5)

 

=

i=1

 

 

 

 

 

x

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

Чаще всего на практике применяются варианса (англ. variance – вариация, изменение) или дисперсия (лат. dispersio – рассеяние)

 

 

n

 

 

 

(xi

 

)2

 

 

 

x

 

S 2

=

i=1

(6)

n 1

и среднеквадратичное отклонение

 

 

 

 

 

 

 

 

n (xi x)2

 

S =

i=1

(7)

 

 

n 1

 

Если вариационный ряд имеет k классов, то формула для дисперсии имеет вид:

 

k

 

 

(xi

 

)2 ni

 

x

 

S 2 =

i=1

, (8)

n 1

 

 

где ni – частоты классов.

Нужно отметить, что S, S2 и x измеряются в тех же единицах, что и варианты. Для сравнения степени вариабельности, лабильности показателей, которые измеряются в разных единицах измерения, вводят показатель вариации

V =

S

100

%

, (9)

 

 

 

x

 

 

 

который показывает разброс вариант в процентах.

Количественные характеристики вариационных рядов, вычисленные по результатам измерений на выборочной совокупности (выборочные характеристики), рассматриваются в математической статистике как

12

приближенные или точечные оценки соответствующих параметров генеральной совокупности, которые, как правило, остаются неизвестными.

Так выборочная средняя ( x ) является точечной оценкой генеральной средней (µ), выборочная дисперсия (S2) служит оценкой генеральной дисперсии (σ 2 ),

среднее квадратичное отклонение (S) - точечная оценка стандартного отклонения (σ ) генеральной совокупности, объем которой стремится к бесконечности. Как правило, точечные оценки не совпадают с соответствующими генеральными параметрами. Величину отклонения выборочного показателя от соответствующего генерального параметра характеризуют с помощью ошибки

репрезентативности.

Ошибка репрезентативности обусловлена случайным отбором членов выборки из генеральной совокупности и не является ошибкой измерений, возникающей при измерениях показателей жизнедеятельности биологических объектов.

Ошибку репрезентативности средней арифметической (ошибку средней) определяют по формуле:

S

 

 

= m =

(x

x)2 +(x

2

x)2

+K+(x

n

x)2

=

S

(10)

 

 

1

 

 

 

 

 

x

 

 

 

n(n 1)

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В медицине ошибку средней часто обозначают m.

ОЦЕНКА ДОСТОВЕРНОСТИ РЕЗУЛЬТАТОВ ИЗМЕРЕНИЙ

Сущность этого метода заключается в том, что по некоторой выборке устанавливается интервал, в котором с заданной вероятностью содержится значение исследуемого параметра генеральной совокупности.

Вероятность Р, признанная достаточной для уверенного суждения об исследуемом параметре генеральной совокупности на основании выборочных показателей, называется доверительной. Выбор того или иного значения доверительной вероятности осуществляется исходя из практических соображений и той ответственности, с которой делаются выводы о параметрах генеральной совокупности. В особенно ответственных медицинских экспериментах выбирают P= 0,999; в остальных случаях P= 0,95.

Алгоритм данного метода заключается в выполнении следующих операций:

1.Определяют по формуле (1) среднее арифметическое x результатов измерений исследуемой выборки.

2.По формуле (2) находят среднее квадратическое отклонение σ отдельного результата измерения.

3.Определяют по формуле (3) стандартную ошибку m.

4.По таблице 1 (см. стр. 59) находят критерий Стьюдента, зависящий от числа

степеней свободы ν = n - 1 и выбранной доверительной вероятности P=0,95; 0,99

или 0,999.

13

5.Вычисляют точность измерения (доверительные пределы ошибки):

 

m =

tν, p m

 

(4)

где tν,p - критерий Стьюдента,

 

6.

Определяют доверительный интервал, в котором с наперед заданной

доверительной вероятностью P находится результат измеряемой величины х:

 

 

x = x ± ∆m

(5)

Выражение (5) означает, что значение исследуемого параметра х с выбранной

доверительной вероятностью P не выйдет за пределы интервала [ x

- ∆m , x +

∆m], т.е.

 

x − ∆m x x + ∆m

(6)

Задание № 1

 

Необходимо найти:

 

среднее арифметическое x этих показателей;

среднее квадратическое отклонение σ;

стандартную ошибку m;

критерий Стьюдента tν,p при доверительной вероятности P=0,95;

доверительный интервал, в котором находится истинное значение показателя.

Пример выполнения задания № 1.

При анализах крови больного, взятых за 10 дней, получены следующие показатели гемоглобина:

X1

X2

X3

X4

X5

X6

X7

X8

X9

X10

11,4

11,8

12,0

10,8

8,4

10,6

10,0

8,2

9,8

11,8

14

1. Вводим исходные данные. Не забываем дать имя файлу, и периодически его сохранять.

2. Вычисляем с помощью формулы СРЗНАЧ среднее арифметическое значение показателей гемоглобина. При этом в поле диапазона данных показываем с помощью выделения мышкой наши введенные значения. Обратите внимание на формулу в строке формул.

15

n (xi x)2

3.

Найдем среднеквадратичное отклонение по формуле S =

i=1

 

 

n 1

Сначала посчитаем x x . Введем формулу в ячейку С2. Перед тем как ее копировать, ссылку на В12 делаем абсолютной.

16

4. В следующей колонке возводим получившуюся разность в квадрат, и находим сумму этих чисел, воспользовавшись быстрой кнопкой суммы на панели инструментов.

17

5.Найдем значение подкоренного выражения. Для этого сумму квадратов

разности

разделим

на

(n-1).

В

нашем

случае

это

(10-1).

6. Найдем корень из получившегося числа, воспользовавшись математической функцией КОРЕНЬ. В качестве аргумента укажем адрес ячейки со значением подкоренного выражения.

18

7. Среднеквадратичное отклонение также можно рассчитать, воспользовавшись статистической функцией СТАНДОТКЛОНА. Как видно, получаем одинаковый результат при меньшем затраченном времени.

8. Для расчета стандартной ошибки воспользуемся формулой m = Sn . В нашем случае объем выборки равен 10. Обратите внимание на строку формул.

19

9. Вводим число степеней свободы ν = n – 1. Вводим значение критерия Стьюдента из таблицы, учитывая заданную доверительную вероятность.

20

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]