Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Медицинская статистика

.pdf
Скачиваний:
517
Добавлен:
22.04.2016
Размер:
391.79 Кб
Скачать

на основе ее данных средняя не будет правильно отражать типичные характерные особенности изучаемого явления.

Средние величины должны быть исчислены на массовых материалах, т.е. в

совокупности должно быть достаточно большое число наблюдений. Это тре-

бование основано на законе больших чисел.

ВАРИАЦИОННЫЙ РЯД И ЕГО ЭЛЕМЕНТЫ

В каждой совокупности ее отдельные единицы отличаются друг от друга по величине изучаемого признака. Это различие называется вариацией.

Группировка единиц совокупности по величине варьирующего признака дает вариационные ряды.

Вариационный ряд - это ряд числовых значений изучаемого признака. Каждый вариационный ряд включает в себя следующие элементы:

варианта (V) - каждое отдельное числовое значение признака в совокуп - ности (рост каждого ребенка, частота пульса каждого больного, число лейкоцитов в крови каждого обследованного и т.д.), в том числе Vmin - наименьшая варианта и Vmax - наибольшая варианта, ограничивающие вариационный ряд

частота или математический вес (Р) - число, которое показывает, сколько раз данный признак (варианта) встречается в совокупности

число наблюдений (n) - сумма всех частот ( n = ∑ P)

ннтервал - разность между двумя соседними вариантами (V3-V2 , V2-V1, т.д.)

амплитуда - разность между наибольшей и наименьшей вариантами (Vmax - Vmin)

мода (Мо) - варианта, которая встречается в вариационном ряду наиболее часто (т.е. имеющая наибольшую частоту или наибольший математический вес)

медиана (Ме) - величина, которая делит вариационный ряд на две равные

части по числу наблюдений. Если число наблюдений четное, то место расположения середины вариационного ряда определяется по формуле n ,

если нечетное - n + 1

2

2

ПРИМЕР: Распределение обследованных рабочих по частоте пульса

Частота пульса в 1 мин. (V)

 

Число обследованных (Р)

66

 

1

 

68

 

2

 

69

 

3

 

70

 

5

 

72

 

3

 

76

 

1

 

 

 

n = 15

 

 

Мо = 70

Ме = 70 (8-я варианта, т.к. по обе стороны от нее находится равное число вариант)

ВИДЫ ВАРИАЦИОННЫХ РЯДОВ

20

* ранжированный (упорядоченный) ряд - такой, в котором числовые зна-

чения вариант располагаются последовательно, по убыванию или по нарастанию

(5, 7, 8, 12, 26, 31, 38 и т.д.)

*неранжированный ряд - такой, в котором варианты располагаются беспо-

рядочно (34, 6, 12, 45, 24, 7, 98 и т.д.)

*прерывный (дискретный) ряд - такой, в котором варианты выражены только целым числом и не могут иметь промежуточных значений (число детей в семье, число лейкоцитов в крови, частота пульса, число посещений, пр.)

*непрерывный ряд - такой, в котором варианты могут принимать любые значения, в том числе и дробные (рост, масса тела, время, затраченное на прием одного больного, содержание в крови или воздухе различных веществ, пр.)

*простой (развернутый) ряд - такой, в котором каждая варианта и соответствующая ей частота обозначены отдельно. Ряд, в котором каждая варианта встречается с частотой, равной единице, называется простым невзвешенным, а если с разной частотой - простым взвешенным.

*сгруппированный (интервальный) ряд - такой, в котором варианты со-

единены в группы, объединяющие их по величине в пределах определенного интервала.

Составление сгруппированного вариационного ряда

Простой, несгруппированный ряд, особенно при большом объеме совокупности, является громоздким и неудобным для вычисления средних величин, поэтому он обычно составляется при небольшом числе наблюдений (n ≤ 30).

При большом числе наблюдений (n > 30) строят сгруппированный ряд на основе интервала (i), показывающего число вариант, объединенных в одну группу.

Группировку рядов проводят следующим образом:

Определяют размах ряда (амплитуду) вычитанием минимальной варианты из максимальной (Vmax - Vmin)

Полученное число делят на желаемое количество групп - так определяется интервал.

Начиная с минимальной варианты, строят вариационный ряд. Границы интервалов должны быть четкими, исключающими попадание одной и той же варианты в разные группы.

Правильно составленный сгруппированный (интервальный) ряд должен отвечать следующим требованиям:

Все варианты распределения должны войти в группы.

Общее число выделенных групп должно быть не менее 7 (иначе вычисленная средняя арифметическая будет неточной) и не более 15 (иначе ряд будет большим и громоздким).

Каждая новая последующая группа должна начинаться с новой последующей варианты, т.е. одна и та же варианта не должна встречаться в двух смежных группах.

Интервал должен быть одинаковым в каждой группе, т.е. в каждую группу должно входить одинаковое число вариант. Размер интервала определяют, исходя из характера изучаемого признака, из числа выбранных групп, количества вари-

21

ант и числа наблюдений. Величина интервала выбирается также с учетом целей и задач исследования.

Каждая группа в сгруппированном ряду должна иметь начальную и конечную варианты, т.е. не должно быть так называемых открытых групп (например, до 5 лет, старше 60 лет и т.п.).

Каждой группе присваивается частота, равная сумме частот всех вариант, вошедших в группу.

ПРИМЕР:

Результаты измерения массы тела девочек 12 лет

 

 

 

 

Масса тела в кг (V)

Число лиц (Р)

 

27

1

 

28

1

 

29

2

 

30

5

 

31

8

 

32

10

 

33

13

 

34

15

 

35

14

 

36

10

 

37

7

 

38

4

 

39

2

 

40

1

 

41

1

С целью упрощения вариационного ряда производим группировку вариант по три (интервал = 3) и получаем сгруппированный ряд:

Масса тела в кг (V)

Число случаев (Р)

27 - 29

4

30 - 32

23

33 - 35

42

36 - 38

21

39 - 41

4

Дальнейшее упрощение сгруппированного ряда заключается в предварительном определении середины интервала (центральной варианты).

В прерывных сгруппированных вариационных рядах центральная варианта оп-

ределяется как полусумма начальной и конечной вариант в группе и ей при-

сваивается суммарная частота всех вариант, вошедших в данную группу:

Масса тела в кг (V)

Число лиц (Р)

(27 + 29) : 2 = 28

4

31

23

34

42

37

21

40

4

В непрерывных сгруппированных вариационных рядах центральная варианта определяется как полусумма начальных вариант соседних групп.

22

Масса тела в кг (V)

Число лиц (Р)

27,0 - 29,9

4

30,0 - 32,9

23

33,0 - 35,9

42

36,0 - 38,9

21

39,0 - 41,9

4

Центральная варианта для первой группы данного ряда равняется (27,0 + 30,0) : 2 = 28,5 см и т.д.

МЕТОДИКА ВЫЧИСЛЕНИЯ СРЕДНЕЙ АРИФМЕТИЧЕСКОЙ

Средняя арифметическая (М) - производная вариационного ряда, которая одним числом характеризует весь ряд и выражает его основную закономерность.

Вычисление простой и взвешенной средней арифметической Средняя арифметическая простая вычисляется для простого невзвешенного

вариационного ряда, в котором варианты встречаются с частотой, равной едини-

це (Р=1), и определяется как сумма всех вариант ( V ), деленная на число на-

блюдений (n):

 

М =

V

 

 

 

, где М - средняя арифметическая

 

 

 

 

n

 

 

 

 

V - варианты

 

 

 

 

∑ - знак суммирования

 

 

 

 

n - число наблюдений

 

 

 

ПРИМЕР:

Содержание сахара в крови (в мг% )

 

 

 

 

 

 

 

 

 

 

Уровень сахара (V)

 

Число случаев (Р)

 

 

105

 

 

 

1

 

 

 

103

 

 

 

1

 

 

 

102

 

 

 

1

 

 

 

101

 

 

 

1

 

 

 

100

 

 

 

1

 

 

 

100

 

 

 

1

 

 

 

99

 

 

 

1

 

 

 

98

 

 

 

1

 

 

 

97

 

 

 

1

 

 

 

95

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

∑V = 1000

 

n = 10

 

∑V

1000

 

 

 

 

 

 

М = n =

10 = 100 мг %

 

 

Средняя арифметическая взвешенная вычисляется в тех случаях, когда в ва-

риационном ряду отдельные значения вариант повторяются (Р>1).

М =

VP

где М - средняя арифметическая

,

 

n

 

 

 

V - варианты

 

 

Р - частоты

 

 

∑ - знак суммирования

 

 

n - число наблюдений

23

ПРИМЕР:

Результаты измерения массы тела юношей 18 лет

 

 

 

 

Масса тела в кг (V)

 

Число лиц (Р)

VP

64

 

 

2

128

63

 

 

3

189

62

 

 

9

558

61

 

 

6

366

60

 

 

4

240

59

 

 

1

59

 

 

 

n = 25

∑VP = 1540

∑VP

1540

 

 

 

M = n =

25

= 61,6 кг

 

Вычисление средней арифметической по способу моментов (условных отклонений)

При больших числовых значениях признака в значительных по объему совокупностях средняя арифметическая вычисляется упрощенным способом, который называется “ способ моментов” или “ способ условных отклонений”.

Вычисление средней арифметической по способу моментов основано на следующих ее свойствах:

Каждая варианта отклоняется от средней в большую или в меньшую сторону. Это отклонение (d) может быть выражено положительным или отрицательным числом.

Сумма отклонений с положительным знаком всегда равна сумме отклонений с отрицательным знаком, следовательно, алгебраическая сумма отклонений всех вариант от средней равна нулю ( это свойство средней лежит в основе данного способа вычисления).

Средняя арифметическая равна любой произвольно взятой величине плюс

среднее отклонение от нее всех членов ряда, которое имеет выражение

∑Pd и

называется моментом первой степени (обозначается буквой А)

n

Средняя арифметическая вычисляется по формуле:

 

М = М1 +

d P

где М -

средняя арифметическая

 

,

 

 

n

 

 

 

 

 

М1 - “ условная” средняя арифметическая

 

 

d -

отклонение условной средней от вариант

 

 

Р -

частота

 

 

 

n -

число наблюдений

 

 

 

∑ -

знак суммирования

 

Вычисление ведется от “ условной” средней (М1). За среднюю условно принимается любая варианта, чаще мода (как наиболее часто встречающаяся варианта). Если эта величина действительно средняя арифметическая, то сумма отклонений всех вариант от нее будет равна нулю. Если сумма отклонений будет рав-

24

няться какой-то величине, то это означает, что “ условная” средняя не соответствует действительной и к ней требуется поправка (момент первой степени - А):

∑Pd

Если, А = n

, тогда

М = М1 + А

 

ПРИМЕР: Средняя дневная нагрузка врача-терапевта в поликлинике

 

 

 

 

 

 

 

 

 

 

Число больных (V)

 

Число приемов (Р)

 

d (d = V - M1)

 

Pd

14

 

 

 

2

 

 

- 4

 

- 8

15

 

 

 

1

 

 

- 3

 

- 3

16

 

 

 

3

 

 

- 2

 

- 6

17

 

 

 

3

 

 

- 1

 

- 3

18

 

 

 

4

 

 

0

 

0

19

 

 

 

4

 

 

+ 1

 

+ 4

20

 

 

 

3

 

 

+ 2

 

+ 6

21

 

 

 

2

 

 

+ 3

 

+ 6

 

 

 

 

n = 22

 

 

 

 

∑Pd = - 4

∑Pd

 

-4

 

 

 

 

 

 

М1 = 18; n =

22

= - 0,18

 

 

 

 

 

Таким образом, М =

18

+ (- 0,18)

= 17,82.

 

 

 

Последовательность вычислений: Выбираем “ условную” среднюю М1 = 18 больных

Определяем отклонение ( d ) каждой варианты от “ условной” средней

d = V - M1

Найденные отклонения умножают на частоты P × (V - M1) = Pd Вычисляем алгебраическую сумму всех отклонений ∑Рd = - 4 По формуле определяем среднюю арифметическую

 

∑Pd

 

- 4

 

М = М1 + n

М = 18 + 22 = 18 + (- 0,18) = 17,82

ПАРАМЕТРЫ СРЕДНЕЙ АРИФМЕТИЧЕСКОЙ

Средние величины являются важными характеристиками совокупности, однако они полностью не раскрывают индивидуальные значения признака, которые отличаются от средних и различаются между собой. Средние величины скрывают изменчивость, колеблемость признака, его рассеянность.

При обработке вариационного ряда недостаточно только лишь вычислить среднюю арифметическую, нужно еще оценить, насколько она типична и достоверна для данной совокупности. Для этого в статистике существуют специальные параметры средней - мера типичности и мера достоверности.

ОЦЕНКА ТИПИЧНОСТИ СРЕДНЕЙ АРИФМЕТИЧЕСКОЙ

Чем вариационный ряд более компактен, менее рассеян, тем лучше средняя арифметическая характеризует данную совокупность.

Если вариационный ряд растянут, отдельные значения вариант сильно отклоняются от средней (т.е. имеется большая вариабельность, колеблемость признака), то средняя хуже характеризует ряд в целом и является менее типичной для данной совокупности.

25

Таким образом, кроме средней необходима еще одна характеристика ряда: его колеблемость.

Простейшей мерой колеблемости ряда является амплитуда (вариационный размах), т.е. разность крайних вариант. Например, при подсчете частоты пульса у одной группы обследованных средняя составляла 68, минимальное число было 60, а максимальное - 70. У второй группы средняя частота пульса составляла также 68, но наименьшее число было 55, а наибольшее - 80. Амплитуда в первой группе значительно меньше и, следовательно, все значения группируются вокруг средней. Вторая совокупность более разнообразна, ее рассеяность велика и колебания отдельных значений от средней больше; следовательно, средняя в этой группе менее типична , чем в первой группе.

Мерой колеблемости, изменчивости признака и мерой типичности средней арифметической является среднее квадратическое отклонение (сиг-

ма - σ), которое определяется по формуле (по способу моментов):

 

 

 

 

 

 

 

σ =

 

d 2 p

 

 

 

dp 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

ПРИМЕР:

Результаты измерения массы тела мальчиков 12 лет

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Масса тела

 

Число лиц (Р)

 

 

 

 

 

 

 

d2

d2P

 

(V)

 

 

 

 

 

d = (V - M1)

 

 

Pd

 

20

 

1

 

 

- 5

 

 

 

- 5

25

25

 

22

 

5

 

 

- 3

 

 

 

- 15

9

45

 

23

 

6

 

 

- 2

 

 

 

- 12

4

24

 

25 = M1

 

10

 

 

0

 

 

 

0

0

0

 

28

 

5

 

 

3

 

 

 

15

9

45

 

29

 

4

 

 

4

 

 

 

16

16

64

 

31

 

2

 

 

6

 

 

 

12

36

72

 

 

 

 

n = 33

 

 

 

 

 

 

∑Pd = 11

 

∑Pd2 = 275

 

∑Pd2

 

 

∑Pd 2

 

275

11 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

- 33 = ± Ö 8,3- (0,33)2 = ± Ö 8,3 - 0,1= ± 2,86 кг

 

s = ± Ö n

 

- n

= ± Ö

33

Чем больше среднее квадратическое отклонение, тем выше колеблемость данного вариационного ряда.

Для оценки типичности средней арифметической с помощью среднего квадратического отклонения в статистике применяется так называемое “ правило трех сигм” . Это правило основано на законе нормального распределения и отражает

теоретическую закономерность распределения вероятностей случайных со-

бытий в условиях бесконечно большого количества наблюдений.

Согласно теории вероятности, в явлениях, подчиняющихся закону нормального распределения, между значениями средней арифметической ( М ), средним квадратическим отклонением ( σ ) и отдельными значениями вариант существует строгая зависимость: в интервале М±1σ находится 68,3% всех вариант ряда, в

интервале М±2σ - 95,5%, в интервале М±3σ находится 99,7% всех вариант,

т.е. практически весь вариационный ряд укладывается в этот предел.

26

Таким образом, среднее квадратическое отклонение является стандартным отклонением, позволяющим предвидеть вероятность появления такого значения изучаемого признака, которое находится в пределах заданных границ.

М± 1 σ → 68,3%

М± 2 σ → 95,5%

М± 3 σ → 99,7%

Для того, чтобы проверить, насколько средняя арифметическая типична для той совокупности, из которой она вычислена, нужно к ней прибавить и отнять утроенную сигму ( М±3σ ). Если в полученный интервал данный ва-

риационный ряд укладывается, то средняя типична; если не укладывается - средняя нетипична, совокупность неоднородна и число наблюдений недос-

таточно.

Графическим изображением “ правила трех сигм” является кривая нормального распределения (биноминальная кривая Ньютона, кривая Гаусса).

Форма этой кривой отражает степень вариабельности результатов наблюдений: при большой разбросанности данных она будет пологой, при малой разбросанности - крутой. В силу симметричности кривой перпендикуляр, опущенный из ее максимума на ось абсцисс, пересекает ее в точке, соответствующей среднему значению данных, отложенных по этой оси ( М, Мо, Ме ).

Практическое значение среднего квадратического отклонения

*Сигма характеризует однородность вариационного ряда

*Зная среднюю величину и сигму, можно определить крайние значения вариант и, при необходимости, построить вариационный ряд. Например: среднее ар-

териальное давление у мужчин 30-39 лет было 120 мм рт. ст. при σ = 10 мм.

Тогда Vmin = M - 3 σ = 120 - 30 = 90 мм Vmax = M + 3 σ = 120 + 30 = 150 мм

СТАТИСТИЧЕСКАЯ ОЦЕНКА ДОСТОВЕРНОСТИ ПОЛУЧЕННЫХ ДАННЫХ

Полученные в результате статистического исследования средние и относительные величины должны отражать закономерности, характерные для всей совокупности. Результаты исследования обычно тем достовернее, чем больше сделано наблюдений, и наиболее точными они являются при сплошном исследовании (т.е. при изучении генеральной совокупности). Однако должны быть достаточно надежны и данные, полученные путем выборочных исследований, т.е. на относительно небольшом числе наблюдений.

Различие результатов выборочного исследования и результатов, которые могут быть получены на генеральной совокупности, представляет собой ошибку выборочного исследования, которую можно точно определить математическим путем. Метод ее оценки основан на закономерностях случайных вариаций, установленных теорией вероятности.

ОЦЕНКА ДОСТОВЕРНОСТИ СРЕДНЕЙ АРИФМЕТИЧЕСКОЙ

Средняя арифметическая, полученная при обработке результатов научнопрактических исследований, под влиянием случайных явлений может отличаться

27

от средних, полученных при проведении повторных исследований. Поэтому, чтобы иметь представление о возможных пределах колебаний средней, о том, с какой вероятностью возможно перенести результаты исследования с выборочной совокупности на всю генеральную совокупность, определяют степень достоверности средней величины.

Мерой достоверности средней является средняя ошибка средней ариф-

метической (ошибка репрезентативности - m). Ошибки репрезентативности возникают в связи с тем, что при выборочном наблюдении изучается только часть генеральной совокупности, которая недостаточно точно ее представляет. Фактически ошибка репрезентативности является разностью между средними, полученными при выборочном статистическом наблюдении, и средними, которые были бы получены при сплошном наблюдении (т.е. при изучении всей генеральной совокупности).

Средняя ошибка средней арифметической вычисляется по формуле:

m =

σ

при числе наблюдений больше 30 (n > 30) и

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

s

 

m = ±

Ö n-1 при небольшом числе наблюдений (n < 30).

Ошибка репрезентативности прямо пропорциональна колеблемости ря-

да (сигме) и обратно пропорциональна числу наблюдений.

Следовательно, чем больше число наблюдений, (т.е. чем ближе по числу наблюдений выборочная совокупность к генеральной), тем меньше ошибка репрезентативности.

Интервал, в котором с заданным уровнем вероятности колеблется истинное значение средней величины или показателя, называется доверительным интервалом, а его границы - доверительными границами. Они используются для определения размеров средней или показателя в генеральной совокупности.

Доверительные границы средней арифметической и показателя в генеральной совокупности равны:

М ± tm

P ± tm , где t - доверительный коэффициент Доверительный коэффициент ( t ) - это число, показывающее, во сколько

раз надо увеличить ошибку средней величины или показателя, чтобы при данном числе наблюдений с желаемой степенью вероятности утверждать, что они не выйдут за полученные таким образом пределы.

C увеличением t степень вероятности возрастает.

Т. к. известно, что полученная средняя или показатель при повторных наблюдениях, даже при одинаковых условиях, в силу случайных колебаний будут отличаться от предыдущего результата, теорией статистики установлена степень вероятности, с которой можно ожидать, что колебания эти не выйдут за определен-

ные пределы. Так, колебания средней в интервале М ± 1m гарантируют ее точность с вероятностью 68,3% (такая степень вероятности не удовлетворяет

28

исследователей), в интервале М ± 2m - 95,5% (достаточная степень вероятности)

ив интервале М ± 3m - 99,7% (большая степень вероятности).

М± 1 m 68,3 %

М± 2 m 95,5 %

М± 3 m 99,7 %

Для медико-биологических исследований принята степень вероятности

95% ( t = 2 ), что соответствует доверительному интервалу М ± 2 m.

Это означает, что практически с полной достоверностью (в 95%) можно

утверждать, что полученный средний результат (М) отклоняется от ис-

тинного значения не больше, чем на удвоенную (М ± 2 m) ошибку.

Конечный результат любого медико-статистического исследования выражается средней арифметической и ее параметрами:

М ± 3σ ± 2m

ОЦЕНКА ДОСТОВЕРНОСТИ ОТНОСИТЕЛЬНЫХ ВЕЛИЧИН (ПОКАЗАТЕЛЕЙ)

Средняя ошибка показателя также служит для определения пределов его случайных колебаний, т.е. дает представление, в каких пределах может находиться показатель в различных выборках в зависимости от случайных причин. С увеличением численности выборки ошибка уменьшается.

Мерой достоверности показателя является его средняя ошибка ( m ), ко-

торая показывает, на сколько результат, полученный при выборочном исследовании, отличается от результата, который был бы получен при изучении всей генеральной совокупности.

Средняя ошибка показателя определяется по формуле:

mp =

Pq

,

где mp - ошибка показателя

 

 

 

 

n

 

 

 

 

 

 

 

 

 

р -

показатель

 

 

 

 

q

-

величина, обратная показателю (100-р, 1000-р и

 

 

 

 

 

т.д. в зависимости от того, на какое основание

 

 

 

 

 

рассчитан показатель)

 

 

 

n

-

число наблюдений

 

ПРИМЕР: Из стационара выбыло 289 больных, умерло 12.

Показатель летальности:

 

12 ´100

 

 

 

 

 

р =

289

= 4,1%

 

 

 

 

 

4,1 ´ (100-4,1)

4,1 ´ 95,9

 

 

 

m p = ±Ö

289

= ±Ö

289

 

= ± 1.16%

Возможные пределы колебаний показателя равняются 4,1% ± 1,16% (Р±mp).

ОЦЕНКА ДОСТОВЕРНОСТИ РАЗНОСТИ СРЕДНИХ И ОТНОСИТЕЛЬНЫХ ВЕЛИЧИН

29