Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Otvety_OZZ.doc
Скачиваний:
188
Добавлен:
29.01.2019
Размер:
2.27 Mб
Скачать

Измерение связи. Применение методов корреляции и регрессии в работе врачей службы государственного санитарного надзора.

Статистическое измерение связи

Задачи статистики в изучении связи. Взаимосвязанные признаки и их классификация.

Задачи статистики состоят в выявлении связи, определении ее направления и ее измерении. Наиболее же общая задача – это прогнозирование и регулирование социально-экономических явлений на основе полученных представлений о связях между явлениями.

Статистика рассматривает экономический закон как существенную и устойчивую связь между определенными явлениями и процессами. Познавая связи, статистика познает законы. А их знание позволяет управлять общественным развитием.

Основой изучения связей является качественный анализ.

Различают два вида признаков:

(1) Факторные – те, которые влияют на изменение других процессов.

(2) Результативные – те, которые изменяются под воздействием других признаков.

Корреляционный анализ

Многие явления в медицине, так же, как в природе и обществе, взаимосвязаны между собой. При проведении статистического иссле­дования часто возникает необходимость проанализировать выявлен­ные связи между различными явлениями и дать обобщающую характе­ристику. Различают 2 Формы проявления связей между явлениями: функциональную и корреляционную.

Функциональная связь означает строгую зависимость одного приз­нака от другого, когда определенному значению одной величины соответствует строго определенное значение другой. Например, ра­диусу круга соответствует определенная площадь круга; скорость свободно падающего тела определяется величиной ускорения, силы тяжести и времени падения. Функциональная связь характерна для физико-химических процессов.

Корреляционная связь - это такая связь, когда изменение како­го-либо одного признака ведет к изменению другого, но на неопре­деленное значение.

Врачи и биологи хорошо знакомы с этим видом связи. Корреля­ционная связь проявляется между ростом детей и их родителей, мас­сой тела и ростом, числом эритроцитов и содержанием гемоглобина, дозой зараженного агента и летальностью животных и т.д.

Корреляционная зависимость отличается по форме, направлению и силе связи.

По форме корреляционная связь может быть прямолинейной и кри­волинейной. Прямолинейная связь - равномерные изменения одного признака соответствуют равномерным изменениям второго признака при незначительных отклонениях. Криволинейная связь - равномер­ные изменения одного признака, соответствуют неравномерным изме­нениям второго признака, причем неравномерность имеет определенную закономерность. Общая тенденция в определенном моменте изме­няет свое направление, дает изгиб.

Направление связи может быть прямое (положительное) или обрат­ное (отрицательное).

Прямая связь - если с увеличением одного признака второй так­же увеличивается или с уменьшением одного признака другой тоже уменьшается. Например, с увеличением роста увеличивается масса тела, с уменьшением заболеваемости уменьшается смертность. Обрат­ная связь - когда с увеличение одного признака, другой, корреля­ционно связанный с ним признак, уменьшается. Например, с увеличе­нием охвата прививками уменьшается заболеваемость инфекционными болезнями, с увеличением санитарной грамотности и образованием матери уменьшается младенческая смертность.

Под силой связи следует понимать степень корреляции.

Таблица 7

Критерии оценки коэффициента корреляции

СТЕПЕНЬ СВЯЗИ

Величина коэффициента корреляции

при прямой

при обратной

Малая (слабая)

от 0 до +0.3

от 0 до -0.3

Средняя (умеренная)

от 0.3 до +0.69

от -0.3 до -0.69

Большая (сильная)

от 0.7 до +0.99

от -0.7 до -0.99

Функциональная

+1

-1

Измерение силы связи осуществляется путем вычисления коэффи­циента корреляции. Рассмотрим два способа расчета коэффициента корреляции.

I. Парный коэффициент корреляции рядов (rху) вычисляется по фор­муле:

Рассмотрим на примере методику расчета коэффициента корреляции этим методом (Таблица 8).

Таблица 8

Показатели

Отклонения

Квадрат отклонения

железа в г%,

VX

гемогло­бина в %, Vy

dx

dy

dx*dy

dx2

dy2

1

2

3

4

5

6

7

48

65

-4

-4

16

16

16

48

66

-4

-3

12

16

9

49

68

-3

-1

3

9

1

50

68

-2

-1

2

4

1

51

70

-1

1

-1

1

1

53

70

1

1

1

1

1

54

70

2

1

2

4

1

57

72

5

3

15

25

9

58

72

6

3

18

36

9

468

621

68

112

48

При сопоставлении показателей содержания железа и гемоглобина в крови отмечается увеличение уровня гемоглобина с ростом коли­чества железа. Следует определить степень связи между этими пока­зателями и достоверность полученного результата.

Вычисления проводятся по следующему алгоритму: 1) Вычисляем средние арифметические рядов X и Y:

2) Определяем отклонения вариант каждого ряда от своей средней (dx и dу): смотри графы 3 и 4 в Таблице 3.

3) Находим произведение dx*dy: смотри графу 5 в Таблице 8. Полу­ченные значения суммируются с учетом знаков.

4) Возводим в квадрат dx и dy и суммируем полученные значения: смотри графы 6 и 7 в Таблице 8.

5) Вычисляем коэффициент корреляции:

Вывод: Отмечается очень сильная корреляционная связь между содер­жанием в крови железа и гемоглобина.

Для оценки достоверности коэффициента корреляции вычисляется его средняя ошибка:

- при числе наблюдений более 100;

- при числе наблюдений от 30 до 100;

- при числе наблюдений менее 30.

В рассматриваемом нами примере следует использовать последнюю формулу, поскольку число наблюдений равно 9:

Для оценки величины полученной ошибки следует использовать критерий достоверности (t).

При числе наблюдений более 30 коэффициент корреляции достове­рен, если критерий t больше или равен 3. При числе наблюдений ме­нее 30 критерий t оценивается по специальной.

В рассматриваемом нами примере

Это больше табличного значения, что подтверждает достовер­ность выявленной сильной связи и взаимозависимости анализируемых явлений.

II. Ранговый коэффициент корреляции (ρ) относится к непараметри­ческим критериям и предложен Спирменом. Он используется при необ­ходимости получения быстрого результата и основан на определении ранга (места) каждого из значений ряда.

Для вычисления рангового коэффициента корреляции используется следующая формула:

Рассмотрим методику вычисления рангового коэффициента корреля­ции на следующем примере (Таблица 9).

Таблица 9.

Годы

Число травм на 100 рабо­чих

Число гнойнич­ковых заболе­ваний на 100 ра­бочих

Ранги

dxy

d2xy

х

у

1992

5.0

4.0

1

2

-1

1

1993

6.1

3.5

2

1

+1

1

1994

9.0

4.8

5

4

+1

1

1995

8.6

5.5

4

5

-1

1

1996

7.4

4.2

3

3

0

0

При сопоставлении частоты травматизма и распространенности гнойничковых заболеваний среди рабочих промышленного предприятия отмечается рост гнойничковых заболеваний с увеличением травматиз­ма. Следует определить степень связи между этими показателями и достоверность полученного результата.

Вычисления проводятся по следующему алгоритму:

1) Определяем ранги по значению каждой величины ряда. Важно соот­ветствие. Если первый ряд ранжируется от меньшего значения к большему, то второй ряд следует ранжировать в том же порядке.

2) Отмечаем отклонение значимости рангов первого ряда от второ­го (dxy): смотри графу 6 в таблице 9. Они в сумме с учетом зна­ков равны нулю.

3) Возводим в квадрат полученные отклонения и суммируем их. В на­шем примере d2xy = 4: смотри графу 7 в таблице 9.

4) Рассчитываем ранговый коэффициент корреляции:

Вывод: Корреляция прямая, высокая. Между травматизмом и частотой гнойничковых заболеваний на предприятии существует тесная связь.

Оценка достоверности полученного рангового коэффициента корре­ляции выполняется по методике, которая была разобрана для коэффи­циента корреляции рядов.