Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Мет Р практ АНАЛІЗ ВЗАЄМОЗВ’ЯЗКУ МІЖ ДОСЛІДЖУВА...doc
Скачиваний:
4
Добавлен:
08.11.2019
Размер:
153.09 Кб
Скачать

4. Зміст заняття (тези). Кореляційно – регресійний аналіз

Якщо зміна одного параметра на певну величину, завжди призводить до зміни іншого також на певну фіксовану величину, можна говорити про функціональну залежність між ними. Такий взаємозв’язок часто має місце при вивченні хімічних та фізичних явищ (закон Бойля - Маріотта).

В медико-біологічних дослідженнях залежність між окремими параметрами не має функціонального зв’язку – певному значенню одного параметра може відповідати декілька значень іншого, що можна визначити як кореляційний зв’язок. Прикладом такої залежності є вага та зріст дітей, тяжкість патології та терміни лікування.

Ранговий коефіцієнт кореляції (Спірмена) відноситься до непараметричних критеріїв оцінки взаємозв’язку. Особливість коефіцієнта - простота обчислення при недостатній точності дозволяє його використовувати для орієнтовного аналізу з проведенням швидких розрахунків при визначенні даних у напівкількісному описовому вигляді. Він базується на визначені рангу кожного значення ряду. Методику розрахунку наведено на прикладі характеристики взаємозв’язку між рівнем перінатального ризику у вагітних та частотою післяпологових ускладнень (табл.1).

Порядок розрахунків:

  1. Визначаємо ранги для значень кожної величини ряду ( х ) та ( у ). Рангування обох рядів повинно бути однонаправленим, наприклад, від меншого до більшого.

  2. Визначаємо відхилення значень першого ряду від другого (dxy). Їх сума з врахуванням знаків повинна дорівнювати нулю.

3. Підносимо отримані результати до квадрата та визначаємо їх суму (d2xy =4).

Таблиця 1.

Взаємозв’язок між рівнем перинатального ризику у вагітних та частотою

післяпологових ускладнень

Перінатальний ризик ( бали)

Х

Частота післяпологових ускладнень (%)

у

Порядкові номери ( ранги )

Різниця рангів

Квадрат різниці рангів

х

у

dxy=х-у

d2xy

До 2

0,4

1

1

0

0

3 – 4

0,8

2

3

- 1

1

5 – 6

0,6

3

2

1

1

7 – 8

1,4

4

5

- 1

1

9 – 10

1,3

5

4

1

1

d2xy = 4

4. Підставляємо отримані результати у формулу:

Висновок: між рівнем перінатального ризику вагітних та частотою післяпологових ускладнень виявлено сильний, прямий кореляційний зв’язок.

Похибка рангового коефіцієнта кореляції для нашого випадку (n  30) визнача-

ється за формулою:

При великому числі спостережень (n  30) середня похибка рангового коефіцієнта кореляції може бути визначена за формулою:

Оцінка вірогідності коефіцієнта кореляції проводиться за тими ж принципами, що використовуються для інших показників з розрахунком критерію вірогідності (t ) і врахуванням числа спостережень число ступенів свободи варіаційних рядів n = n – 2). Отримані результати порівняють с табличними значеннями. Загалом, слід пам’ятати, що для оцінки вірогідності результатів коефіцієнт кореляції повинен перевищувати свою похибку не менше ніж в 2,5 – 3 рази при достатньому числі спостережень.

Для нашого випадку mp = 0,346 і t = p/ mp = 0,80/ 0,346 = 2,31, що, відповідно, нижче граничних значень (t = 3,2 при p0,05). Отриманий результат ( t ) не дозволяє зробити висновок про вірогідність даного рангового коефіцієнта кореляції. Доцільним в даному випадку є використання більшого числа спостережень.

Спрощений метод оцінки рангового коефіцієнта кореляції передбачає порівняння його з критичним табличним значенням для відповідного числа пар спостережень. Коефіцієнт кореляції є значимим з вірогідністю похибки не вище 5,0% ( p0,05), якщо отриманий результат вище чи дорівнює табличному значенню. Для нашого прикладу для 5 пар спостереженням табличне значення p = 0,900 (при p0,05), що вище фактичного значення. Отже, отриманий результат не можна вважати суттєвим.

Для розрахунку коефіцієнта прямолінійної кореляції існує багато методів. Вони визначаються метою, характером та об’ємом дослідження, наявністю обчислювальної техніки. Один з методів був запропонований К.Пірсоном, в науковій літературі відомий як лінійний коефіцієнт кореляції Пірсона. Формула його розрахунку така:

де: х і у – варіанти порівнюваних варіаційних рядів; dx і dy - відхилення кожної варіанти від своєї середньої арифметичної.

Наприклад: визначити залежність між тривалістю паління (роки) та частотою виявлення хронічних бронхітів у молодому віці ( до 29 років ).

Таблиця 2.

Трива-

лість

паління

(роки) (х)

Частота хронічних

Бронхітів

(%) (у)

dx

dy

dx  dy

dx2

dy2

3

6,0

-3,5

-11,0

38,5

12,25

121,0

4

9,0

-2,5

- 8,0

20,0

6,25

64,0

5

12,0

-1,5

- 5,0

7,5

2,25

25,0

6

13,0

-0,5

- 4,0

2,0

0,25

16,0

7

14,0

0,5

- 3,0

1,5

0,25

9,0

8

21,0

1,5

4,0

6,0

2,25

16,0

9

26,0

2,5

9,0

22,5

6,25

81,0

10

35,0

3,5

18,0

63,0

12,25

324,0

=52

=136

dx=0

dy=0

dx dy=161

 dx2=42

 dy2=656

Розрахунок лінійного коефіцієнта кореляції:

  1. Визначають середнє значення для кожного ряду ( , )

  2. Визначають відхилення кожного із значень ряду від середньої величини dx і dy.

  3. Підносять визначені відхилення до квадрата та визначають їх суми:

 dx2=42 та  dy2=656.

  1. Підставивши отримані значення у формулу Пірсона, отримаємо:

Висновок: між тривалістю паління в молодому віці та частотою хронічних бронхітів існує сильний прямий зв’язок.

Вірогідність отриманого результату визначимо за співвідношенням t=r/mr, де mr при малому числі спостережень (n30) дорівнює:

Для нашого випадку коефіцієнт вірогідності:

що значно вище гранично допустимих значень при вірогідності похибки p0,05.

При великому числі спостережень (n30) формула для розрахунку середньої похибки коефіцієнта кореляції має інший вигляд:

Прямолінійний кореляційний зв’язок між параметрами характеризується тим, що кожному з однакових вимірів одного показника відповідає певне середнє значення іншого показника. Дану залежність можна описати коефіцієнтом регресії. Він показує, на яку величину в середньому зміниться другий параметр при зміні першого на певну одиницю виміру. Розраховується коефіцієнт регресії за формулою:

де - коефіцієнт регресії ознак х по у; - коефіцієнт кореляції; та - середні квадратичні відхилення рядів (x) та (y).

Розглянемо використання коефіцієнта регресії на прикладі. При аналізі даних фізичного розвитку 7 – річних хлопчиків отримані наступні параметри фізичного розвитку за зростом ( ) та вагою ( ): = 120,0 см; = 6,0 см та = 26,0 кг; = 2,2 кг; = 0,76.

Коефіцієнт регресії за даних умов складає:

Отже, при зміні зросту на 1 см вага хлопчиків в середньому зміниться на 0,28 кг. Визначений коефіцієнт регресії можна використати в рівнянні регресії при прогнозуванні ситуації – яка вага в середньому буде відповідати зросту хлопчиків 125,0 см: