Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Otvety_OZZ.doc
Скачиваний:
188
Добавлен:
29.01.2019
Размер:
2.27 Mб
Скачать

Регрессионный анализ

Прямолинейная корреляция отличается тем, что при этой Форме связи каждому значению одного признака соответствует определенное в среднем значение другого признака.

Та величина, на которую в среднем изменяется второй признак при изменении первого на единицу, называется коэффициентом рег­рессии.

Для расчета коэффициента регрессии используется следующая фор­мула:

Рассмотрим методику расчета коэффициента регрессии на примере.

При анализе физического развития 7-летних мальчиков были полу­чены следующие средние значения роста (X) и массы тела (У):

X = 118.4 см

х = +/-6.0 см

У = 24.0 кг

у = +/-2.6 кг

Коэффициент корреляции между весом и ростом составил +0.7. Расчет коэффициента регрессии выполняется по формуле:

Следовательно, с изменением роста 7-летних мальчиков на 1 см. масса тела в среднем изменяется на 0.3 кг.

С помощью коэффициента регрессии без специальных измерений можно определить величину одного из признаков (например, массы тела), зная значение другого (роста). С этой целью используется уравнение линейной регрессии:

у = My + Rxy(х - Мх),

где у - искомая величина массы тела;

My - среднее значение массы тела, характерное для данного

возраста;

Rxy - коэффициент регрессии массы тела по росту;

х - известная величина роста;

Мх - средне значение роста.

Определим, какова будет масса тела 7-летнего мальчика при рос­те 120 см.

у = Мy + Rxy(х - Мх) = 24 + 0.3(120 - 118) = 24.6 кг

Коэффициенты регрессии и уравнения регрессии широко применяют­ся для составления шкал регрессии, которые используются при инди­видуальной оценке физического развития.

Критерий соответствия Хи-квадрат. Понятие о «нулевой гипотезе», этапы расчета критерия соответствия. Применение в практическом здравоохранении.

Нулева́я гипо́тезагипотеза, которая проверяется на согласованность с имеющимися выборочными (эмпирическими) данными. Часто в качестве нулевой гипотезы выступают гипотезы об отсутствии взаимосвязи или корреляции между исследуемыми переменными, об отсутствии различий (однородности) в распределениях (параметрах распределений) двух и/или более выборках. В стандартном научном подходе проверки гипотез исследователь пытается показать несостоятельность нулевой гипотезы, несогласованность её с имеющимися опытными данными, то есть отвергнуть гипотезу. При этом подразумевается, что должна быть принята другая, альтернативная (конкурирующая), исключающая нулевую, гипотеза. Используется при статистической проверке.

Критерий хи-квадрат — любая статистическая проверка гипотезы, в которой выборочное распределение критерия имеет распределение хи-квадрат при условии верности нулевой гипотезы. Считается, что критерий хи-квадрат — это критерий, который асимптотически верен, то есть, выборочное распределение можно сделать как угодно близким к распределению хи-квадрат путём увеличения размера выборки.

ТАБЛИЦА ОЦЕНКИ ЗНАЧЕНИЙ КРИТЕРИЯ СООТВЕТСТВИЯ «ХИ-КВАДРАТ»

Число степеней свободы (n´)

Р (величина ошибки)

0,05 = 5%

0,01 = 1%

0,002= 0,02%

1

3,8

6,6

9,5

2

6,0

9,2

12,4

3

7,8

11,3

14,8

4

9,5

13,3

16,9

5

11,1

15,1

18,9

6

12,6

16,8

20,7

7

14,1

18,5

22,6

8

15,5

20,1

24,3

9

16,9

21,7

26,1

10

18,3

23,2

27,7

11

19,7

24,7

29,4

12

21,0

26,2

31,0

13

22,4

27,7

32,5

14

23,7

29,1

34,0

15

25,0

30,6

35,5

16

26,3

32,0

37,0

17

27,6

33,4

38,5

18

28,9

34,8

40,0

19

30,1

36,2

41,5

20

31,4

37,6

43,0

21

32,7

38,9

44,5

22

33,9

40,3

46,0

23

35,2

41,6

47,5

24

36,4

43,0

48,5

25

37,7

44,3

50,0

26

38,9

45,6

51,5

27

40,1

47,0

53,0

28

41,3

48,3

54,5

29

42,6

49,6

56,0

30

43,8

50,9

57,5

Нулевая гипотеза предполагает, что две совокупности, сравниваемые по одному или нескольким признакам, не отличаются друг от друга. При этом считается, что действительное различие сравниваемых величин равно нулю, а выявленное по фактическим данным отличие от нуля носит случайный характер.

Для определения, существует или нет зависимость между двумя признаками используется таблица сопряженности двух переменных и критерий хи-квадрат. Как правило, критерий хи-квадрат применяется для анализа таблиц сопряженности номинальных признаков, однако он может использоваться и при анализе взаимосвязи порядковых, или интервальных переменных. Если, скажем, было выяснено, что две переменные не связаны друг с другом, то их дальнейшим исследованием заниматься не стоит. Некоторые указания на связь скорее были обусловлены ошибкой выборки. Если же тест на хи-квадрат указал на связь, то она существует в реальности для генеральной совокупности и ее, возможно, следует изучать. Однако этот анализ не указывает на характер связи.

[сделать другую аналогию какой фактор и заболевание] –Предположим, что изучалась лояльность к определенной марке пива среди служащих и рабочих (двумя переменными, измеренными в шкале наименований). Результаты опроса затабулированы в следующем виде:

Таблица – Матрица сопряженности частот

Покупатели

Непокупатели

Сумма

Служащие

152

8

160

Рабочие

14

26

40

Сумма

166

34

200

Матрица содержит наблюдаемые частоты, которые сравниваются с ожидаемыми частотами, определяемыми как теоретические частоты, вытекающие из принимаемой гипотезы об отсутствии связи между двумя переменными (выполняется нулевая гипотеза). Величина отличия наблюдаемых частот от ожидаемых выражается с помощью величины хи-квадрата. Последняя сравнивается с ее табличным значением для выбранного уровня значимости. Когда величина хи-квадрата мала, то нулевая гипотеза принимается, а, следовательно, считается, что две переменные являются независимыми и исследователю не стоит тратить время на выяснение связи между ними, поскольку связь является результатом выборочной ошибки.

Можно рассчитать ожидаемые частоты приведённого примера, пользуясь таблицей частот:

Ожидаемая частота для ячейки = Сумма для столбца, умноженная на сумму для ряда/Общая сумма

Ожидаемая частота для служащих-покупателей = 160·166/200 = 132,8;

Ожидаемая частота для служащих-непокупателей = 160·34/200 = 27,2;

Ожидаемая частота для рабочих-покупателей = 40·166/200 = 32,2;

Ожидаемая частота для рабочих-непокупателей = 40·34/200 = 6,8.

где Vk – наблюдаемая частота в ячейке;

Pk – ожидаемая частота в ячейке;

n – число ячеек матрицы

Из таблицы критических значений хи-квадрата (стандартные статистические таблицы) вытекает, что для числа степеней свободы, равному в приведённом примере 1 (число степеней свободы = число исследуемых групп – 1), и уровня значимости альфа = 0,05 (допустимая ошибка) критическое значение хи-квадрата равно 3,841. Видно, что расчетное значение хи-квадрата существенно больше его критического значения. Это говорит о существовании статистически значимой связи между родом деятельности и лояльностью к исследованной марке пива, и не только для данной выборки, но и для совокупности в целом. Из таблицы следует, что главная связь заключается в том, что рабочие покупают пиво данной марки реже по сравнению со служащими.