Добавил:
kiopkiopkiop18@yandex.ru Вовсе не секретарь, но почту проверяю Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

5 курс / ОЗИЗО Общественное здоровье и здравоохранение / Медицинская_статистика_Жижин_К_С_

.pdf
Скачиваний:
1
Добавлен:
24.03.2024
Размер:
8.17 Mб
Скачать

Глава б. Критерии сдвига 8 изучаемых СОВОКУ"НОСТАХ

••

 

 

 

Упражнение 21. • • • • • • • • • • • • • • • • • • • • • •

11рименение коэффициента Спирмена для выявления

корреляционной связи (пакет SPSS)

УслоВие. Действительно ли в разных видах мясной про­

дукции(свинина,баранина, говядина, куриноемясо)содер­

жание цианкобаламина (витамина В12) статистически досто­

верно разнится (МГ%)?

Решение:

1.Запустим пакет и введем исходные данные: по каж­

дой выборке в отдельные столбцы.

2.В главном меню пакета nОСЛt'!доаательно выбираем

команды: (Статистики) - (Коррелировать) - (Парные кор­

реляции).

з. В окне парных корреляций зададим переменные:

1-4 и установим флажки в следующие поля:

в разделе (Коэффициенты корреляции) флажком ус­

тановим вид к~Эффициента корреляции -

(Коэффи­

циент Спирмена); .

 

 

 

 

 

 

 

 

 

 

 

 

 

N20браэца

Свинина

 

Говядина

Баранина

 

Куриное

 

 

 

мясо

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

12

 

12

13

 

14

 

2

13

 

11

13

 

12

 

3

14

 

12·

13

 

13

 

4

15

 

13

12

 

13

 

5

12

 

12

14

 

13

 

6

12

 

12

15

 

14

 

7

12

 

13

13

 

11

 

8

13

 

12

12

 

11

 

9

14

 

12

13

 

12

 

10

15

 

12

13

 

13

 

11

13

 

15

13

 

14

 

12

12

 

13

13

 

15

 

13

15

 

12

13

 

16

 

14

15

 

11

13

 

12

 

15

15

 

10

12

 

13

 

16

16

 

10

11

 

14

 

70

 

 

Медицинская статистика

 

 

 

 

 

 

Окончание табл.

 

 

 

 

 

 

 

 

 

 

 

N2 образца

Свинина

Говядина

Баранина

Куриное

 

 

 

мясо

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

17

15"

12

11

 

11 .

 

 

 

18

12

11

12

 

 

 

 

11

 

 

 

19

12

11

13

 

10

 

в разделе (Проверка значимости) выберем тип кри­

терия -" (Двухсторонний),

поставим флажок в поле (Отметка значимых корре­ ляций).

4.Нажав ОК, ВЫПОllНИМ проверку и перейдем в окно (Просмотр реЗУ1tьтатов).

Выявлены следующие значимые корреляционные связи:

- между Уаг1 и VагЗ при р == 0,01 З,

-- между остальными парами значений коэффициенты

ранговой корреляции недостоверны.

• • • • • • • • • • • • • • • • • • • • • • • • •

Упражнение 22.· . . · · . . . · . . · . · · • • . · · · •

Применение коэффициента Спирмена для выявления

корреляционной связи (пакет Statistica).

Решение:

1. Запустив пакет Statistica, переключимся в модуль (Не­

параметрические статистики и подгонка распределения).

Затем введем данные в отдельные столбцы, соответствую­

щие переменным 1, 2, 3, 4.

2. В стартовом окне выберем команду (Корреляции).

З. В открывшемся диалоговом окне Непараметрических корреляций зададим анализируемые ~epeMeHHыe (1-4), при­

чем одни и те же и в первом, и во втором списке.

4.В поле (Корреляция) выберем значение (Коэффици­

ент Спирмена).

5.В поле выберем значение (Подробный отчет).

6.Нажав ОК, получим подборку коэффициентов корре­

ляции Спирмена.

Днализ результатов показывает, что выявлены следую­

щие статистически значимые корреляционные связи:

Глава б. Критерии сдвига в изучаеМblХ совокупностях

71

между Var1 и VагЗ различия значимы: р = -0,56, при

р< 0,005;

между остальными вариантами различия незначимы.

ОтВет: значения коэффициентов Спирмена и оценка их

уровней значимости практически не отличаются от данных,

полученных а пакете SPSS, совпадают с полученными ра­

нее в пакете Statistica.

Глава 7 ---------

РЕГРЕССИОННЫЙ АНАЛИЗ

Методы регрессионного анализа позволяют по имею­

ЩИМСЯ данным предсказывать новые результаты, т. е. ори­

ентированы на планирование и прогнозирование. Цель

регрессионного анализа заключается в том, чтобы статис­

тически адекватно связать «выходные», зависимые вари­

анты с «входными» - независимыми.

Независимые переменные иногда называют предик­ торами, регрессорами, факторами, а зависимые - откли­

ками.

Регрессия бывает линейной Или нелинейной, простой,

когда связаны не более двух признаков, или сложной (мно­

жественной), когда число связываемых анализом призна­

ков значительно больше, чем два.

Общий вид модели линейной множественной реГрес­

сии может быть задан следующим образом: предположим,

что в выборке испытуемых есть независимые и зависимые

переменные. Чтобы не усложнять обозначения, в модели

линейной множественной регрессии предполагается, что

значения отклика, принимаемые им на рассматриваемом

множестве объектов, связаны со значениями предикторов на этих объектах с помощью системы линейных, уравне­ ний. В обобщенном,виде этот процесс можно представить

в виде одного-единственного уравнения регрессии, в ко­

тором подразумевается, что отклик и предикторы могут

Глава 7. Регрессионныйанаnиз

71

принимать значения на любом из рассматриваемы~ объек­

тов: исследователя обычно интересует, насколько точны l1РОГНОЗЫ, получаемые по построенной регрессии.

Стандартный вид уравнений регрессии получается в том

случае, если и отклики, и предикrоры представлены в стан­

дapтизoBaHHыx «z-значениях», Т. е. в значениях, находяших­

ея в диапазоне от О до 1. При практической реализации рег­

рессионного анализа, в том числе в статистических паке­

тах программ, понять, что уравнение регрессии записано в

стандартизованном виде, ·можно, во-первых, по надичию

обозначений «бета» для коэффициентов регрессии, во-вто­ рых, нередко используют «смешанную>} форму уравнения:

когда предикторы цредставлены z-значениями, а отклик­

исходными, ненормированными значениями. В-третьих,

часто под уравнением регрессии понимают прогно­

стическое уравнение, т. е. уравнение, используемое для

предсказания значений отклика по известным значениям

предикторов. Другими словами, на практике уравнение

регрессии может быть записано в одной из множества

форм. Такая ситуация требует от исследователя вниматель­ ности и эрудиции, чтобы по контексту определить, о ка­ кой именно форме уравнения регрессии идет речь в кон­

кретном случае.

Независимо от.конкретноЙ формы используемого рег­

рессионного уравнения результат регрессионноro анали­

за оценивается по:

1) суммарному уровню взаимосвязи предикторов и от­

клика,

2) существенности вклада каждого предиктора в оцен­

ку отклика,

3) точности предсказания значений отклика и веро­

ятных ошибок их оценки.

Суммарный уровень взаимосвязи оценивается по ве­ личине коэффициентов множественной корреляции R ИЛИ

множественной детерминации - R2:

Коэффициент .множественной детер.минации является

одним из основных показателей качества регрессии. Он

7.

Медицинская статистика

принимает значения в диапазоне от нуля до единицы, при

этом, чем ближе его значение к единице, тем выше каче­

ство регрессии.

Коэффициент множественной корреляции равен квад­ ратному корню из коэффициента множественной детер­ минации. Он также принимает значения в диапазоне от нуля до единицы, и чем ближе к единице, тем выше каче­

ство регрессии.

И чем ближе эти два показателя по своим абсолютным значениям, тем ближе линия регрессии к прямо ПРОПQр­

циональной или линейной зависимости между анализи­

руемыми переменными, чем больше разница - тем более

вероятна между ними криволинейная зависимость.

Обычно при оценивании качества регрессии с помо­

щью F-крuтерuя Фишера выполняется оценка уровня ста­

тистической значимости коэффициента множественной

корреляции.

Таким образом, один из основных критериев оцени­

вания качества регрессии связан с суммарной величиной

остатков: чем эта величина меньше, тем лучше регрес­

сия .описывает имеющиеся данные. При этом использу­

ется сумма квадратов остатков, так как сами по себе

остатки могут иметь разные знаки и в силу этого взаим­

но «погашать» друг друга. В силу этого в регрессионном

а~ализе часто применяют следующие вспомогательные

показатели:

сумма квадратов отклонений от среднего точных

(измеренных) значений откликов;

сумма квадратов отклонений предсказанных (вы­ численных с помощью регрессионного уравнения)

значений откликов от 'среднего по всем предсказан­

НЬ1м значениям;

сумма квадратов остатков, т. е. разностей между точ­

ными и предсказанными значениями откликов..

Определение существенности вклада каждого предик­

тора в оценку отклика проводи1ся с помощьюрегрессион­

ных коэффициентов по f-критерию Стьюдента.

Глава 7. Регрессионный анализ

75

Мерилом точности предсказания значений отклика и вероятных ошибок их оценки является значение коэффи~ циента множественной детерминации.

Для корректного вывода при использовании регресси­ онного анализа требуется выполнение ряда условий:

использование только количественных - интер­ вальных шкал;

распределение предикторов, отклика и остатков

дол~но соответствовать нормальному закону;

не должно быть взаимной коррелированности пре­

дикторов.

Регрессионный анализ включает в себя множество раз­

нообразных методов, из которых на практике распрост­

ранены стандартный и п()шаговыЙ. -

Пошаговый метод, в частности, применяется в одном

из следующих двух вариантов:

прямой - до максимально возможного количества предикторов, обеспечивающих статистически зна­ чимый коэффициент множественной корреляции;

обратный - до минимального количества предик­ торов, также обеспечивающих статистически зна­ чимый коэффициент множественной корреляuии.

Упражнение 23. • • • • • • • • • • • • • . • • • • • • • •

Регрессионный анализ с помощью метода ввода (Enter)

в пакете SPSS.

УслоВие. В шести кабинетах производственного обуче­

ния межшкольного учебно-производственного комбината, в

мастерской общеобразовательной школы и в мастерской

профессионально-технического училища иэучалось влияние

шума на организм учащихся.

Требуется: найти регрессионную связь уровней шума

на рабочих местах с октавными частотами (Var1 - б3 - Va!8

- 8000 Гц) и уровнем звука в ДБА (Var9).

Решение:

1. Запус·гим пакет SPSS. Введем Гlредикторы в виде

Уаr1-8, варианту отклика обозначим Var9.

78

 

 

 

 

 

 

 

 

 

Медицинская статистика

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Место

 

 

 

 

 

 

 

 

 

 

 

Уровень

 

 

 

 

 

Частоты. Гц

 

 

 

эsука.

 

иЗмерения

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ДБА

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

шума

 

63

 

125

250

 

500

1000

 

2000

4000

8000

70

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Мастерская

70

 

66

67

 

66

654

 

63

55

50

70

 

UJ(ОЛЫ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Кабинеты УПК

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Худ. вышивка

72

 

66

66

 

66

64

 

61

55

70

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Швейное

50

 

64

70

 

66

65

 

55

50

70

 

дело

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Сборка часов

55

 

54

65

 

65

65

 

61

61

51

70

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Маl.1.МНOnИСi::l

50

 

64

65

 

67

66

 

65

65

59

70

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Операторы

45

 

45

56

 

56

69

 

65

65

50

70

 

ЭВМ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Токарное

59

 

69

71

 

70

72

 

68

59

60

75

 

дело

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Радио-

 

 

66

66

 

66

64

 

63

61

55

70

 

электроника

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Мастерская

76

70

 

74

73

 

75

71

60

84

 

ПТУ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2. В (Статистики) выберем (Регрессия) -

(Линейная).

 

з. В окне (Линейная регрессия)

выберем в (Независ'и­

мая переменная) - значение Var9, а в окне (Зависимых) -

Уаг1-8.

4.В (Метод) предлагается целая серия методов:

Enter (ввод);

Remove (удаление);

Forward ( прямой поwаговый);

Backward (обратный поwаговый);

Stepwiser (пошаговый с одновремнным введением и

выведением Гlредикторов).

Выбираем первый - Enter.

Помечаем поля: нестандартизованные, остатки. Нажимаем кнопки - продолжить и ОК.

В таблице - сводные результаты - у6еждаемся в высо­

кой значимости коэффициента детерминации (R2) и его кор­

ректировки.

Глава 7. Реrрессионный анаnмэ

"

 

Корректировка нужна прежде всего потому, что нескор­

ректированный коэффициент детерминации порой завыша­

ет действительную оценку регрессионной зависимости.

Окно (ANOVA) дает представление о высокой значимо­

сти коэффициента F Фишера.

Окно (Коэффициентов регрессии) показывает практичес­

ки у всех предикторов высокие значения.

Примечание. Еcnи значение критерия "СтltlOден­

та по МОДУIlIO 60llее двух, то существенный вlCllад пре­

диктора доказан.

в итоrе мы получаем все коэффициенты уравнения мно­

жественной регрессии, их вклад неравнозначен. Наимень­

ший из них - уровень шума на частоте 250 Гц.

Резюме: построенная регрессионная модель, объясня­ ет более 2/3 общей дисперсии отклика, связь анлиэируе­

мых признаков высокозначима.

• • • • • • • • • • • • • •

Глава 8 -"------------

~

ДИСПЕРСИОННЫЙ АНАЛИЗ

Часто применяемым методом проверки выборок на OДHOPOДH~CТЬ и поиска ПРИЧJilнно-следс:гвенных связей

является дисперсионный анализ, разработанный Р. Фише­

ром. Существует несколько вариантов этого вида статис­

тической обработки экспериментальных данных. Наибо­

лее актуальны из них следующие:

]. Однофакторный, или одномерный, дисперсионный

анализ (дисперсионный анализ по одному признакУ), ко­

торый в США и Европе называется ANOVA (сокр. от англ. «Analysis ofVariance»; в отечественной литературе это вы­

ражение трактуется как «дисперсионный анализ») либо

однофакторный дисперсионный анализ.

2. Многофакторный, или многовариантный, диспер­

сионный анализ по нескольким признакам (в английской транскрипции - МANOVA).

Gущность первого из них в отыскании причинно-след­

ственных связей при воздействии одного (вид ANOVA) или группы ф~кторов (вид МANOVA). В роли факторных на­

грузок MOryr выступать различные условия проведения из­

мерений:временные, ситуационные, психологические и

др.). дли выJlвJlния ВJlНЯllИЯ надо располагать результатами

измерений, соответствующими не менее чем треМ УРОВНЯМ фак­

тора. К примеру, ANOVA применяется для анализа не ме­

нее трех выборок и основан на'сравнении их дисперсий.