5 курс / ОЗИЗО Общественное здоровье и здравоохранение / Медицинская_статистика_Жижин_К_С_
.pdfГлава 1. Введение в теориlO иsмерений |
I |
понимать, какую информацию вы хотите «выжать» из соб
ственных экспериментальныхданных. В чем вы видите cyrb
своих исследований, потому что, кроме вас, на эти вол
рось. не ответит и самый распрекрасный специалист-ста
тистик, если, конечно, он дополнительно к своей профес
сии, не владеет еще и вашей...
Построили же свою работу ~Ы так сознательно, по скольку личный опыт убеждает в том, что, если матема
тические «навороты» «обрушиваются» на читателя с пер
вых же страниц, ТО они в конечном счете сослужат авто
рам книги медвежью услугу, отбивая всякую охоту у
читателя-нематематика к освоению пропагандируемых
приемов обработки статистических данных.
ГлаВа 2
СТАТИСТИЧЕСКИЕ ГИПОТЕЗbI
любое исследование начинается с формирования ста
тистической гипотезы. Огрвариваются особенности ста
тистических закономерностей при получении результатоц
экспери мента, анализируется допустимость распростране
ния результата отдельных выборок на всю генеральную
совокупность.
В медицинской статистике различают следующие виды
гипотез:
Но - нулевая, гипотеза отсyrствия различий, измене
ний, эффектов воздействия на совокупность; Н1 - альтернативная, гипотеза о наличии различий,
изменений, эффектов при воздействии на совокупность. Эти так называемые дuxоm()мuческuе гипотезы наибо
лее часто составляют суть медицинских и биологических исследований. Редко, но не сказать об этом нельзя, гипо теза может включать и более двух возможных вариантов
решения.
В подавляюшем же большинстве случаев в медико
биологических исследованиях исследователи пытаются
выявить различия в уровне, динамике, характере распре
деления показателей в экспериментальной и контрольной
(фоновой) группах испытуемых, пациентов, лабораторных животных, анализов и т. д., т. е. пытаются сформировать
классический тандем: контроль-опьп.
Глава 1. Статистические rипоте1Ы |
" |
|
и если исследование правильно спланировано" то ре зультат практически всегда будет безупречным. Валид
ность - главное определяющее серьезности исследования.
r |
|
|
8anидность - способность применяемого метода" |
отражать именно те качества, на выявление которых дан
ный метод и был наllравлен. И если условия опыта не ме
нять кардинально, то выбранный метод будет давать иден
тичный результат и на других совокупностях.
для проверки статистических гипотез используются:
1. Пара.метрuческuе методы. (Требуют знания закона
распределения вероятностей как в выборке, так и в генеральной совокупности.)
2. Неnара.меmрuческuе .методы. (Не требуют знания за
конов распределения вероятностей ни в выборке, ни в генеральной совокупности.)
Если исследователь серьезно относится к результату своего труда, он априори, до проведения статистической обработки данных и даже до начала проведения экспери
мента, за письменным столом должен продумать, будет ли
анализируемая им совокупность данных отвечать требо
ваниям нормальности, соответствовать закону Гаусса.
Дело в ТОМ, что математическая статистика и теория
проверки статистических гипотез, как ее ветвь,__ориенти
.E.~aHЫ на специфику нормального закона распределения. И для корректного применения параметрических методов
действительно обязательно выполнение ряда условий, ко торыми начинающие аналитики и статистики пренебре гают. Большей частью эксперимент строится по такой при
митивной схеме: сначала соберем как можно больше данных,
а уже потом с помощью профессионала-статистика как-ни
будь обработаем.
Увы, при таком подходе иной раз с эксперименталь
ным материалом сделать ничего серьеЗНОГQ уже нельзя
(в плане получения аналитических результатов И, самое
главное, нельзя никак исправить сам эксперимент.
12 |
Медицинская статистика |
Если планируется ответственная-исследовательская ра
бота и столь же серьезная обработка ее данных, то алго
ритм действий исследователя должен содержать обязатель
ные ответы на такие вопросы:
1) как близки распределения экспериментальных дан
ных к нормальному закону;
2) какая шкала измерений наиболее применима в его
исследованиях, как минимум это должна быть ин-
'--~---.-. -
тервальная шкала; .
3) каковы ограничения на минимальный и (или) мак
симальный объем выборки или согласованность объемов нескольких исследуемых выборок.
Когда требования нормальности распределения и ин
тервальности используемой шкалы не выполняются или
их трудно осуществить, то стоит использовать непарамет
рические методы проверки гипотез.
При получении результата работы можно допустить:
1) принятие верной нулевой гипотезы;
2)
3)
4)
отклонение верной нулевой гипотезы; принятие ложной нулевой гипотезы; отклонение ложной нулевой гипотезы.
,... Ко.гда П~Р~Ь!~_!!,I{_~РТЫ~ варианты решения правиль
ны, а второй и третий - .ошибочны, то возникает риск
ошибки первого и второго рода.
Ошибка первого рода пояВляется, если игнорируется верная нулевая гипотеза НО. Ошибка второго рода возни
кает, когда нулевая гипотеза Но оценивается как ложная.
Если обозначить вероятность ошибки первого рода. как (Х, а вероятность ошибки второго рода ~, то значение
вероятности правильного вывода в первом случае будет
равным:
р= 1 - а.
Значения (р) могут бьпь выражены как 0,95 или 0,05~ что по сyrи одно и то же. В большинстве медико-биоло
гических исследований в качестве минимально допусти
.мого используют уровень значимости р = 0,05 или 0,01,
иногда 0,001.
Глава 2. Статистические rипоте1Ы |
'l |
Для уменьшения вероятности совершения ошибки
первого рода можно:
-увеличить число наблюдений;
-увеличить числа повторных измерений в одной и
той же выборке;
-увеличить уровень значимости или статистической'
достоверности вывода;
-увеличить точность измерений за счет уменьшения' систематической ошибки.
Ошибки второго рода непосредственно влияют на мощ
ность критерия при проверке гипотез, когда велика веро
ятность не совершить ошибку второго рода. Вполне есте
ственно, чтобы не совершить ошибку второго'рода, надо
стремиться использовать более мощный критерий для того
класса задач, которые решаются в конкретной ситуации.
Мощность критерия
v= 1 - 1.
Отсюда возникает естественный вопрос: какая же из
описанных ошибок более важна? Ответ односложным
быть не может, все зависит от ряда обстоятельств: от це
лей, характера задачи, построения исследования.
~
Ошибка первого рода существенна в конфирматорном
(уточняюшем) эксперименте, а также тогда, когда непри
нятие верной гипотезы об отсутствии различий имеет практическую значимость: принятие врачом ложной ги
потезы об эффективности лечебного препарата или эф фективности противоэпидемических мероприятий может
иметь катастрофические последствия, оргвыводы о проф
пригодности специалиста и т. Д.
Ошибка второго рода существенна в эксплораторном (разведочном) эксперименте. Orклонение гипотезы о раз
личиях на начальной стадии эксперимента может (в луч шем случае!) неверно ориентировать исследователя на перс
пективу.
В настоящее время, когда все стали считать деньги, в
том числе и на проведение исследований, и наука 8 по
давляюшем большинстве случаев влачит жалкое суще-
14 |
МеДИЦИНСl(ая статистика |
ствование, сократить затраты на эксплораторный экспе
римент можно за счет:
1) уменьшения количества наблюдений;
2) задания более низкогоуровня значимости.
Конечно, в любом случае приятнее получить положи-
тельный результат, чем фиаско, Однако в целом ряде слу
чаев отрицательный результат - тоже результат, поэтому
вероятность и значимость ошибок первого рода значитель но выше, чем ошибок второго рода.
В этой -.связи целесообразным, с нашей точки_зрения,
является такой подход к обработке эмпирического мате
риала исследования:
1) от ЭКСJUIораторного эксперимента к конфирматор
НОМУ;
2} от низких уровней достоверности к высоким;
3) от исследований на малых выборках к большим.
Глава 3
КОМПЬЮТЕРbl в МЕДИКО
БИОЛОГИЧЕСКОЙ СТАТИСТИКЕ
для эффективного использования пакетов roroвых CI'3-
тистических программ любой квалифицированный врач
доложен владеть приемами работы на персональном ком
пьютере. Мы рассчитываем, что читающий данную книгу
имеет и персональный компьютер, не новичок в его экс
плуатации, хотя бы на уровне пользователя, имеет и про
граммное обеспечение, о котором пойдет речь ниже'(JJY'I-
ше, если лицензионное!). И тем не менее все же напомним
базовые понятия.
Файловая система - это система хранения информа
ции. Данная система иерархическая, она имеет три уров
ня: 1) файлы, 2) папки, 3) логические диски.
Папка (Folder), или каталог (Directory), - это группа
файлов, объединенных под общим именем. Папки в опе
рационной системе MS Windows делятся на два вида:
•стандартные - специальные папки, в которых хра
нится информация об управлении компьютером;
•пользовательские - создаваемые самим пользова
телем.
Лоrические диски - самые крупные разделы файловой
системы, вмещающие группы файлов и папок, емкостью от десятков до сотен мегабаЙТ.
,. |
МеАицинская статистика |
lfиrерфейс (Interface) - способ общения между пользо вателем и программоЙ. Он служит для упрамения про
граммным обеспечение~ как с клавиатуры с использова
нием комбинации клавиш, так и с помощью «мыши».
Рабочее 01010 (Window) - содержит стандартные эле
менты упрамения.
WiпdОWS-ПРВJJожевия -. компьютерные программы для
работы в данной среде операционной системы. Описан
ные ниже программы как раз и рассматриваются нами как
готовые статистические пакеты.
МевlO (Мепо) - наБОр процедур выбора, представлен:
•текстами;
•пиктограммами, значками.
Всовременных медицинских учреждениях примене
ние компьютерных технологий, к сожалению, еще не ста
ло обычным делом обработки и анализа данных, тем бо
лее проверки статистических гипотез. Кое-кто в лучшем
случае использует для решения своих локальных задач ста
тистические пакеты, так называемой описательной стати
сти"и (и не более) популярной программы Ехсеl.
Как показывает наш опыт использования хорошо за
рекомендовавших себя статистических пакетов SPSS,
STATISТICA (USA) дЛЯ решения задач по обработке теку
щей (и даже научной!) информации, эти пакеты дают ис следователю гораздо больше простора для творческой ра боты: арсенал методик в них шире, чем в упомянутой нами
программе Excel. И самое главное - некоторые приемы
глубокой проработки информации экспериментальных данных в ней просто невозможны.
Выбор именно этих двух пакетов, на первый взгляд, су
щественно отличающихся> друг от друга по пользователь
скому интерфейсу, обусловлен прежде всего тем, что их не
достатки - продолжение их непересекающихся достоинств.
В каком-то из них есть то, чего напрочь лишен другой. Предлагаемая нами подборка статистических приме
ров и задач вводит врача, биолога, химика и близких к ним
по сyrисвоего труда специали~в в круг таких вариантов
Глава З. компыоерыы 8 медико-биолоrической статистике |
17 |
обработки статистической информации, где применение
до сих пор мало используемых модулей из выбранных
нами статистических пакетов дает возможность получить
наиболее емкую информацию, взглянуть на эксперимент
с совершенно иной,. нетрадиционной точки зрения. Это
очень важно на данный момент, поскольку работа на ЭВМ
уже перестает быть уделом узкой, закрытой касты про
граммистов, флер загадочности с их профессии сегодня сброшен окончательно.
ОСОБЕННОСТИ В ИСПОЛЬЗОВАНИИ ПАКЕТА SPSS
Пакет SPSS предназначен для выполнения всех эта
пов статистического анализа данных. Аббревиатура SPSS
расшифровывается как StatiStical Package for Social Science
(статистический пакет для социальных наук). ОН'разра
ботан в США в 60-х годах хх столетия в стенах Чикагско
го университета, и первоначально предназначался для ре
ализац~и сугубо специфических проблем психологии, со
циологии, антропологии [95].
В настоящее время разработано 13 версий пакета SPSS,
И,как показала жизнь, все они многоцелевые и пригодны
для анали~ данных в областях науки и' практики, доста
точно далеких от психологии и социологии.
В SPSS существует несколько десятков модулей, до
полнительно подключаемых к пакету. Пакет дает возмож
ность нее только обрабатывать данные, но и формиро
вать отчеты о результатах обработки, имеет значитель
ный арсенал наглядного представления результатов с
помощью графиков и диаграмм. К достоинствам пакета можно отнести русифицикацию версий, есть подробные руководства на Web-странице Интернета. К относитель-
/
ным недостаткам пакета можно отнести узкий набор ста-
тистических методов, входящих в базовую версию, пол
ное отсутствие ряда статистических алгоритмов, широко
используемых у нас, в России. Графика (в сравнении с
тем же пакетом Statistica) - слабое звено SPS, и тем не
18 |
Медицинская статистика |
менее он - в числе лидеров на рынке статистических ус
луг в мире.
Примечание. Мы сознатenьноопускаем процеду ру инсталляции паке'Юв. Считаем, что они уже установ nены на компыоере.. Если это не так, то отсыпаем чита
теля к nитературным первоисточникам в конце книги.
Итак, запускаем пакет SPSS любым способом, к при
меру, из главного меню Создаем документ. Они, кстати,
могут быть различных типов: файлы исходных данных и файлы отчетов.
После запуска открывается стартовое oкн~. Выбираем одну из пяти возможностей, из которых основными, чаще используемыми являются две: а) Туре in data (Ввести дан
ные), б) Ореп аn existing file (Orкpыть существующий файл). Интерфейс пакета SPSS имеет стандартные для
Windows- приложений текстовое и графическое меню.
Главное меню пакета включает следующие пункты:
File (Файл),
New (Создать, ), .
Ореп (OmKpblmb),
Save (Сохранить),
Save as (Сохранить как),
Print (Напечатать)
Edit (Правка, редактирование)
Cut (Вblрезать), СОРУ (Копировать),
Paste (Вставить), С/еаг (Очистить),
Find (Найти), Undo (Отменить),
View (Вид, просмотр),
Data (ДаННblе),
Transform (Прео6разовать),
Statistics (Статистики),
Graphs (Графики),
Utilities (Сервис, утилитbl),
Window (Окно),
Не/р (Помощь, справка).