Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Практикум по медицинской статистике_2012.docx
Скачиваний:
79
Добавлен:
10.11.2019
Размер:
2.38 Mб
Скачать

Под редакцией

Решетникова В.В.

Практикум по медицинской статистике Учебно - методическое пособие Санкт – Петербург 2012

1

Под редакцией Решетникова В.В.

Практикум по медицинской статистике. Учебно-методическое пособие.

Санкт-Петербург: издание СПбГПМА, 2012. - 64 с.

Учебно-методическое пособие предназначено для студентов второго курса Санкт-Петербургской Государственной Педиатрической Медицинской Академии. Содержание учебно-методического пособия соответствует программе цикла “Медицинская Информатика”, преподаваемого на втором курсе указанного высшего учебного заведения.

Основная цель учебно-методического пособия - научить студентов грамотно использовать стандартное и специальное программное обеспечение для решения конкретных задач в своей будущей профессиональной деятельности.

Утверждено центральным учебно-методическим советом СПбГПМА

© СПбГПМА, 2012

2

1. Структура научно-медицинского иссле­дования с применением медицинской статистики.

Статистические методы исследования являются мощным инст­рументом обработки больших массивов информации с целью обна­ружения закономерностей, лежащих в основе изучаемых явлений и проверки обоснованности выдвигаемых предложений. Именно ме­дицинские исследования требуют объективного анализа полученных данных, так как неправильные выводы из полученных результатов, могут нанести ущерб здоровью человека. Знание основ математи­ческой статистики необходимо на всех этапах проведения медико-биологических исследований: при формулировании цели, планиро­вании эксперимента, наборе данных, первичной обработке, выдви­жении и проверке гипотез, построении математических моделей.

Применение статистических методов крайне важно при оформ­лении результатов работы в виде отчетов, журнальных статей, мо­нографий. Именно из публикации в медицинских журналах и монографиях врачи узнают о новых методах диагностики и лече­ния. Но насколько достоверны факты, приводимые в этих публика­циях? Так, выборочная проверка использования статистических методов в статьях, опубликованных в медицинских журналах с 1950 по 1976 гг., показала, что статистические ошибки встречаются при­мерно в половине статей.

В настоящее время целый ряд медицинских журналов значи­тельно ужесточил требования к достоверности полученных резуль­татов и адекватности применяемых статистических методов при рецензировании статей. Так, одна из задач «Международного жур­нала медицинской практики» гласит: «Способствовать распростра­нению медицинских знаний, основанных только на доказанных дан­ных. Пропагандировать рандомизированные контролируемые ис­следования и их систематический анализ как важнейшие методоло­гические инструменты получения научно обоснованных фактов в клинической медицине».

Из этого следует, что знание основ проведения медицинских исследований, статистической обработки данных и обоснования полученных выводов является неотъемлемой частью подготовки будущего врача.

Структурой медицинского исследования принято считать со­вокупность организационных моментов по отбору пациентов в опытные и контрольные группы исследования, назначений опреде­ленного вида, продолжительности лечения и его сопоставимости с традиционными способами терапии, наблюдений за больными в краткосрочные и долгосрочные периоды после лечебного воздействия и др. Различают поперечные и продольные медицин­ские исследования.

3

Поперечными называют исследования, в которых обследова­ние каждого пациента производится однократно. Такое единовре­менное наблюдение проводится один раз для решения конкретной задачи или повторяется через неопределенные промежутки време­ни по мере надобности.

Поперечное исследование позволяет опи­сать картину болезни у совокупности больных на конкретной ста­дии развития заболевания, установить сочетание симптомов, соот­ветствующее определенной фазе или стадии болезни. Например, развитие симптомов некоторых инфекционных заболеваний по мере внедрения первичной и вторичной профилактики среди населе­ния со временем претерпевает изменения.

Так, в настоящее вре­мя при заболевании дифтерией редко выявляются характерные признаки, позволяющие быстро провести дифференцированный диагноз. Клиническая картина дифтерии часто маскируется симп­томами, характерными для многих других заболеваний. Проведе­ние в такой ситуации поперечного исследования по изучению кли­нической картины дифтерии на современном этапе может помочь врачу, выявить отличительные признаки заболевания в текущий период времени и получить объективную картину, необходимую для диагностики болезни, описание совокупности вариантов, тя­жести течения.

Поперечное исследование позволяет также выявить и связь не­которых сочетанных признаков с каждым вариантом течения опре­деленного заболевания. Например, ряд осложнений текущего за­болевания может возникнуть при сочетании болезни с изменения­ми в других висцеральных системах организма. Так, у больных с острым нарушением мозгового кровообращения присоединение фибрилляции предсердий сопровождается высоким риском разви­тия инсульта.

Своевременное назначение антикоагулянтов больным с фибрилляцией предсердий позволяет профилактировать инсульт. Итак, поперечное медицинское исследование по выявлению небла­гоприятных сочетаний для течения болезни предоставляет возмож­ность предотвратить развитие осложнений.

Поперечные исследования неприменимы для изучения за­болеваний с хроническим длительным течением. В такой ситуа­ции необходимо проведение продольных медицинских исследо­ваний. Продольное исследование проводится при соблюдении следующих условий: выделение определенной группы пациен­тов, среди которых имеет место систематическое повторное на­блюдение за течением болезни. Длительность наблюдения за группой пациентов определяется длительностью заболевания. Например, длительность международного многоцентрового ис­следования HYVET (Hypertension in the Very Elderly Trial), на­правленного на изучение влияния активного лечения больных артериальной гипертензией в возрасте старше 80 лет на продол­жительность жизни, составляет 5 лет.

4

Если в исследовании группа больных специально формирует­ся и затем целенаправленно периодически наблюдается, то такое исследование называют проспективным. Например, уже отмечен­ное нами исследование HYVET проводится среди пациентов стар­ше 80 лет с уровнем систолического артериального давления 160-199 мм рт. ст. и диастолического артериального давления 90-109 мм рт. ст. Активное лечение предполагает назначение индапамидаретарда 1,5 мг/сут. с добавлением по мере необходимости периндоприла в дозе 2 мг/сут. с последующим повышением дозы до 4 мг/ сут. Контроль над состоянием здоровья испытуемых проводится пла­номерно через каждые 2 месяца.

Если для исследования выбирают большую выборку из попу­ляции, то такое исследование называют популяционным проспек­тивным (когортным) исследованием. Так, количество больных в исследовании HYVET — 2100 человек. Таким образом, это популяционное проспективное исследование.

В ходе проспективного наблюдения часто фиксируют измене­ния в течении заболевания, соотносят их с исходными особеннос­тями, наблюдают за появлением новых заболеваний.

Такие иссле­дования называют проспективными исследованиями причинных факторов, и направлены они на выявление причинно-следствен­ных отношений.

В ходе такого рода исследований необходимым является четкое понимание факторов отбора испытуемых и тщательное изучение исходного состояния больных. В ходе проспек­тивного исследования может иметь место преднамеренное вмеша­тельство в естественный ход событий, например назначение опре­деленной терапии, метода коррекции и др. При проведении таких исследований необходима организация параллельного исследова­ния двух групп, применения исследуемого и контрольного лече­ния. Организацию такого рода исследования можно рассмотреть на примере Британского проспективного исследования сахарного диабета 2-го типа (UKPDS). В реализации проекта приняли участие более 5 тысяч больных с впервые выявленным диабетом 2-го типа в 23 центрах Англии. Средняя продолжительность периода наблюде­ния за больными составила 10 лет. Основная идея UKPDS заключа­лась в изучении влияния уровня глюкозы крови, артериального дав­ления и основных методов их коррекции на осложнение заболева­ния. В исследованиях по контролю гликемии 3867 больных были разделены на 2 группы. В контрольную группу (1138 чел.) вошли больные с традиционной тактикой лечения — диетотерапией, ос­новной целью которой являлось поддержание уровня гликемии на­тощак не выше 15 ммоль/л. При выявлении высокой гипергликемии больной переводился на медикаментозную терапию. Больным во второй группе проводилось интенсивное лечение (2729 чел.) с на­значением препаратов сульфанилмочевины (1573 чел.) или инсули­на (1156 чел.).

5

В этой группе основными целями было поддержание гликемии не выше 6 ммоль/л, отсутствие симптомов гиперглике­мии.

В ходе исследования по контролю гликемии в рамках UKPDS был сделан научно обоснованный вывод: тактика интенсивного конт­роля уровня глюкозы в крови при длительности наблюдения 10 лет приводила к снижению риска развития любого осложнения или смерти, связанных с сахарным диабетом, на 12%, микроангиопатий — на 25%, инфаркта миокарда — на 16%, экстракции диабетичес­кой катаракты — на 24%, ретинопатии — на 21%, альбуминурии — на 33%. Длительный сравнительный анализ эффективности различ­ных вариантов интенсивного лечения инсулином, хлорпропамидом или глибенкламидом позволил сделать вывод о том, что при всех вариантах терапии отмечено одинаковое снижение риска развития основных осложнений сахарного диабета по сравнению с традици­онной диетотерапией.

В проспективном исследовании исходное состояние больных может оцениваться по уже имеющимся данным обследования в про­шлом. Несмотря на ретроспективный сбор исходных данных, обсле­дование будет считаться проспективным. Например, по архивным данным НИИ кардиологии им. A. Л. Мясникова, изученным с 1977 года, на настоящий момент можно заключить, что ишемическая болезнь сердца на сегодняшний день стала главной причиной раз­вития сердечной недостаточности, причем «вклад» ишемической болезни сердца в общую структуру заболеваемости хронической сердечной недостаточностью постоянно увеличивается. Достоин­ствами проспективного исследования с ретроспективным сбо­ром исходных данных являются оперативность и дешевизна.

Продольное исследование может проводиться и путем анализа уже имеющихся в медицинской документации данных о больных. Такое исследование называют ретроспективным.

При ретроспек­тивном исследовании изучаемая группа больных выделяется в ко­нечный момент выявления заболевания либо лечения болезни и происходит тщательный анализ всех причин болезни, сопутствую­щих явлений, эффективности терапии и т. д.

В большом количестве ретроспективных исследований одновременно организовывается контрольная группа и имеет место сравнение выделенной и конт­рольной группы пациентов по ряду признаков. Так, в результате многих международных ретроспективных исследований по выяв­лению клинической эффективности лечения хронической сердеч­ной недостаточности было установлено, что высокая клиническая эффективность бета-блокаторов при лечении хронической сердеч­ной недостаточности наблюдалась у категории больных, у которых существенное место среди причин декомпенсации сердечной дея­тельности наряду с ишемической болезнью сердца занимает дилатационная кардиомиопатия.

6

Высокая же клиническая эффектив­ность ингибиторов ангиотензинпревращающего фермента при ле­чении хронической сердечной недостаточности наблюдалась у больных, основной причиной декомпенсации сердечной деятель­ности у которых была только ишемическая болезнь сердца. Безус­ловно, проспективные исследования наиболее доказательны и имеют преимущества перед ретроспективными ввиду того, что исходный отбор больных происходит активно и тщательно. Но в ряде случаев, когда заболевание имеет множество причин и раз­вивается длительное время, ретроспективные исследования быва­ют единственно возможными.

Проведение научно организованного сбора данных при меди­цинском исследовании необходимо для выявления статистических закономерностей. Закономерности, в которых необходимость не­разрывно связана в каждом отдельном явлении со случайностью и лишь во множестве явлений проявляет себя как закон, называются статистическими. При статистическом научном наблюдении соби­раемые данные должны отвечать двум основным требованиям: достоверности и сопоставимости. Для оценки достоверности и со­поставимости явлений необходимо статистическое наблюдение с расчетом следующих статистических величин.

Основные варианты структуры медицинского исследования.

ПОПЕРЕЧНЫЕ

Описания особенностей спектра проявлений болезни, диагноза, стадии болезни в отдельный момент времени:

  • описание нормальных вариаций

  • описание тяжести болезни

  • описание сочетаний с другими факторами

ПРОДОЛЬНЫЕ

Проспективные:

  • популяционные (когортные) исследования естественно­го развития заболевания, его прогноза

  • популяционные исследования причинных факторов

  • популяционные исследования с преднамеренным вме­шательством

  • популяционные исследования с ретроспективным сбо­ром исходных данных

Ретроспективные

  • наблюдательные исследования

  • исследования по типу сравнения с контролем.

7

Система

Назначение и достоинства

Ограничения и недостатки

MathCAD

Система для выполнения широкого спектра задач. Отличная графика и визуализация на всех этапах вычислений, включая ввод. Образцовый интерфейс. Ввод данных с помощью палитр математических знаков. Удачный отбор операторов и функций. Множество примеров, .электронных книг и библиотек.

Ограниченные средства символьной математики. Примитивные средства программирования . Повышенные требо­вания к аппаратным ресурсам. Отсутствие последних русифицированных версий.

Maple V R4/R5/R6

Университетское высшее образование и научные расчеты. Уникальное ядро сим­вольных вычислений. До 3000 функций. Мощнейшая графика. Удобная справочная система. Развитые средства формати­рования документов.

Повышенные требования к аппаратным ресурсам. Отсутствие синтеза зву­ков. Ориентация на опытных пользо­вателей и специалистов по математике.

MATHLAB

Университетское образование, научные расчеты, численное моделирование. Уникальные матричные средства, обилие численных методов, описательная графика, высокая скорость вычислений, легкость адаптации к задачам пользователя благодаря множеству пакетов расширения системы.

Чрезмерно высокие требования к аппаратным ресурсам. Скромные возможности символьных вычислений. Дороговизна как самой системы, так и пакета расширения.

Statistica

Интегрированная система статистического анализа и обработки данных. Мощная графическая система визуализации данных и результатов статистического анализа. Подготовка статистических отчетов. Встроенные языки программирования. Скромные требования к аппаратным ресур­сам. Максимально совмещена со стандар­тами Windows.

Требует определенных интеллектуаль­ных усилий. Ориентация на подготов­ленных пользователей.

SPSS

Универсальный статистический пакет фирмы SPSS Inc. Предлагает удобные возможности управления данными, широкий спектр статистических функций, интегрированных графиков и отчетов. Сохраняет позиции лидирующего статистического пакета в мире.

Ориентация на командный язык, поль­зователь должен составить короткую программу на специальном языке.

STATGRAPHICS

Универсальный многопрофильный пакет с хорошо методически продуманным меню- ориентированным интерфейсом пользователя.

Пакет рассчитан на специалистов, хорошо знакомых с концепциями приме­няемых процедур.

8

Статистические термины и показатели, ис­пользуемые для представления результатов медико-биологических исследований.

Выборочное среднее (X) — это центр группировки воз­можных значений исследуемой величины, где n — число наблюдений, X — наблюдаемые значения иссле­дуемой величины.

Выборочное среднее квадратическое отклонение(S) опре­деляет степень отклонения значений исследуемой величины от вы­борочного среднего.

S=

Более 50% всех исследуемых значений находится в пределах одного стандартного отклонения, а 99,9% значений находится в пре­делах трех стандартных отклонений.

Ошибка выборочной средней показывает, насколько зна­чение выборочной средней близко к среднему значению генераль­ной совокупности.

Доверительный интервал позволяет определить пределы, в которых с той или иной вероятностью могут находиться истинные значения исследуемой величины. Обычно в качестве доверитель­ных используются следующие значения вероятностей: Р = 0,95;

Р = 0,99; Р3 = 0,999. Так, Р = 0,95 означает, что в 95 случаях из 100 истин­ное значение находится в пределах рассчитанного интервала. Для среднего значения генеральной совокупности (m) доверительный интервал определяется по формуле:

где t — нормированный показатель зависящей от доверитель­ной вероятности (Р), числа степеней свободы (f = n-1) и определяе­мый по таблицам t-критерий Стьюдента (приложение № 1).

Проверка гипотезы о равенстве между средними значения­ми независимых выборок осуществляется с помощью критерия Стьюдента, или t-критерия.

Для этого необходимо определить:

9

Число степеней свободы равно: f = n + n2- 2. Эта формула справедлива для случая равенства выборочных дисперсий: S 2 = S22. Для проверки гипотезы о равенстве дисперсий используют критерий Фишера.

При этом определяют Fpacч. как отношение большей дисперсии к меньшей:

Вычисленное значение Fpac сравнивают с табличным FTa6 с учетом числа степеней свободы f = n -1; f = n -1 и доверительной вероят­ности. Если Fpac меньше FTa6 , то это означает, что выборки взяты из совокупностей с равными дисперсиями. Если Fpac больше FTa6, то дис­персии отличаются и необходимо tpacч определять по формуле:

При этом число степеней свободы равно:

Затем рассчитанные значения t сравнивается с tTa6 с учетом числа степеней свободы и доверительной вероятности. Если tpac<tTa6, то отличие между средними незначимо, и они принадлежат одной гене­ральной совокупности. Если наоборот, то различие значимо и выборки относятся к различным генеральным совокупностям.

Критерий Стьюдента является параметрическим, то есть его можно применять лишь к выборкам, имеющим нормальный закон распределения. Поэтому необходима проверка данных на соответ­ствие нормальному закону распределения.

Проверка нормальности распределения с помощью показа­телей асимметрии и эксцесса.

Коэффициент асимметрии, или третий центральный момент распределения, является количественной характеристикой степени скошенности распределения.

10

Выборочный коэффициент асиммет­рии определяется по формуле:

Как следует из формулы, коэффициент асимметрии является безразмерной величиной и равен нулю у симметричных распреде­лений. Если распределение имеет длинную часть, расположенную справа от вершины, то асимметрию называют положительной, а распределение с длинной частью кривой плотности, расположен­ной слева от вершины, называют отрицательной асимметрией.

Коэффициент эксцесса, или четвертый центральный момент, количественно характеризует островершинность распределения.

Выборочный коэффициент эксцесса вычисляется по формуле:

Для нормального (гауссовского) распределения коэффициент эксцесса равен нулю. Кривые распределения с острой вершиной имеют положительный эксцесс, а с плоской — отрицательный. Та­ким образом, при нормальном законе распределения выборочных данных коэффициенты асимметрии и эксцесса равны нулю.

Для оценки достоверности отличия выборочных коэффициентов асим­метрии и эксцесса от нуля используются специальные таблицы (при­ложения № 2 и № 3). В них содержатся критические значения As и Ех для разных уровней значимости и числа наблюдений.

Если выборочные данные не описываются нормальным зако­ном распределения, то необходимо использовать непараметричес­кие критерии.

U-критерий Манна-Уитни применяют для проверки гипоте­зы о принадлежности сравниваемых независимых выборок к одной генеральной совокупности. Альтернативная гипотеза предполага­ет, что выборки относятся к различным генеральным совокупнос­тям. Для проверки гипотез значения двух выборок необходимо рас­положить в обобщенный ряд в порядке возрастания значений. Всем значениям обобщенного ряда устанавливаются ранги от 1 до (n + n2), где n и n2, соответственно объем первой и второй выборок.

11

Если значения обобщенного ряда равны, то им приписывается среднее значение тех рангов, которые были бы присвоены каждому значе­нию при отсутствии совпадения.

Затем для каждой выборки опре­деляется сумма рангов R , и R , и рассчитываются статистики:

В качестве расчетной статистики выбирают минимальное зна­чение U и сравнивают с табличным значением для принятого уров­ня значимости (приложение № 4). Если расчетное значение боль­ше соответствующего табличного, то принимается гипотеза о при­надлежности сравниваемых выборок к одной генеральной сово­купности. Если нет, то принимается альтернативная гипотеза.

Для попарно связанных выборок применяется знакоранговый Т-критерий Уилкоксона.

Для каждой пары данных находят разности, которые ранжиру­ются в один ряд так, чтобы наименьшая по абсолютной величине разница получила первый ранг, и далее в порядке возрастания раз­ностей без учета знака. Отдельно вычисляют сумму рангов поло­жительных (Т+) и отрицательных (Т ) разностей.

Если разность равна нулю, то она не учитывается при присваивании рангов, а число по­парных разностей n уменьшается на число нулевых разностей.

Мень­шее из значений Т+ и Т принимается за расчетное значение статисти­ки и сравнивается с табличным значением (приложение № 5).

Если расчетное значение больше табличного, то принимается гипотеза о принадлежности сравниваемых выборок к одной генеральной со­вокупности при данном уровне значимости.

При представлении результатов клинико-лабораторных иссле­дований, особенно при сравнительной характеристике лаборатор­ных тестов, целесообразно определение диагностической специ­фичности и чувствительности теста. На начальном этапе вычисле­ния диагностической специфичности и чувствительности теста ре­зультаты Причем категория небольных (НБ) обследуемых под­разумевает здоровых людей либо больных другими болезнями. Положительный результат лабораторного теста у больных (Б) опре­деленным заболеванием рассматривается как истинно положитель­ный (ИП), у небольных — как ложно положительный (ЛП). Отрица­тельный результат лабораторного теста у больных определенным заболеванием рассматривается как ложно отрицательный (JIO), у небольных — как истинно отрицательный (ИО).

12

Обследуемые

Результаты исследований

Всего

Положительные

Отрицательные

Больные (В)

Истинно (ИП)

Ложно (ЛО)

ИП + ЛО

Небольные (НБ)

Ложно (ЛП)

Истинно (ИО)

ЛП + ИО

Всего

ИП + ЛП

ЛО + ИО

ИП+ЛП+ЛО+ИО

Затем вычисляют следующие показатели, характеризующие эффективность применения лабораторного исследования при оп­ределенном заболевании:

1. Диагностическая чувствительность (ДЧ) теста при опреде­ленной болезни, которая представляет собой процентное выраже­ние частоты истинно положительных результатов теста у больных данной болезнью:

ДЧ =

11

  1. Диагностическая специфичность (ДС) теста при опреде­ленной болезни представляет собой процентное выражение час­тоты истинно отрицательных результатов теста у лиц, не страдаю­щих болезнью:

ДС = 100%

  1. Предсказательная (прогностическая) значимость положи­тельных результатов (ПЗ+) выражается процентным соотношени­ем истинно положительных результатов к общему числу положи­тельных результатов:

ПЗ+ =

  1. Предсказательная (прогностическая) значимость отрица­тельных результатов (ПЗ-) выражается процентным отношением истинно отрицательных результатов к общему числу отрицатель­ных результатов:

ПЗ- =

13

  1. Диагностическая эффективность теста (ДЭ) выражается процентным отношением истинных (т. е. соответствующих состоя­нию обследуемых пациентов) результатов теста к общему числу полученных результатов:

ДЭ =

Для представления результатов медицинских исследований с применением грамотного статистического анализа в настоящее время успешно применяют программные системы компьютерной математики. Системы компьютерной математики относят к интел­лектуальным программным продуктам, одно из назначений кото­рых — предоставление пользователю знаний в области численных методов расчета и моделирования, аналитической математики и современной графики. Системы компьютерной математики пред­ставлены разработками различных фирм — MathSoft, MathWorks, Maple, Wolfram и др.

Среди систем компьютерной математики устойчивое лидирую­щее положение занимает Statistica. Эта программа полностью со­вместима с Windows, обладает удобным пользовательским ин­терфейсом, высокой скоростью обработки данных, включает в себя мощные возможности по статистической обработке данных и развитые графические возможности, что обусловливает востребо­ванность этой системы при любом профессиональном исследова­нии.

14