- •Практикум по медицинской статистике Учебно - методическое пособие Санкт – Петербург 2012
- •1. Структура научно-медицинского исследования с применением медицинской статистики.
- •Практические задания
- •Упражнение № 3. Сравнение выборочных средних в двух группах с помощью t-критерия.
- •Упражнение № 4. Сравнение выборочных средних в двух группах
- •Приложения
- •2. Классическое Фрэмингхемское исследование.
- •3. Исследование гемограмм пациентов.
- •Диаграмма рассеяния
- •Средство Кисть
- •Диаграмма Вороного
- •Описательный (дескриптивный) анализ гемограмм
- •Описательные статистики по группам
- •Анализ выбросов
- •Корреляционный анализ
- •Корреляции Пирсона
- •Корреляции Спирмена и Кендалла
- •Исследование эффективности лечения: введение новой переменной
- •Цель дальнейшего исследования
- •Проверка гипотезы о нормальности для переменной Эффективность
- •Сравнение выборок
- •1) Какой метод лечения более эффективен?
- •2) Есть ли существенное различие состояний пациентов до и после лечения?
- •4. Диагностика остеопороза. Методика Всемирной Организации Здравоохранения:
- •Алгоритм вычисления z-скора (стандартного скора)
- •Алгоритм вычисления т-скора:
- •5. Частота рекомбинаций хромосом домашней мыши относительно некоторого признака.
- •1. Структура научно-медицинского исследования с применением медицинской статистики. 1
- •2. Классическое Фрэмингхемское исследование. 23
- •3. Исследование гемограмм пациентов. 26
- •4. Диагностика остеопороза. 54
- •5. Частота рекомбинаций хромосом домашней мыши относительно некоторого признака. 56
Под редакцией
Решетникова В.В.
Практикум по медицинской статистике Учебно - методическое пособие Санкт – Петербург 2012
1
Под редакцией Решетникова В.В.
Практикум по медицинской статистике. Учебно-методическое пособие.
Санкт-Петербург: издание СПбГПМА, 2012. - 64 с.
Учебно-методическое пособие предназначено для студентов второго курса Санкт-Петербургской Государственной Педиатрической Медицинской Академии. Содержание учебно-методического пособия соответствует программе цикла “Медицинская Информатика”, преподаваемого на втором курсе указанного высшего учебного заведения.
Основная цель учебно-методического пособия - научить студентов грамотно использовать стандартное и специальное программное обеспечение для решения конкретных задач в своей будущей профессиональной деятельности.
Утверждено центральным учебно-методическим советом СПбГПМА
© СПбГПМА, 2012
2
1. Структура научно-медицинского исследования с применением медицинской статистики.
Статистические методы исследования являются мощным инструментом обработки больших массивов информации с целью обнаружения закономерностей, лежащих в основе изучаемых явлений и проверки обоснованности выдвигаемых предложений. Именно медицинские исследования требуют объективного анализа полученных данных, так как неправильные выводы из полученных результатов, могут нанести ущерб здоровью человека. Знание основ математической статистики необходимо на всех этапах проведения медико-биологических исследований: при формулировании цели, планировании эксперимента, наборе данных, первичной обработке, выдвижении и проверке гипотез, построении математических моделей.
Применение статистических методов крайне важно при оформлении результатов работы в виде отчетов, журнальных статей, монографий. Именно из публикации в медицинских журналах и монографиях врачи узнают о новых методах диагностики и лечения. Но насколько достоверны факты, приводимые в этих публикациях? Так, выборочная проверка использования статистических методов в статьях, опубликованных в медицинских журналах с 1950 по 1976 гг., показала, что статистические ошибки встречаются примерно в половине статей.
В настоящее время целый ряд медицинских журналов значительно ужесточил требования к достоверности полученных результатов и адекватности применяемых статистических методов при рецензировании статей. Так, одна из задач «Международного журнала медицинской практики» гласит: «Способствовать распространению медицинских знаний, основанных только на доказанных данных. Пропагандировать рандомизированные контролируемые исследования и их систематический анализ как важнейшие методологические инструменты получения научно обоснованных фактов в клинической медицине».
Из этого следует, что знание основ проведения медицинских исследований, статистической обработки данных и обоснования полученных выводов является неотъемлемой частью подготовки будущего врача.
Структурой медицинского исследования принято считать совокупность организационных моментов по отбору пациентов в опытные и контрольные группы исследования, назначений определенного вида, продолжительности лечения и его сопоставимости с традиционными способами терапии, наблюдений за больными в краткосрочные и долгосрочные периоды после лечебного воздействия и др. Различают поперечные и продольные медицинские исследования.
3
Поперечными называют исследования, в которых обследование каждого пациента производится однократно. Такое единовременное наблюдение проводится один раз для решения конкретной задачи или повторяется через неопределенные промежутки времени по мере надобности.
Поперечное исследование позволяет описать картину болезни у совокупности больных на конкретной стадии развития заболевания, установить сочетание симптомов, соответствующее определенной фазе или стадии болезни. Например, развитие симптомов некоторых инфекционных заболеваний по мере внедрения первичной и вторичной профилактики среди населения со временем претерпевает изменения.
Так, в настоящее время при заболевании дифтерией редко выявляются характерные признаки, позволяющие быстро провести дифференцированный диагноз. Клиническая картина дифтерии часто маскируется симптомами, характерными для многих других заболеваний. Проведение в такой ситуации поперечного исследования по изучению клинической картины дифтерии на современном этапе может помочь врачу, выявить отличительные признаки заболевания в текущий период времени и получить объективную картину, необходимую для диагностики болезни, описание совокупности вариантов, тяжести течения.
Поперечное исследование позволяет также выявить и связь некоторых сочетанных признаков с каждым вариантом течения определенного заболевания. Например, ряд осложнений текущего заболевания может возникнуть при сочетании болезни с изменениями в других висцеральных системах организма. Так, у больных с острым нарушением мозгового кровообращения присоединение фибрилляции предсердий сопровождается высоким риском развития инсульта.
Своевременное назначение антикоагулянтов больным с фибрилляцией предсердий позволяет профилактировать инсульт. Итак, поперечное медицинское исследование по выявлению неблагоприятных сочетаний для течения болезни предоставляет возможность предотвратить развитие осложнений.
Поперечные исследования неприменимы для изучения заболеваний с хроническим длительным течением. В такой ситуации необходимо проведение продольных медицинских исследований. Продольное исследование проводится при соблюдении следующих условий: выделение определенной группы пациентов, среди которых имеет место систематическое повторное наблюдение за течением болезни. Длительность наблюдения за группой пациентов определяется длительностью заболевания. Например, длительность международного многоцентрового исследования HYVET (Hypertension in the Very Elderly Trial), направленного на изучение влияния активного лечения больных артериальной гипертензией в возрасте старше 80 лет на продолжительность жизни, составляет 5 лет.
4
Если в исследовании группа больных специально формируется и затем целенаправленно периодически наблюдается, то такое исследование называют проспективным. Например, уже отмеченное нами исследование HYVET проводится среди пациентов старше 80 лет с уровнем систолического артериального давления 160-199 мм рт. ст. и диастолического артериального давления 90-109 мм рт. ст. Активное лечение предполагает назначение индапамидаретарда 1,5 мг/сут. с добавлением по мере необходимости периндоприла в дозе 2 мг/сут. с последующим повышением дозы до 4 мг/ сут. Контроль над состоянием здоровья испытуемых проводится планомерно через каждые 2 месяца.
Если для исследования выбирают большую выборку из популяции, то такое исследование называют популяционным проспективным (когортным) исследованием. Так, количество больных в исследовании HYVET — 2100 человек. Таким образом, это популяционное проспективное исследование.
В ходе проспективного наблюдения часто фиксируют изменения в течении заболевания, соотносят их с исходными особенностями, наблюдают за появлением новых заболеваний.
Такие исследования называют проспективными исследованиями причинных факторов, и направлены они на выявление причинно-следственных отношений.
В ходе такого рода исследований необходимым является четкое понимание факторов отбора испытуемых и тщательное изучение исходного состояния больных. В ходе проспективного исследования может иметь место преднамеренное вмешательство в естественный ход событий, например назначение определенной терапии, метода коррекции и др. При проведении таких исследований необходима организация параллельного исследования двух групп, применения исследуемого и контрольного лечения. Организацию такого рода исследования можно рассмотреть на примере Британского проспективного исследования сахарного диабета 2-го типа (UKPDS). В реализации проекта приняли участие более 5 тысяч больных с впервые выявленным диабетом 2-го типа в 23 центрах Англии. Средняя продолжительность периода наблюдения за больными составила 10 лет. Основная идея UKPDS заключалась в изучении влияния уровня глюкозы крови, артериального давления и основных методов их коррекции на осложнение заболевания. В исследованиях по контролю гликемии 3867 больных были разделены на 2 группы. В контрольную группу (1138 чел.) вошли больные с традиционной тактикой лечения — диетотерапией, основной целью которой являлось поддержание уровня гликемии натощак не выше 15 ммоль/л. При выявлении высокой гипергликемии больной переводился на медикаментозную терапию. Больным во второй группе проводилось интенсивное лечение (2729 чел.) с назначением препаратов сульфанилмочевины (1573 чел.) или инсулина (1156 чел.).
5
В этой группе основными целями было поддержание гликемии не выше 6 ммоль/л, отсутствие симптомов гипергликемии.
В ходе исследования по контролю гликемии в рамках UKPDS был сделан научно обоснованный вывод: тактика интенсивного контроля уровня глюкозы в крови при длительности наблюдения 10 лет приводила к снижению риска развития любого осложнения или смерти, связанных с сахарным диабетом, на 12%, микроангиопатий — на 25%, инфаркта миокарда — на 16%, экстракции диабетической катаракты — на 24%, ретинопатии — на 21%, альбуминурии — на 33%. Длительный сравнительный анализ эффективности различных вариантов интенсивного лечения инсулином, хлорпропамидом или глибенкламидом позволил сделать вывод о том, что при всех вариантах терапии отмечено одинаковое снижение риска развития основных осложнений сахарного диабета по сравнению с традиционной диетотерапией.
В проспективном исследовании исходное состояние больных может оцениваться по уже имеющимся данным обследования в прошлом. Несмотря на ретроспективный сбор исходных данных, обследование будет считаться проспективным. Например, по архивным данным НИИ кардиологии им. A. Л. Мясникова, изученным с 1977 года, на настоящий момент можно заключить, что ишемическая болезнь сердца на сегодняшний день стала главной причиной развития сердечной недостаточности, причем «вклад» ишемической болезни сердца в общую структуру заболеваемости хронической сердечной недостаточностью постоянно увеличивается. Достоинствами проспективного исследования с ретроспективным сбором исходных данных являются оперативность и дешевизна.
Продольное исследование может проводиться и путем анализа уже имеющихся в медицинской документации данных о больных. Такое исследование называют ретроспективным.
При ретроспективном исследовании изучаемая группа больных выделяется в конечный момент выявления заболевания либо лечения болезни и происходит тщательный анализ всех причин болезни, сопутствующих явлений, эффективности терапии и т. д.
В большом количестве ретроспективных исследований одновременно организовывается контрольная группа и имеет место сравнение выделенной и контрольной группы пациентов по ряду признаков. Так, в результате многих международных ретроспективных исследований по выявлению клинической эффективности лечения хронической сердечной недостаточности было установлено, что высокая клиническая эффективность бета-блокаторов при лечении хронической сердечной недостаточности наблюдалась у категории больных, у которых существенное место среди причин декомпенсации сердечной деятельности наряду с ишемической болезнью сердца занимает дилатационная кардиомиопатия.
6
Высокая же клиническая эффективность ингибиторов ангиотензинпревращающего фермента при лечении хронической сердечной недостаточности наблюдалась у больных, основной причиной декомпенсации сердечной деятельности у которых была только ишемическая болезнь сердца. Безусловно, проспективные исследования наиболее доказательны и имеют преимущества перед ретроспективными ввиду того, что исходный отбор больных происходит активно и тщательно. Но в ряде случаев, когда заболевание имеет множество причин и развивается длительное время, ретроспективные исследования бывают единственно возможными.
Проведение научно организованного сбора данных при медицинском исследовании необходимо для выявления статистических закономерностей. Закономерности, в которых необходимость неразрывно связана в каждом отдельном явлении со случайностью и лишь во множестве явлений проявляет себя как закон, называются статистическими. При статистическом научном наблюдении собираемые данные должны отвечать двум основным требованиям: достоверности и сопоставимости. Для оценки достоверности и сопоставимости явлений необходимо статистическое наблюдение с расчетом следующих статистических величин.
Основные варианты структуры медицинского исследования.
ПОПЕРЕЧНЫЕ
Описания особенностей спектра проявлений болезни, диагноза, стадии болезни в отдельный момент времени:
описание нормальных вариаций
описание тяжести болезни
описание сочетаний с другими факторами
ПРОДОЛЬНЫЕ
Проспективные:
популяционные (когортные) исследования естественного развития заболевания, его прогноза
популяционные исследования причинных факторов
популяционные исследования с преднамеренным вмешательством
популяционные исследования с ретроспективным сбором исходных данных
Ретроспективные
наблюдательные исследования
исследования по типу сравнения с контролем.
7
Система |
Назначение и достоинства |
Ограничения и недостатки |
MathCAD |
Система для выполнения широкого спектра задач. Отличная графика и визуализация на всех этапах вычислений, включая ввод. Образцовый интерфейс. Ввод данных с помощью палитр математических знаков. Удачный отбор операторов и функций. Множество примеров, .электронных книг и библиотек. |
Ограниченные средства символьной математики. Примитивные средства программирования . Повышенные требования к аппаратным ресурсам. Отсутствие последних русифицированных версий. |
Maple V R4/R5/R6 |
Университетское высшее образование и научные расчеты. Уникальное ядро символьных вычислений. До 3000 функций. Мощнейшая графика. Удобная справочная система. Развитые средства форматирования документов. |
Повышенные требования к аппаратным ресурсам. Отсутствие синтеза звуков. Ориентация на опытных пользователей и специалистов по математике. |
MATHLAB |
Университетское образование, научные расчеты, численное моделирование. Уникальные матричные средства, обилие численных методов, описательная графика, высокая скорость вычислений, легкость адаптации к задачам пользователя благодаря множеству пакетов расширения системы. |
Чрезмерно высокие требования к аппаратным ресурсам. Скромные возможности символьных вычислений. Дороговизна как самой системы, так и пакета расширения. |
Statistica |
Интегрированная система статистического анализа и обработки данных. Мощная графическая система визуализации данных и результатов статистического анализа. Подготовка статистических отчетов. Встроенные языки программирования. Скромные требования к аппаратным ресурсам. Максимально совмещена со стандартами Windows. |
Требует определенных интеллектуальных усилий. Ориентация на подготовленных пользователей. |
SPSS |
Универсальный статистический пакет фирмы SPSS Inc. Предлагает удобные возможности управления данными, широкий спектр статистических функций, интегрированных графиков и отчетов. Сохраняет позиции лидирующего статистического пакета в мире. |
Ориентация на командный язык, пользователь должен составить короткую программу на специальном языке. |
STATGRAPHICS |
Универсальный многопрофильный пакет с хорошо методически продуманным меню- ориентированным интерфейсом пользователя. |
Пакет рассчитан на специалистов, хорошо знакомых с концепциями применяемых процедур. |
8
Статистические термины и показатели, используемые для представления результатов медико-биологических исследований.
Выборочное среднее (X) — это центр группировки возможных значений исследуемой величины, где n — число наблюдений, X — наблюдаемые значения исследуемой величины.
Выборочное среднее квадратическое отклонение(S) определяет степень отклонения значений исследуемой величины от выборочного среднего.
S=
Более 50% всех исследуемых значений находится в пределах одного стандартного отклонения, а 99,9% значений находится в пределах трех стандартных отклонений.
Ошибка выборочной средней показывает, насколько значение выборочной средней близко к среднему значению генеральной совокупности.
Доверительный интервал позволяет определить пределы, в которых с той или иной вероятностью могут находиться истинные значения исследуемой величины. Обычно в качестве доверительных используются следующие значения вероятностей: Р = 0,95;
Р = 0,99; Р3 = 0,999. Так, Р = 0,95 означает, что в 95 случаях из 100 истинное значение находится в пределах рассчитанного интервала. Для среднего значения генеральной совокупности (m) доверительный интервал определяется по формуле:
где t — нормированный показатель зависящей от доверительной вероятности (Р), числа степеней свободы (f = n-1) и определяемый по таблицам t-критерий Стьюдента (приложение № 1).
Проверка гипотезы о равенстве между средними значениями независимых выборок осуществляется с помощью критерия Стьюдента, или t-критерия.
Для этого необходимо определить:
9
Число степеней свободы равно: f = n + n2- 2. Эта формула справедлива для случая равенства выборочных дисперсий: S 2 = S22. Для проверки гипотезы о равенстве дисперсий используют критерий Фишера.
При этом определяют Fpacч. как отношение большей дисперсии к меньшей:
Вычисленное значение Fpac сравнивают с табличным FTa6 с учетом числа степеней свободы f = n -1; f = n -1 и доверительной вероятности. Если Fpac меньше FTa6 , то это означает, что выборки взяты из совокупностей с равными дисперсиями. Если Fpac больше FTa6, то дисперсии отличаются и необходимо tpacч определять по формуле:
При этом число степеней свободы равно:
Затем рассчитанные значения t сравнивается с tTa6 с учетом числа степеней свободы и доверительной вероятности. Если tpac<tTa6, то отличие между средними незначимо, и они принадлежат одной генеральной совокупности. Если наоборот, то различие значимо и выборки относятся к различным генеральным совокупностям.
Критерий Стьюдента является параметрическим, то есть его можно применять лишь к выборкам, имеющим нормальный закон распределения. Поэтому необходима проверка данных на соответствие нормальному закону распределения.
Проверка нормальности распределения с помощью показателей асимметрии и эксцесса.
Коэффициент асимметрии, или третий центральный момент распределения, является количественной характеристикой степени скошенности распределения.
10
Выборочный коэффициент асимметрии определяется по формуле:
Как следует из формулы, коэффициент асимметрии является безразмерной величиной и равен нулю у симметричных распределений. Если распределение имеет длинную часть, расположенную справа от вершины, то асимметрию называют положительной, а распределение с длинной частью кривой плотности, расположенной слева от вершины, называют отрицательной асимметрией.
Коэффициент эксцесса, или четвертый центральный момент, количественно характеризует островершинность распределения.
Выборочный коэффициент эксцесса вычисляется по формуле:
Для нормального (гауссовского) распределения коэффициент эксцесса равен нулю. Кривые распределения с острой вершиной имеют положительный эксцесс, а с плоской — отрицательный. Таким образом, при нормальном законе распределения выборочных данных коэффициенты асимметрии и эксцесса равны нулю.
Для оценки достоверности отличия выборочных коэффициентов асимметрии и эксцесса от нуля используются специальные таблицы (приложения № 2 и № 3). В них содержатся критические значения As и Ех для разных уровней значимости и числа наблюдений.
Если выборочные данные не описываются нормальным законом распределения, то необходимо использовать непараметрические критерии.
U-критерий Манна-Уитни применяют для проверки гипотезы о принадлежности сравниваемых независимых выборок к одной генеральной совокупности. Альтернативная гипотеза предполагает, что выборки относятся к различным генеральным совокупностям. Для проверки гипотез значения двух выборок необходимо расположить в обобщенный ряд в порядке возрастания значений. Всем значениям обобщенного ряда устанавливаются ранги от 1 до (n + n2), где n и n2, соответственно объем первой и второй выборок.
11
Если значения обобщенного ряда равны, то им приписывается среднее значение тех рангов, которые были бы присвоены каждому значению при отсутствии совпадения.
Затем для каждой выборки определяется сумма рангов R , и R , и рассчитываются статистики:
В качестве расчетной статистики выбирают минимальное значение U и сравнивают с табличным значением для принятого уровня значимости (приложение № 4). Если расчетное значение больше соответствующего табличного, то принимается гипотеза о принадлежности сравниваемых выборок к одной генеральной совокупности. Если нет, то принимается альтернативная гипотеза.
Для попарно связанных выборок применяется знакоранговый Т-критерий Уилкоксона.
Для каждой пары данных находят разности, которые ранжируются в один ряд так, чтобы наименьшая по абсолютной величине разница получила первый ранг, и далее в порядке возрастания разностей без учета знака. Отдельно вычисляют сумму рангов положительных (Т+) и отрицательных (Т ) разностей.
Если разность равна нулю, то она не учитывается при присваивании рангов, а число попарных разностей n уменьшается на число нулевых разностей.
Меньшее из значений Т+ и Т принимается за расчетное значение статистики и сравнивается с табличным значением (приложение № 5).
Если расчетное значение больше табличного, то принимается гипотеза о принадлежности сравниваемых выборок к одной генеральной совокупности при данном уровне значимости.
При представлении результатов клинико-лабораторных исследований, особенно при сравнительной характеристике лабораторных тестов, целесообразно определение диагностической специфичности и чувствительности теста. На начальном этапе вычисления диагностической специфичности и чувствительности теста результаты Причем категория небольных (НБ) обследуемых подразумевает здоровых людей либо больных другими болезнями. Положительный результат лабораторного теста у больных (Б) определенным заболеванием рассматривается как истинно положительный (ИП), у небольных — как ложно положительный (ЛП). Отрицательный результат лабораторного теста у больных определенным заболеванием рассматривается как ложно отрицательный (JIO), у небольных — как истинно отрицательный (ИО).
12
Обследуемые |
Результаты исследований |
Всего |
|
Положительные |
Отрицательные |
||
Больные (В) |
Истинно (ИП) |
Ложно (ЛО) |
ИП + ЛО |
Небольные (НБ) |
Ложно (ЛП) |
Истинно (ИО) |
ЛП + ИО |
Всего |
ИП + ЛП |
ЛО + ИО |
ИП+ЛП+ЛО+ИО |
Затем вычисляют следующие показатели, характеризующие эффективность применения лабораторного исследования при определенном заболевании:
1. Диагностическая чувствительность (ДЧ) теста при определенной болезни, которая представляет собой процентное выражение частоты истинно положительных результатов теста у больных данной болезнью:
ДЧ =
11
Диагностическая специфичность (ДС) теста при определенной болезни представляет собой процентное выражение частоты истинно отрицательных результатов теста у лиц, не страдающих болезнью:
ДС = 100%
Предсказательная (прогностическая) значимость положительных результатов (ПЗ+) выражается процентным соотношением истинно положительных результатов к общему числу положительных результатов:
ПЗ+ =
Предсказательная (прогностическая) значимость отрицательных результатов (ПЗ-) выражается процентным отношением истинно отрицательных результатов к общему числу отрицательных результатов:
ПЗ- =
13
Диагностическая эффективность теста (ДЭ) выражается процентным отношением истинных (т. е. соответствующих состоянию обследуемых пациентов) результатов теста к общему числу полученных результатов:
ДЭ =
Для представления результатов медицинских исследований с применением грамотного статистического анализа в настоящее время успешно применяют программные системы компьютерной математики. Системы компьютерной математики относят к интеллектуальным программным продуктам, одно из назначений которых — предоставление пользователю знаний в области численных методов расчета и моделирования, аналитической математики и современной графики. Системы компьютерной математики представлены разработками различных фирм — MathSoft, MathWorks, Maple, Wolfram и др.
Среди систем компьютерной математики устойчивое лидирующее положение занимает Statistica. Эта программа полностью совместима с Windows, обладает удобным пользовательским интерфейсом, высокой скоростью обработки данных, включает в себя мощные возможности по статистической обработке данных и развитые графические возможности, что обусловливает востребованность этой системы при любом профессиональном исследовании.
14