Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
6 - Основы математической статистики.doc
Скачиваний:
15
Добавлен:
10.02.2016
Размер:
320.51 Кб
Скачать

4. Пути реализации целей занятия:

Для реализации целей занятия Вам необходимые такие исходные знания:

  1. Определение случайных величин: дискретной и непрерывной

  2. Определение распределения, ряд распределения и многокутника распределения дискретной случайной величины

  3. Определение функции распределения

  4. Определение мер положения центра распределения

  5. Определение мер вариабельности значений случайной величины

  6. Определение щільністі распределения и кривой распределения непрерывной случайной величины

  7. Определение функциональной залежністі между случайными величинами

  8. Определение корреляционной залежністі между случайными величинами

  9. Определение регрессии, уравнение и линии регрессии

  10. Определение коваріації и коэффициента корреляции

  11. Определение уравнения линейной регрессии.

Вам необходимые также уметь вычислять вероятностей несовместимых и совместных событий с помощью соответствующих правил.

5. Задача для проверки студентами своего исходного уровня знаний.

Контрольные вопросы

  1. Определение випадковоі события, ее относительную частоту и вероятность.

  2. Теорема составления вероятностей несовместимых событий

  3. Теорема составления вероятностей совместных событий

  4. Теорема умножения вероятностей независимых событий

  5. Теорема умножения вероятностей зависимых событий

  6. Теорема полной вероятности

  7. Теорема Байєса

  8. Определение случайных величин: дискретной и непрерывной

  9. Определение распределения, ряд распределения и многокутника распределения дискретной случайной величины

  10. Определение функции распределения

  11. Определение мер положения центра распределения

  12. Определение мер вариабельности значений случайной величины

  13. Определение щільністі распределения и кривой распределения непрерывной случайной величины

  14. Определение функциональной залежністі между случайными величинами

  15. Определение корреляционной залежністі между случайными величинами

  16. Определение регрессии, уравнение и линии регрессии

  17. Определение коваріації и коэффициента корреляции

  18. Определение уравнения линейной регрессии.

6. Информацию для упрочения исходных знаний-умений можно найти в пособиях:

  1. Жуматій П.Г. Лекция “Теория вероятностей”. Одесса, 2009.

  2. Жуматій П.Г. “ Основы теории вероятностей”. Одесса, 2009.

  3. Жуматій П.Г., Сеницька Я.Р. Элементы теории вероятностей. Методические указания для студентов медицинского института. Одесса, 1981.

  4. Чалый О.В., Агапов Б.Т., Цехмістер Я.В. Медицинская и биологическая физика. Киев, 2004.

7. Содержание учебного материала из данной темы с выделением основных узловых вопросов.

Математическая статистика - это раздел математики, которая изучает методы сбора, систематизации, обработки, изображение, анализа и интерпретации результатов наблюдений с целью выявления существующих закономерностей.

Применение статистики в здравоохранении необходимо как на уровне сообщества, так и на уровне отдельных пациентов. Медицина имеет дело с индивидуумами, которые отличаются друг от друга по многим характеристикам, и значение показателей, на основе которых человека можно считать здоровой, варьируются от одного индивидуума к другому. Нет двух абсолютно одинаковых пациентов или двух групп пациентов, поэтому решение, которые касаются отдельных больных или групп населень, приходится принимать, исходя из опыта, накопленного на других больных или популяціних группах с похожими биологическими характеристиками. Необходимо осознавать, что учитывая существующие расхождения эти решения не могут быть абсолютно точными - они всегда связаны с некоторой неопределенностью. Именно в этом состоит ймовірносна природа медицины.

Некоторые примеры применения статистических методов в медицине:

трактовка вариации (вариабельность характеристик организма при решении вопроса о том, какое значение той или другой характеристики будет идеальным, нормальным, средним и т.і., делает необходимым использование соответствующих статистических методов ).

диагностика заболеваний в отдельных больных и оценка состояния здоровья группы населения.

прогнозирование конца болезни в отдельных больных или возможного результата программы борьбы по той или другой болезнью в любой группе населения.

выбор пригодного влияния на больного или на группу населения.

планирование и проведение медицинских исследований, анализ и публикація результатов, их чтение и критическая оценка.

планирование здравоохранения и руководство им.

Полезная медицинская информация обычно скрыта в массе необработанных данных. Необходимо сконцентрировать информацию, которая содержится в них, и представить данные так, чтобы структуру вариации было хорошо видно, а потом уже выбрать конкретные методы анализа.

Изображение данных предусматривает знакомство с такими понятиями и сроками:

вариационный ряд (упорядоченное расположение) - простое упорядочение отдельных наблюдений за величиной.

класс - один из интервалов, на которые делят весь диапазон значений случайной величины.

крайние точки класса - значение, которые ограничивают класс, например 2,5 и 3,0, нижняя и верхняя границы класса 2,5 - 3,0.

(абсолютная) частота класса - число наблюдений в классе.

относительная частота класса - абсолютная частота класса, выраженная в виде частные общего числа наблюдений.

кумулятивная (накопленная) частота класса - число наблюдений, которое равняется сумме частот всех предыдущих классов и данного класса.

стовпцева диаграмма - графическое изображение частот данных для номинальных классов с помощью столбцов, высоты которых прямо пропорциональные частотам классов.

круговая диаграмма - графическое изображение частот данных для номинальных классов с помощью секторов круга, площади которых прямо пропорциональные частотам классов.

гістограма - графическое изображение частотного распределения количественных данных площадями прямоугольников, прямо пропорциональных частотам классов.

полигон частот - график частотного распределения количественных данных; точку, соответствующую частоте класса, располагают над серединой интервала, каждое две соседние точки соединяют отрезком прямой.

огива (кумулятивная кривая) - график распределения кумулятивных относительных частот.

Всем медицинским данным присущий вариабельность, тому аналіз результатов измерений основанный на изучении сведений о том, каких значениях принимала случайная величина, которая исследуется.

Совокупность всех возможных значений случайной величины называется генеральной.

Часть генеральной совокупности, зарегистрированная в результате испытаний, носит название виборкою.

Число наблюдений, включенное в виборку, зовут объемом виборки (обычно обозначается n).

Задача выборочного метода заключается в том, чтобы по полученной избирателю сделать правильную оценку случайной величины, которая изучается. Поэтому основное требование, которое пред'яв-ляється к виборки, это максимальное отображение всех черт генеральной совокупности. Виборка, что удовлетворяет этому требованию, называется репрезентативной. От репрезентативности виборки зависит обгрунтованість оценки, то есть степень соответствия оценки параметру, который она характеризует.

При оценивании параметров генеральной совокупности по избирателю (параметрическом оценивании) пользуются такими понятиями:

точечное оценивание - оценка параметра генеральной совокупности в виде единичного значения, которое он может принять с самой большой вероятностью.

інтервальне оценивание - оценка параметра генеральной совокупности в виде интервала значений, который имеет заданную вероятность накрыть его истинное значение.

При інтервальному оценивании используют понятие:

надежный интервал - интервал значений, который имеет заданную вероятность накрыть истинное значение параметра генеральной совокупности при інтервальному оценивании.

достоверность (надежная вероятность) - вероятность, с которой надежный интервал накрывает истинное значение параметра генеральной совокупности.

надежные границы - нижняя и верхняя границы надежного інтервала.

Выводы, которые получаются методами математической статистики, всегда основываются на ограниченном, выборочном числе наблюдений, поэтому природньо, что для второй виборки результаты могут быть другими. Это обстоятельство определяет ймовірносний характер выводов математической статистики и, как следствие, широкое использование теории вероятностей в практике статистического исследования.

Типичный путь статистического исследования такой:

оценивши величины или зависимости между ними по данным наблюдений, выдвигают допущение о том, что явление, которое изучается, можно описать той или другой стохастичною моделью

• используя статистические методы, можно это предположение подтвердить или отвергнуть; при подтверждении цель достигнута - найдена модель, которая описывает исследуемые закономерности, в противоположном случае продолжают работу, выдвигая и проверяя новую гипотезу.

Определение выборочных статистических оценок:

мода - это значения, которое чаще всего встречается в избирателе,

медиана - центральное (срединное) значение вариационного ряда

размах R - разность между самым большим и наименьшим значениями в серии наблюдений

процентилі - значение в вариационном ряде, которые делят распределение на 100 равных частей ( таким образом, медиана будет п'ятидесятим процентилем )

первый квартиль - 25-ий процентиль

третий квартиль - 75-ий процентиль

міжквартильний размах - разность между первым и третьим квартилями (охватывает центральных 50% наблюдений)

квартильне отклонение - половина міжквартильного размаха

выборочное среднее - среднее арифметическое всех выборочных значений (выборочная оценка математического ожидания )

среднее абсолютное отклонение - сумма отклонений от соответствующего начала ( без учета знака), разделенная на объем виборки

среднее абсолютное отклонение от выборочного среднего вычисляют за формулой

выборочная дисперсия (X) - (выборочная оценка дисперсии ) определяется формулой

выборочная коваріація -- (выборочная оценка коваріації К(Х,Y) ) равняется

выборочный коэффициент регрессии Y на X (выборочная оценка коэффициента регрессии Y на X ) равняется

эмпирическое уравнение линейной регрессии Y на X имеет вид

выборочный коэффициент регрессии X на Y (выборочная оценка коэффициента регрессии X на Y ) равняется

эмпирическое уравнение линейной регрессии X на Y имеет вид

выборочное стандартное отклонение s(Х) - (выборочная оценка стандартного отклонения) равняется корню квадратному из выборочной дисперсии

выборочный корреляційний коэффициент - (выборочная оценка корреляционного коэффициента ) равняется

выборочный коэффициент вариации - (выборочная оценка коэффициента вариации CV) равняется

.

8. Задача для самостоятельной подготовки студентов.

8.1 Задача для самостоятельного изучения материала с темы.

8.1.1 Практическое вычисление выборочных оценок

Практическое вычисление выборочных точечных оценок

Пример 1.

Продолжительность заболевания ( в днях) в 20 случаях пневмонии сложила:

10, 11, 6, 16, 7, 13, 15, 8, 9, 10, 11, 13, 7, 8, 13, 15, 16, 13, 14, 15

Определить моду, медиану, размах, міжквартильний размах, выборочное среднее, среднее абсолютное отклонение от выборочного среднего, выборочную дисперсию, выборочный коэффициент вариации.

Розв'зок.

Вариационный ряд для виборки имеет вид

6, 7, 7, 8, 8, 9, 10, 10, 11, 11, 13, 13, 13, 13, 14, 15, 15, 15, 16, 16

• Мода

Наиболее часто в избирателе встречается число 13. Поэтому значением моды в избирателе будет это число.

• Медиана

Когда вариационный ряд содержит парное число наблюдений, медиана равняется среднему двух центральных членов ряда, в данном случае это 11 и 13, поэтому медиана равняется 12.

• Размах

Минимальное значение в избирателе равняется 6, а максимальное 16, итак, R = 10.

• Міжквартильний размах, квартильне отклонение

В вариационном ряде четверть всех данных имеет значение меньшие, или уровне 8, поэтому первый квартиль 8, а 75% всех данных имеют значение меньшие, или уровне 12, поэтому третий квартиль 14. Итак, міжквартильний размах равняется 6, а квартильне отклонение составляет 3.

• Выборочное среднее

Среднее арифметическое всех выборочных значений равняется

.

• Среднее абсолютное отклонение от выборочного среднего

.

• Выборочная дисперсия

• Выборочное стандартное отклонение

.

• Bибірковий коэффициент вариации

.

В следующем примере рассмотрим простейшие средства изучения стохастичної зависимости между двумя случайными величинами.

Пример 2.

При обследовании группы пациентов получены данные о росте Н (см) и объем циркулирующей крови V (л) :

Н

170

169

175

150

175

155

180

160

185

175

165

V

4,8

5,1

4,0

5,3

4,1

5,3

4,8

4,3

5,2

5,2

4,7

Найти эмпирические уравнения линейной регрессії.

Розв'зок.

Первое, что необходимо вычислить, это:

• выборочное среднее

• выборочное среднее

.

Второе, что необходимо подсчитать, это:

• выборочную дисперсию (Н)

• выборочную дисперсию (V)

• выборочную коваріацію

Третье, это вычисления выборочных коэффициентов регрессии:

• выборочный коэффициент регрессии V на H

• выборочный коэффициент регрессии H на V

.

Четвертое, записать искомые уравнения:

• эмпирическое уравнение линейной регрессии V на H имеет вид

• эмпирическое уравнение линейной регрессии H на V имеет вид

.

Пример 3.

Используя условия и результаты примера 2, высчитать коэффициент корреляции и проверить достоверность существования корреляционной зависимости между ростом человека и объемом циркулирующей крови с 95% надежной вероятностью.

Розв'зок.

Коэффициент корреляції связан с коэффициентами регрессии и практически полезной формулой

.

Для выборочной оценки коэффициента корреляції эта формула имеет вид

.

Используя вираховані в примере 2 значение выборочных коэффициентов регрессії и , получим

.

Проверка достоверности корреляційної зависимости между случайными величинами (полагает нормальное распределение у каждой из них) осуществляется таким образом:

  • вычисляют величину Т

  • находят в таблице распределения Стьюдента коэффициент

  • существование корреляционной зависимости между случайными величинами подтверждается при выполнении неровности

.

Поскольку 3,5 > 2,26, то с 95% надежной вероятностью существования корреляционной зависимости между ростом пациента и объемом циркулирующей крови можно считать установленным.

Інтервальні оценки для математического ожидания и дисперсии

Если случайная величина имеет нормальное распределение, то інтервальні оценки для математического ожидания и дисперсии вычисляют в такой последовательности:

1. находят выборочное среднее ;

2. подсчитывают выборочную дисперсию и выборочное стандартное отклонение s;

3. в таблице распределения Стьюдента за надежной вероятностью  и объемом виборки n находят коэффициент Стьюдента ;

4. надежный интервал для математического ожидания записывают в виде

5. в таблице распределения "хи-квадрат" за надежной вероятностью  и объемом виборки n находят коэффициенты

;

6. надежный интервал для дисперсии записывают в виде

Величина надежного интервала, надежная вероятность  и объем виборки n зависят друг от друга. На самом деле, отношение

уменьшается с ростом n, итак, при постоянной величине надежного интервала с ростом n растет и  . При постоянной надежной вероятности с ростом объема виборки п уменьшается величина надежного интервала. При планировании медицинских исследований эта связь используют для определения минимального объема виборки, который обеспечит нужны по условиям решаемой задачи величины надежного интервала и надежной вероятности.

Пример 5.

Используя условия и результаты примера 1, найдите інтервальні оценки математического ожидания и дисперсии для 95% надежной вероятности.

Розв'зок.

В примере 1 вираховані точечные оценки математического ожидания (выборочное среднее =12), дисперсии (выборочная дисперсия =10,7) и стандартного отклонения (выборочное стандартное отклонение ). Объем виборки равняется п = 20.

Из таблицы распределения Стьюдента найдем значение коэффициента

дальше вычислим полуширину d надежного интервала

и запишем інтервальну оценку математического ожидания

10,5 < < 13,5 при  = 95%

Из таблицы распределения Пірсона " хи-квадрат " найдем коэффициенты

вычислим нижнюю и верхнюю надежные границы

и запишем інтервальну оценку для дисперсии в виде

6,2 23 при  = 95% .

8.1.2. Задачи для самостоятельного решения

Для самостоятельного решения предлагаются задачи 5.4 С 1 – 8 (П.Г.Жуматій. “Математическая обработка медико-биологических данных. Задачи и примеры”. Одесса, 2009, с. 24-25)

8.1.3. Контрольные вопросы

  1. Частота класса (абсолютная и относительная).

  2. Генеральная совокупность и выборка, объем выборки.

  3. Точечное и інтервальне оценивание.

  4. Надежный интервал и достоверность.

  5. Мода, медиана и выборочное среднее.

  6. Размах, міжквартільний размах, квартальное отклонение.

  7. Среднее абсолютное отклонение.

  8. Выборочные коваріація и дисперсия.

  9. Выборочные стандартное отклонение и коэффициент вариации.

  10. Выборочные коэффициенты регрессии.

  11. Эмпирические уравнения регрессии.

  12. Вычисление корреляционного коэффициента и достоверности корреляционной связи.

  13. Построение інтервальних оценок нормально распределенных случайных величин.