Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
6 - Матем статистика.doc
Скачиваний:
23
Добавлен:
10.02.2016
Размер:
318.46 Кб
Скачать

4. Шляхи реалізації цілей заняття:

Для реалізації цілей заняття Вам необхідні такі вихідні знання:

  1. Означення випадкових величин: дискретної та неперервної

  2. Означення розподілу, ряд розподілу та многокутника розподілу дискретної випадкової величини

  3. Означення функції розподілу

  4. Означення мір положення центру розподілу

  5. Означення мір варіабельності значень випадкової величини

  6. Означення щільністі розподілу та кривої розподілу неперервної випадкової величини

  7. Означення функціональної залежністі між випадковими величинами

  8. Означення кореляційної залежністі між випадковими величинами

  9. Означення регресії, рівняння та лінії регресії

  10. Означення коваріації та коефіцієнта кореляції

  11. Означення рівняння лінійної регресії.

Вам необхідні також вміти обчислювати ймовірностей несумісних та сумісних подій за допомо­гою відповідних правил.

5. Завдання для перевірки студентами свого вихідного рівня знань.

Контрольні питання

  1. Означення випадковоі події, її відносну частоту та ймовірність.

  2. Теорема складання ймовірностей несумісних подій

  3. Теорема складання ймовірностей сумісних подій

  4. Теорема множення ймовірностей незалежних подій

  5. Теорема множення ймовірностей залежних подій

  6. Теорема повної ймовірності

  7. Теорема Байєса

  8. Означення випадкових величин: дискретної та неперервної

  9. Означення розподілу, ряд розподілу та многокутника розподілу дискретної випадкової величини

  10. Означення функції розподілу

  11. Означення мір положення центру розподілу

  12. Означення мір варіабельності значень випадкової величини

  13. Означення щільністі розподілу та кривої розподілу неперервної випадкової величини

  14. Означення функціональної залежністі між випадковими величинами

  15. Означення кореляційної залежністі між випадковими величинами

  16. Означення регресії, рівняння та лінії регресії

  17. Означення коваріації та коефіцієнта кореляції

  18. Означення рівняння лінійної регресії.

6. Інформацію для закріплення вихідних знань-вмінь можна знайти у посібниках:

  1. Жуматій П.Г. Лекція “Теорія ймовірностей”. Одеса, 2009.

  2. Жуматій П.Г. “ Основи теорії ймовірностей”. Одеса, 2009.

  3. Жуматій П.Г., Сеницька Я.Р. Елементи теорії ймовірностей. Методичні вказівки для студентів медичного інституту. Одеса, 1981.

  4. Чалий О.В., Агапов Б.Т., Цехмістер Я.В. Медична і біологічна фізика. Київ, 2004.

7. Зміст навчального матеріалу з даної теми з виділенням основних вузлових питань.

Математична статистика - це розділ математики, що вивчає методи збору, систематизації, обробки, зображення, аналізу та інтерпретації результатів спостережень з метою виявлення існуючих закономірностей.

Застосування статистики у охороні здоров'я необхідно як на рівні спільноти, так і на рівні окремих пацієнтів. Медицина має справу з індиві­дуумами, які відрізняються один від одного по багатьом характеристи­кам, і значення показників, на основі яких людину можна вважати здоровою, варіюються від одного індивідуума до іншого. Немає двох абсолютно однако­вих пацієнтів або двох груп пацієнтів, тому рішення, що стосуються окремих хворих або груп населень, доводиться приймати, виходячи з досвіду, накопиченого на інших хворих або популяціних групах із схожими біологіч­ними характеристиками. Необхідно усвідомлювати, що з огляду на існуючі розбіжності ці рішення не можуть бути абсолютно точними - вони завжди пов’язані з деякою невизначеністю. Саме в цьому полягає ймовірносна природа медицини.

Деякі приклади застосування статистичних методів у медицині:

трактовка варіації (варіабельність характеристик організму при рішенні питання про те, яке значення тієї або іншої характеристики буде ідеальним, нормальним, середнім і т.і., робить необхідним використання відповідних статистичних методів ).

діагностика захворювань у окремих хворих та оцінка стану здоров'я групи населення.

прогнозування кінця хвороби у окремих хворих або можливого результату програми боротьби з тієї або іншою хворобою в будь-якій групі населення.

вибір придатного впливу на хворого або на групу населення.

планування та проведення медичних досліджень, аналіз та публикація результатів, їх читання та критична оцінка.

планування охорони здоров'я та керівництво ним.

Корисна медична інформація звичайно прихована у масі необроблених даних. Необхідно сконцентрувати інформацію, що міститься у них, та представити дані так, щоб структуру варіації було добре видно, а потім вже вибрати конкретні методи аналізу.

Зображення даних передбачає знайомство з такими поняттями та термінами:

варіаційний ряд (упорядковане розташування) - просте впорядкування окремих спостережень за величиною.

клас - один з інтервалів, на які ділять весь діапазон значень випадкової величини.

крайні точки класу - значення, які обмежують клас, наприклад 2,5 та 3,0, нижня та верхня межі класу 2,5 - 3,0.

(абсолютна) частота класу - число спостережень у класі.

відносна частота класу - абсолютна частота класу, виражена у вигляді частки загального числа спостережень.

кумулятивна (накопичена) частота класу - число спостережень, що дорівнює сумі частот всіх попередніх класів та даного класу.

стовпцева діаграма - графічне зображення частот даних для номінальних класів за допомогою стовпців, висоти яких прямо пропорційні частотам класів.

кругова діаграма - графічне зображення частот даних для номінальних класів за допомогою секторів круга, площі яких прямо пропорційні частотам класів.

гістограма - графічне зображення частотного розподілу кількісних даних площами прямокутників, прямо пропорційних частотам класів.

полігон частот - графік частотного розподілу кількісних даних; точку, відповідну частоті класу, розташовують над серединою інтервалу, кожні дві сусідні точки з'єднують відрізком прямої.

огива (кумулятивна крива) - графік розподілу кумулятивних відносних частот.

Всім медичним даним властива варіабельність, тому аналіз результатів вимірювань заснований на вивченні відомостей про те, які значення приймала випадкова величина, що досліджується.

Сукупність всіх можливих значень випадкової величини називається генеральною.

Частина генеральної сукупності, зареєстрована у результаті випробувань, зветься виборкою.

Число спостережень, включене у виборку, звуть обсягом виборки (звичайно позначається n).

Задача вибіркового методу полягає в тому, щоб по отриманій виборці зробити правильну оцінку випадкової величини, що вивчається. Тому основ­на вимога, що пред'яв-ляється до виборки, це максимальне відображення всіх рис генеральної сукупності. Виборка, що задовольняє цій вимозі, називається репрезентативною. Від репрезентативності виборки залежить обгрунтованість оцінки, тобто ступінь відповідності оцінки параметру, який вона характеризує.

При оцінюванні параметрів генеральної сукупності по виборці (параметричному оцінюванні) користуються такими поняттями:

точкове оцінювання - оцінка параметра генеральної сукупності у вигляді одиничного значення, яке він може прийняти з найбільшою ймовірністю.

інтервальне оцінювання - оцінка параметра генеральної сукупно­сті у вигляді інтервалу значень, який має задану ймовірність накрити його істинне значення.

При інтервальному оцінюванні використовують поняття:

надійний інтервал - інтервал значень, який має задану ймовір­ність накрити істинне значення параметра генеральної сукупності при інтервальному оцінюванні.

вірогідність (надійна ймовірність) - ймовірність, з якою надій­ний інтервал накриває істинне значення параметра генеральної сукупності.

надійні межі - нижня та верхня межі надійного інтервала.

Висновки, що одержуються методами математичної статистики, завжди засновуються на обмеженому, вибірковому числі спостережень, тому природньо, що для другої виборки результати можуть бути іншими. Це об­ста­вина визначає ймовірносний характер виведень математичної стати­сти­ки та, як слідство, широке використання теорії ймовірностей у практиці стати­стичного дослідження.

Типовий шлях статистичного дослідження такий:

оцінивши величини або залежності між ними за даними спостережень, висувають припущення про те, що явище, яке вивчається, можна описати тієї або іншою стохастичною моделлю

• використовуючи статистичні методи, можна це припущення підтвердити або відкинути; при підтвердженні мета досягнена - знайдено модель, що описує досліджувані закономірності, у протилежному випадку продовжують роботу, висуваючи та перевіряючи нову гіпотезу.

Означення вибіркових статистичних оцінок:

мода - це значення, яке найчастіше зустрічається у виборці,

медіана - центральне (серединне) значення варіаційного ряду

розмах R - різниця між найбільшим та найменшим значеннями у серії спостережень

процентилі - значення у варіаційному ряду, які ділять розподіл на 100 рівних частин ( таким чином, медіана буде п'ятидесятим процентилем )

перший квартиль - 25-ий процентиль

третій квартиль - 75-ий процентиль

міжквартильний розмах - різниця між першим та третім квартилями (охоплює центральних 50% спостережень)

квартильне відхилення - половина міжквартильного розмаху

вибіркове середнє - середнє арифметичне всіх вибіркових значень (вибіркова оцінка математичного сподівання )

середнє абсолютне відхилення - сума відхилень від відповідного початку (без врахування знака), поділена на обсяг виборки

середнє абсолютне відхилення від вибіркового середнього обчислюють за формулою

вибіркова дисперсія (X) - (вибіркова оцінка дисперсії ) визначається формулою

вибіркова коваріація -- (вибіркова оцінка коваріації К(Х,Y) ) дорівнює

вибірковий коефіцієнт регресії Y на X (вибіркова оцінка коефіцієнта регресії Y на X ) дорівнює

емпіричне рівняння лінійної регресії Y на X має вигляд

вибірковий коефіцієнт регресії X на Y (вибіркова оцінка коефіцієнта регресії X на Y ) дорівнює

емпіричне рівняння лінійної регресії X на Y має вигляд

вибіркове стандартне відхилення s(Х) - (вибіркова оцінка стандартного відхилення) дорівнює кореню квадратному з вибіркової дисперсії

вибірковий корреляційний коефіцієнт - (вибіркова оцінка кореляційного коефіцієнта ) дорівнює

вибірковий коефіцієнт варіації - (вибіркова оцінка коефіцієнта варіації CV) дорівнює

.

8. Завдання для самостійної підготовки студентів.

8.1 Завдання для самостійного вивчення матеріалу з теми.

8.1.1 Практичне обчислення вибіркових оцінок

Практичне обчисленнявибіркових точкових оцінок

Приклад 1.

Тривалість захворювання (у днях) у 20 випадках пневмонії склала:

10, 11, 6, 16, 7, 13, 15, 8, 9, 10, 11, 13, 7, 8, 13, 15, 16, 13, 14, 15

Визначити моду, медіану, розмах, міжквартильний розмах, вибіркове середнє, середнє абсолютне відхилення від вибіркового середнього, вибіркову дисперсію, вибірковий коефіцієнт варіації.

Розв’зок.

Варіаційний ряд для виборки має вигляд

6, 7, 7, 8, 8, 9, 10, 10, 11, 11, 13, 13, 13, 13, 14, 15, 15, 15, 16, 16

• Мода

Найбільш часто у виборці зустрічається число 13. Тому значенням моди у виборці буде це число.

• Медіана

Коли варіаційний ряд містить парне число спостережень, медіана дорівнює середньому двох центральних членів ряду, у даному випадку це 11 та 13, тому медіана дорівнює 12.

• Розмах

Мінімальне значення у виборці дорівнює 6, а максимальне 16, отже, R = 10.

• Міжквартильний розмах, квартильне відхилення

У варіаційному ряді чверть всіх даних має значення менші, або рівні 8, тому перший квартиль 8, а 75% всіх даних мають значення менші, або рівні 12, тому третій квартиль 14. Отже, міжквартильний розмах дорівнює 6, а квартильне відхилення становить 3.

• Вибіркове середнє

Середнє арифметичне всіх вибіркових значень дорівнює

.

• Середнє абсолютне відхилення від вибіркового середнього

.

• Вибіркова дисперсія

• Вибіркове стандартне відхилення

.

• Bибірковий коефіцієнт варіації

.

У наступному прикладі розглянемо найпростіші засоби вивчення стохастичної залежності між двома випадковими величинами.

Приклад 2.

При обстеженні групи пацієнтів одержані дані про зріст Н (см) та об’єм циркулюючої крові V (л) :

Н

170

169

175

150

175

155

180

160

185

175

165

V

4,8

5,1

4,0

5,3

4,1

5,3

4,8

4,3

5,2

5,2

4,7

Знайти емпіричні рівняння лінійної регрессії.

Розв’зок.

Перше, що необхідно обчислити, це:

• вибіркове середнє

• вибіркове середнє

.

Друге, що необхідно підрахувати, це:

• вибіркову дисперсію (Н)

• вибіркову дисперсію (V)

• вибіркову коваріацію

Третє, це обчислення вибіркових коефіцієнтів регресії:

• вибірковий коефіцієнт регресії V на H

• вибірковий коефіцієнт регресії H на V

.

Четверте, записати шукані рівняння:

• емпіричне рівняння лінійної регресії V на H має вигляд

• емпіричне рівняння лінійної регресії H на V має вигляд

.

Приклад 3.

Використовуючи умови та результати прикладу 2, вирахувати коефіцієнт кореляції та перевірити достовірність існування кореляційної залежності між зростом людини та об'ємом циркулюючої крові з 95% надійною імовірністю.

Розв’зок.

Коефіцієнт корреляції пов'язаний з коефіцієнтами регресії та практично корисною формулою

.

Для вибіркової оцінки коефіцієнта корреляції ця формула має вигляд

.

Використовуючи вираховані у прикладі 2 значення вибіркових коефіцієнтів регрессії та , одержимо

.

Перевірка достовірності корреляційної залежності між випадковими величинами (вважається нормальний розподіл у кожної з них) здійснюється таким чином:

  • обчислюють величину Т

  • знаходять у таблиці розподілу Стьюдента коефіцієнт

  • існування кореляційної залежності між випадковими величинами підтверджується при виконанні нерівності

.

Оскільки 3,5 > 2,26, то з 95% надійною ймовірністю існування кореляційної залежності між зростом пацієнта та об'ємом циркулюючої крові можна вважати встановленим.

Інтервальні оцінки для математичного сподівання та дисперсії

Якщо випадкова величина має нормальний розподіл, то інтервальні оцінки для математичного сподівання та дисперсії обчислюють у такій послідовності:

1. знаходять вибіркове середнє ;

2. підраховують вибіркову дисперсію та вибіркове стандартне відхилення s;

3. у таблиці розподілу Стьюдента за надійною ймовірністю  та обсягом виборки n знаходять коефіцієнт Стьюдента ;

4. надійний інтервал для математичного сподівання записують у вигляді

5. у таблиці розподілу "хі-квадрат" за надійною ймовірністю  та обсягом виборки n знаходять коефіцієнти

;

6. надійний інтервал для дисперсії записують у вигляді

Величина надійного інтервалу, надійна ймовірність  та обсяг виборки n залежать один від одного. Насправді, відношення

зменшується із зростанням n, отже, при постійній величині надійного інтер­валу із зростом n росте і  . При постійній надійній імовірності із зростом обсягу виборки п зменшується величина надійного інтервалу. При плануван­ні медичних досліджень цей зв'язок використовують для визначення міні­маль­ного обсягу виборки, який забезпечить потрібні за умовами вирішуваної задачі величини надійного інтервалу та надійної ймовірності.

Приклад 5.

Використовуючи умови та результати прикладу 1, знайдіть інтервальні оцінки математичного сподівання та дисперсії для 95% надійної імовірності.

Розв’зок.

В прикладі 1 вираховані точкові оцінки математичного сподівання (вибіркове середнє =12), дисперсії (вибіркова дисперсія =10,7) та стандартного відхилення (вибіркове стандартне відхилення ). Обсяг виборки дорівнює п = 20.

Із таблиці розподілу Стьюдента знайдемо значення коефіцієнта

далі обчислимо півширину d надійного інтервалу

та запишемо інтервальну оцінку математичного сподівання

10,5 < < 13,5 при  = 95%

Із таблиці розподілу Пірсона " хі-квадрат " знайдемо коефіцієнти

обчислимо нижню та верхню надійні межі

та запишемо інтервальну оцінку для дисперсії у вигляді

6,2 23 при  = 95% .

8.1.2. Задачі для самостійного розв’язання

Для самостійного розв’язання пропонуються задачі 5.4 С 1 – 8 (П.Г.Жуматій. “Математична обробка медико-біологічних даних. Задачі та приклади”. Одеса, 2009, с. 24-25)

8.1.3. Контрольні запитання

  1. Частота класу (абсолютна та відносна).

  2. Генеральна сукупність та вибірка, обсяг вибірки.

  3. Точкове та інтервальне оцінювання.

  4. Надійний інтервал та вірогідність.

  5. Мода, медіана та вибіркове середнє.

  6. Розмах, міжквартільний розмах, квартальне відхилення.

  7. Середнє абсолютне відхилення.

  8. Вибіркові коваріація та дисперсія.

  9. Вибіркові стандартне відхилення та коефіцієнт варіації.

  10. Вибіркові коефіцієнти регресії.

  11. Емпіричні рівняння регресії.

  12. Обчислення кореляційного коефіцієнта та вірогідності кореляційного зв’язку.

  13. Побудова інтервальних оцінок нормально розподілених випадкових величин.