Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Метод_СТУДЕНТИ_друк2013.doc
Скачиваний:
69
Добавлен:
12.02.2015
Размер:
1.71 Mб
Скачать

Міністерство охорони здоров'я україни

ВІННИЦЬКИЙ НАЦІОНАЛЬНИЙ МЕДИЧНИЙ УНІВЕРСИТЕТ

імені М.І.ПИРОГОВА

Затверджено”

на методичній нараді

кафедри біофізики ВНМУ

Завідувач кафедри

проф. Хаїмзон І.І.

“____” ______________ 20 р.

Методичні вказівки

ДО ПРАКТИЧНОГО ЗАНЯТТЯ №8

Навчальна дисципліна

Інформаційні технології у психології та медицині

Модуль №1

Інформаційні технології у психології та медицині

Змістовий модуль №1

Основи інформаційних технологій в системі охорони здоров’я. Методологія обробки та аналізу медичних та психологічних даних.

Тема заняття

Статистична обробка медико-психологічних даних. Статистичне оцінювання. Елементи кореляційно-регресійного аналізу.

Курс

1

Факультет

медичний

Спеціальність

Медична психологія

Вінниця, ВНМУ - 2012

Мета роботи: Ознайомитись з елементарними засобами статистичної обробки даних табличного процесора Excel.

Познайомитись з статистичними функціями процесора електронних таблиць (ПЕТ) Excel та принципами їх використання.

Навчитись практично виконувати статистичну обробку даних засобами ПЕТ Excel.

Теоретичні відомості.

Серед програмних засобів загального призначення, які дозволяють виконувати статистичну обробку даних, найбільш ефективними є процесори електронних таблиць (ПЕТ), типовим представником яких є MS Excel. Це обумовлено тим, що первинні статистичні дані завжди подаються у вигляді таблиць, а алгоритми статистичної обробки їх полягають у послідовному виконанні обчислень за одними і тими самими формулами над масивами даних (рядками та стовпчиками) таблиць з наступним аналізом результатів. Таким чином, принцип роботи ПЕТ і організація їх даних ідеально відповідають організації статистичних даних і алгоритмам їх обробки. Завдяки цьому ПЕТ являють собою зручні і ефективні засоби для реалізації статистичного аналізу даних за допомогою формул, які задає користувач. Природно, що у складі сучасних ПЕТ передбачено цілий ряд статистичних функцій, які реалізують найбільш важливі і часто вживані статистичні розрахунки.

Засоби ПЕТ MS Excel, які дозволяють виконувати статистичний аналіз даних, можна розділити на три рівні:

  1. Формули користувача, які розміщуються у комірках електронної таблиці і реалізують окремі формули та етапи статистичних розрахунків (обчислення середнього значення, розрахунок відхилень, квадратів відхилень, сум квадратів відхилень, добутків відхилень та їх суми тощо) за допомогою елементарних математичних операцій та функцій. Для виконання статистичних розрахунків за допомогою формул користувача потрібно створити робочий аркуш Excel, який реалізує відповідний алгоритм аналізу. Це відносно складний і трудомісткий шлях, який потребує роботи зі складними формулами і громіздкими алгоритмами, але найбільш гнучкий. Створений робочий аркуш надалі може використовуватись як завершений інструмент для інших розрахунків.

  2. Статистичні функції, які являють собою функціональні програмні модулі, що реалізують окремі статистичні формули (розрахунок середніх значень дисперсії, коефіцієнта кореляції, довірчого (надійного) інтервалу тощо) і можуть використовуватись у формулах. MS Excel містить кілька десятків статистичних функцій, робота з якими ведеться за допомогою спеціальної програми майстра функцій. Використання статистичних функцій значно полегшує виконання статистичного аналізу, робить робочі аркуши більш простими, компактними, але вимагає від користувача досить глибоких знань в області математичної статистики.

  3. Надбудова Анализ данных (пакет аналізу), який являє собою пакет спеціалізованих програм (макрофункцій), призначених для розв’язання складних статистичних та інженерних задач з поданням результатів у різних формах, включаючи графічну і набір звітів. При використанні засобів пакету аналізу користувач повинен вказати вхідні дані і задати параметри для відповідної макрофункції, уся обробка виконується автоматично. Успішне застосування процедур аналізу потребує достатніх знань в галузі математичної статистики, а також вміння працювати з пакетом аналізу.

Статистичні функції, разом з іншими функціями (математичними, фінансовими, дати і часу та ін.) є обов’язковим компонентом ПЕТ Excel. Виклик функції здійснюється за її іменем у відповідності з наступним форматом:

<ім’я_функції> [(аргументи функції)],

де <ім’я_функції> – ідентифікатор функції, [(аргументи функції)] – це список діапазонів та чисельних значень, які є аргументами функції. Список аргументів заключається у дужки, елементи списку розділяються комами. Деякі функції можуть не мати списку аргументів.

Більш потужні засоби статистичної обробки даних надає пакет аналізу. Надбудова пакет аналізу викликається командою Анализ данных, яка входить у меню Сервис. По команді Анализ данных видається вікно (рис.3), яке містить список вибору інструментів аналізу, з якого обирається потрібний засіб, і керуючі кнопки ОК (підтверджує вибір і здійснює перехід до налаштування обраного інструмента), Отмена (відміняє виклик пакету аналізу), Справка (викликає розділ Статистический анализ довідкової системи). Після вибору певного інструменту видається діалогове вікно налаштування, за допомогою якого задаються вхідні дані та параметри інструменту. Способи введення вхідних даних (аргументів) повністю аналогічні тим, що надаються майстром функцій. Командна кнопка Справка викликає довідку по обраному інструменту, а кнопка ОК запускає обраний інструмент аналізу з встановленими параметрами

Розрахунок точкових оцінок характеристик розподілу випадкової величини.

Точкова оцінка характеристики розподілу випадкової величини – це оцінка, яка являє собою одне число. Точкова оцінка визначається для кожної характеристики розподілу. Ці оцінки розраховуються на основі вибірки та стисло і узагальнено описують розподіл, поданий вибіркою.

Найліпшою точковою оцінкою математичного сподівання величини Х є статистика (вибіркове середнє)

, (3.1)

де хі – значення і-того елемента вибірки;

N – об’єм виборки.

Найліпшою точковою оцінкою для дисперсії величини Х при невідомому математичному сподіванні є статистика

, (3.2)

де N – об’єм виборки;

хі – значення і-того елемента виборки;

–вибіркове середнє.

На практиці при розрахунку оцінки дисперсії доцільно керуватись таким правилом: якщо математичне сподівання М(Х) відоме (наприклад, з якихось інших джерел) або оцінка його знайдена за іншою вибіркою, то застосовують оцінку (3.3), якщо ж оцінка математичного сподівання () отримана за тою ж самою вибіркою, то застосовують оцінку (3.2).

Вибіркову дисперсію S2 зручно розраховувати за формулою

, (3.5)

де – середній квадрат ознаких.

Найліпшою точковою оцінкою для стандартного (середньоквадратичного відхилення) є додатне значення квадратного кореня з оцінки дисперсії:

. (3.6)

Найліпшою точковою оцінкою стандартного відхилення усередненого значення величини Х (середньоквадратичного відхилення середнього арифметичного) є статистика

. (3.7)

Вибіркове середнє є найбільш часто вживаною оцінкою випадкових величин, особливо при вимірювані фізичних величин. Але це далеко не єдина, і не в усіх відношеннях найкраща, оцінка середнього значення. Існує цілий ряд інших оцінок: середнє геометричне, середнє гармонічне, середнє зважене (арифметичне, геометричне, гармонічне), середнє степеневе, мода, медіана.

Мода – це точка локального максимуму густини розподілу ймовірності. Для вибірки мода – це значення,яке зустрічається у вибірці найбільш часто, тобто значення ряду розподілу, якому відповідає найбільша частота або ймовірність. Для відшукання моди слід побудувати за вибіркою варіаційний ряд і з нього вибрати значення, якому відповідає найбільша частота.

Медіана – це значення, яке ділить ранжований (тобто впорядкований у порядку зростання) варіаційний ряд на дві рівні за об’ємом частини. Якщо число членів ряду непарне, то медіаною є елемент, розташований посередині, тобто елемент з номером . Якщо число членів ряду непарне, то медіана дорівнює середньому арифметичному членів ряду з номерамита. Медіана як статистична характеристика має деякі переваги перед вибірковим середнім і в багатьох випадках слід застосовувати саме її (зокрема у задачах непараметричної статистики).

Варіаційний розмах – це різниця найбільшого і найменшого значень ряду, тобто ширина діапазону значень ряду

(3.13)

Коефіцієнт варіації V – це відношення вибіркового середнього квадратичного відхилення (стандартного відхилення) до вибіркового середнього

(3.14)

Середнє відхилення – це середнє арифметичне абсолютних відхилень елементів вибірки від середнього значення:

(3.15)

Для розрахунку основних точкових оцінок характеристик розподілу MS Excel надає ряд спеціальних функцій, що належать до категорії Статистические. Розрахунок оцінок, для яких відсутні вбудовані функції (таких як, наприклад, середні зважені), може бути реалізований шляхом створення відповідних програмних модулів (за допомогою VBA) або шляхом побудови робочих аркушів, що виконують відповідні обчислювальні схеми.

Порядок виконання роботи

Завдання 1. Розрахунок точкових оцінок характеристик розподілу випадкової величини.

Задача. Дано результати вимірювання часу простої реакції розрізнення (в мілісекундах) при тестуванні одинадцяти осіб: 236; 247; 231; 316; 319; 322; 257; 315; 245; 316; 229.

Знайти точкові оцінки математичного сподівання, дисперсії і стандартного відхилення параметра. Визначити середнє геометричне, середнє гармонічне, моду, медіану, варіаційний розмах, середнє відхилення та коефіцієнт варіації параметра.

Для виконання завдання рекомендується відкрити нову робочу книгу MS Excel і підгодувати робочий аркуш для задачі за зразком:

І. Використовуючи теоретичні відомості ввести розрахункові формули в комірки таблиці.

1. В комірку В5 ввести формулу для розрахунку вибіркового середнього „=СРЗНАЧ(В2:L2)”.

2. До комірки В6 ввести формулу для розрахунку середнього геометричного «=СРГЕОМ(2:2)», для чого повторити пункт 3.3.1., обравши на першому кроці функцію СРГЕОМ.

3. До комірки В7 ввести формулу для розрахунку середнього гармонічного „=СРГАРМ(2:2)”, для чого повторити пункт 3.3.1., обравши на першому кроці функцію СРГАРМ.

4. До комірки В8 ввести формулу для розрахунку медіани „=МЕДИАНА(2:2)”, для чого повторити пункт 3.3.1., обравши на першому кроці функцію МЕДИАНА.

До комірки В9 ввести формулу для розрахунку моди „=МОДА(2:2)”, для чого повторити пункт 3.3.1., обравши на першому кроці функцію МОДА.

5. До комірки В10 ввести формулу для розрахунку дисперсії „=ДИСП(2:2)”, для чого повторити пункт 3.3.1., обравши на першому кроці функцію ДИСП.

6. До комірки В11 ввести формулу для розрахунку стандартного відхилення „=СТАНДОТКЛОН (2:2)”, для чого повторити пункт 3.3.1., обравши на першому кроці функцію СТАНДОТКЛОН.

7. До комірки В12 ввести формулу для розрахунку середнього відхилення „=СРОТКЛ (2:2)”, для чого повторити пункт 3.3.1., обравши на першому кроці функцію СРОТКЛ.

8. До комірки В13 ввести формулу для розрахунку варіаційного розмаху „=МАКС(2:2)–MИН(2:2)”. У формулі використовуються функції МАКС і МИН, які виділяють відповідно найбільше та найменше значення з набору значень.

9. До комірки В14 ввести формулу для розрахунку коефіцієнта варіації „=В6/B4”.

. Проглянути робочий аркуш в режимі відображення формул, для чого:

  • у головному меню обрати пункт Сервис, а у його підпорядкованому меню – команду Параметры;

  • на вкладці Вид діалогового вікна команди Параметры встановити прапорець опції „формулы” і дати ЛК на кнопці ОК вікна;

  • продивитись робочий аркуш з розрахунковими формулами;

  • відмінити режим відображення формул, для чого зняти прапорець „формулы” на закладці Вид вікна команди Параметры.

ІІ. Скопіювати створену розрахункову таблицю на новий аркуш і, використовуючи його, самостійно розв’язати аналогічну задачу, видану викладачем. Занести до протоколу умову задачі і розраховані значення оцінок.

ІІІ. За допомогою довідкової системи ознайомитись з довідковою інформацією по наступних функціях: СРЗНАЧ, СРЗНАЧА, СРГЕОМ, СРГАРМ, МЕДИАНА, МОДА, ДИСП, ДИСПА, ДИСПР, ДИСПРА, МАКС, МАКСА, МИН, МИНА, СРОТКЛ, СТАНДОТКЛОН, СТАНДОТКЛОНА, СТАНДОТКЛОНП, СТАНДОТКЛОНПА, СРОТКЛ. Занотувати основні відомості про функції.

Питання для самоконтролю.

  1. Які властивості має нормальний розподіл?

  2. Що являє собою стандартний нормальний розподіл?

  3. Як визначається ймовірність того, що нормально розподілена випадкова величина належить заданому проміжку?

  4. Як розраховується вибіркове середнє?

  5. Який зміст має вибіркове середнє?

  6. Як розраховується і який зміст має дисперсія?

  7. Що таке стандартне відхилення?

  8. У чому полягає відмінність між дисперсією і стандартним відхиленням?

Рекомендована література.

  1. Булах І.Є. Інформаційні технології у психології та медицині: Підручник / І.Є. Булах, І.І. Хаїмзон. - К.: ВСВ «Медицина», 2011.- 216 с.

  2. Основи інформаційних технологій в системі охорони здоров’я. Обробка та аналіз медичних даних // Збірник методичних рекомендацій до практичних занять з медичної інформатики (модуль №1) для студентів ІІ-го курсу медичного факультету (під редакцією проф. І.І.Хаїмзона).— Вінниця: ВНМУ, 2006. – 294 с.

  3. Герасевич В.А. Компьютер для врача. Самоучитель. – 2-е изд., перераб. И доп. – СПб.:БХВ Петербург, 2004. – 512 с.

Аудиторна робота

1. Виконання лабораторної роботи: – 75хв.

2. Тестовий контроль знань студентів – 10 хв.

3. Оголошення результатів роботи та завдання донаступного заняття – 5 хв