Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
М.В.бометря_1.doc
Скачиваний:
5
Добавлен:
16.11.2019
Размер:
1.39 Mб
Скачать

Практичне заняття №1 Оцінка невідомих параметрів нормального розподілу

Коли ми розповсюджуємо уявлення про скінчену групу осіб на інші групи або на усю сукупність, ми користуємось інформацією про вибірку. Коли лікар хоче отримати уявлення щодо складу і стану крові пацієнта, він проводить аналіз невеликої вибірки крові. Будь-яке значення шуканого параметру, вирахуване на основі обмеженої кількості дослідів, завжди буде містити елемент випадковості. Працівники охорони здоров’я постійно мають справу з інформацією, що базуються на обмежених вибірках. Тому вони повинні добре уявляти границі надійності аналізу інформації на основі вибіркових даних.

Мета роботи

  1. Вивчити поняття “генеральна сукупність” і “вибірка”.

  2. Навчитися обчислювати вибіркову середню, виправлену вибіркову дисперсію, виправлене середньоквадратичне відхилення.

  3. Навчитись обчислювати довірчий інтервал для математичного сподівання, що відповідає заданій довірчій ймовірності.

1. Підготовка до роботи

Вивчити за рекомендованою літературою наступні питання:

  1. Що називається “генеральною сукупністю”? Вибірковою сукупністю?

  2. Формули для обчислення генеральної середньої, вибіркової середньої, виправленої вибіркової дисперсії.

  3. Яка величина є точковою оцінкою математичного очікування? Яка величина є точковою оцінкою дисперсії?

  4. Значення довірчого інтервалу, довірчої ймовірності.

  5. Формули для їх обчислення.

2. Теоретичні відомості

2.1 Основні кількісні характеристики розподілу випадкових величин [1]

Дослідження проблеми полягає в тому, щоб на підставі даних, здобутих для обмеженого масиву спостережень, дійти висновку щодо найширшого кола явищ.

Усю сукупність спостережень називають генеральною. Отриману вибірку називають репрезентативною, якщо вона достатньо добре описує властивості генеральної сукупності. Питання полягає у знаходженні ступеня надійності і вірогідності отриманих висновків.

Емпіричні характеристики розподілу, отримані за даними вибірки, розглядають як наближені значення. Із збільшенням об’єму вибірки ці оцінки асимптотично наближуються до справжніх значень оцінюваних параметрів. При малих вибірках заміна генеральних характеристик вибірковими може дати значну помилку.

Властивості оцінок параметрів [1]

Оцінки параметрів повинні відповідати наступним вимогам:

  1. Не зміщування. Це означає, що при проведенні великої кількості досліджень з вибірками одного розміру середнє значення кожної вибірки наближається до істинного значення генеральної сукупності. Зміщування зумовлено наявністю систематичної похибки.

  2. Спроможність. Із збільшенням розміру вибірки оцінка повинна наближатися до значення відповідного параметра генеральної сукупності з ймовірністю, що наближається до 1.

  3. Ефективність. Вибрана оцінка для вибірки рівного об’єму повинна мати мінімальну дисперсію.

  4. Достатність. Оцінка повинна мати всю необхідну інформацію і не вимагати додаткової.

До характеристик одномірного розподілу відносяться:

  1. Міри положення (середнє, медіана, мода).

  2. Міри розсіювання (розмах, коефіцієнт варіації, дисперсія, середнє квадратичне відхилення)

  3. Міри форми (асиметрія, ексцес, моменти третього і четвертого порядку).

Середнє арифметичне (вибіркове)

Середнє арифметичне – це показник який є центром розподілу, навколо якого групуються всі варіанти статистичної сукупності. Середнє арифметичне може бути простим і зваженим.

Просте середнє арифметичне визначають за формулою:

(1.1)

Коли окремі варіанти повторюються, середнє арифметичне (називають зваженої середньою) розраховують за формулою:

(1.2)

де - частоти варіант.

Властивості середнього:

  • Сума відхилень від середнього дорівнює 0.

  • Якщо всі значення вибірки збільшити або зменшити, помножити або розділити на одне і теж число, то середнє значення зміниться аналогічно.

  • Із збільшенням кількості вимірювань точність оцінки збільшується і середнє наближається до математичного сподівання, але тільки в тому випадку, якщо немає систематичних помилок і спостереження незалежні.

Середнє гармонічне

В деяких випадках (наприклад, розрахунок середньої тривалості життя, визначення середньої швидкості) використовується середнє гармонічне [1, 2]:

і (1.3)

Мода

Це значення, котре спостерігається найбільше кількість разів (найбільш ймовірна величина). Для інтервального варіаційного ряду розраховується за формулою [1, 2]:

(1.4)

де - початок модального інтервалу (такий, котрому відповідає найбільша частота);

h – величина модального інтервалу;

- частота модального інтервалу;

- частота інтервалу, попереднього модальному;

- частота інтервалу, що йде за модальним.

Медіана (вибіркова)

Це значення, котре ділить рангований варіаційний ряд на дві рівні за об’ємом групи. Для інтервального варіаційного ряду медіана визначається за формулою [1, 2]::

(1.5)

де - початок медіального інтервалу;

h – величина медіального інтервалу;

- частоти по всім інтервалам;

- частота, накопичена до початку медіального інтервалу;

- частота медіального інтервалу.

Медіанним називається інтервал, в якому знаходиться значення медіани.

Варіаційний розмах

(1.6)

Не надійна характеристика, оскільки на неї впливають крайні значення.

Дисперсія [1, 2]

або (1.7)

Цінність дисперсії полягає в тому, що будучи мірою варіювання числових значень ознаки навколо середнє арифметичної, вона вимірює і внутрішню мінливість значень ознаки, яка залежить від різниці між спостереженнями.

Було встановлено, що розрахована за формулою (1.7) дисперсія виявляється зміщеною по відношенню до свого генерального параметру на величину . Щоб отримати незміщену дисперсію, необхідно в формулу (1.7) ввести поправку Беселя. В результаті формула перетворюється наступним чином [2]:

(1.8)

(1.9)

Необхідно зауважити, що замість можна використовувати:

.

Звідси можна вивести наступні робочі формули, зручні при розрахунках дисперсії безпосередньо за значеннями варіативної ознаки [2]:

(1.10)

(1.11)

(1.12)

Якщо повторюються окремі варіанти, то використовують формули [2]:

(1.13)

(1.14)

(1.15)

Властивості дисперсії [1, 2]:

  • Дисперсія постійної величини дорівнює 0.

  • Якщо всі результати збільшити або зменшити на одне і теж число, то дисперсія не зміниться.

  • Якщо результати змінити в К разів, то дисперсія зміниться в К2 разів.

  • Корінь квадратний із дисперсії представляє собою середнє квадратичне відхилення σ (стандартне відхилення).

Середнє квадратичне відхилення

Поряд із дисперсією важливою характеристикою варіювання є середнє квадратичне відхилення – показник, який визначається як корінь із дисперсії [1, 2]:

(1.16)

Ця величина в деяких випадках виявляється більш зручною характеристикою варіювання, ніж дисперсія, так як виражається в тих же одиницях, що й середня арифметична величина.

Коефіцієнт варіації

На практиці досить часто необхідно порівнювати мінливість ознак, які виражені різними одиницями. В цих випадках використовують не абсолютні, а відносні показники варіації. Дисперсія і середнє квадратичне відхилення для оцінки мінливості різнойменних величин непридатні. Одним із відносних показників варіації є коефіцієнт варіації. Цей показник представляє собою середнє квадратичне відхилення, виражене у відсотках від величини середнє арифметичної [1, 2]:

(1.17)

Нормоване відхилення t

Відхилення тієї чи іншої варіанти від середнє арифметичної, віднесене до величини середнє квадратичного відхилення, називають нормованим відхиленням [1, 2]:

(1.18)

Цей показник дозволяє «вимірювати» відхилення окремих варіант від середнього рівня і порівнювати їх для різних ознак.

Визначення параметрів з використанням електронної таблиці Excel [1]

Більшість із описаних параметрів і характеристик можуть бути розраховані з використанням електронної таблиці Excel.

Таблиця 1.1 – Параметри з використанням електронної таблиці Excel [1]

Назва параметру

Назва функції, англ./рос.

Опис параметрів

Середнє

AVERAGE/СРЗНАЧ

Перелік значень або інтервал імен комірок

Медіана

MEDIAN/МЕДИАНА

Перелік значень або інтервал імен комірок

Мода

MODA/МОДА

Перелік значень або інтервал імен комірок

Дисперсія

VAR/ДИСП

Перелік значень або інтервал імен комірок

Середнє квадратичне відхилення

STDEV/СТАНДОКЛОН

Перелік значень або інтервал імен комірок

Середнє геометричне

GEOMEAN/СРГЕОМ

Перелік значень або інтервал імен комірок

Половина ширини довірчого інтервалу

CONFIDENCE/ДОВЕРИТ

(альфа = 0,05, середнє квадратичне, кількість дослідів)

Середнє гармонічне

HARMEAN/СРГАРМ

Перелік значень або інтервал імен комірок

Ексцес

ЭКСЦЕСС

Перелік значень або інтервал імен комірок

Асиметрія

СКОС

Перелік значень або інтервал імен комірок

Середнє значення абсолютних відхилень від середнього значення

СРОТКЛ

Перелік значень або інтервал імен комірок

Стандартне відхилення по генеральній сукупності

СТАНДОТКЛОНПА

Перелік значень або інтервал імен комірок.

Дані при цьому повинні бути генеральною сукупністю