Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
malyuzhenko_m_v_statistika_oporni_lekci.doc
Скачиваний:
7
Добавлен:
08.05.2019
Размер:
696.32 Кб
Скачать

2. Метод паралельних рядів.

Використовується при дослідженні розвитку явищ в часі, або просторі. Являє собою співставлення двох, або більше рядів значень статистичної ознаки. Таке співставлення дозволяє встановити зв’язок між ознаками та скласти уявлення про його характер. Може задаватись таблицею, або графіком.

Х

Y

Залежність побудована по точках, коли в якості значень результативної ознаки використовують середні значення (кореляційний зв’язок) являє собою лінію, що має назву “ламана регресії”.

3. Метод аналітичного групування.

Основний принцип дослідження зв’язку методом аналітичного групування полягає в тому, що в якості групувальної ознаки обирають факторну. В присудку таблиці надають середні значення (абсолютні, або відносні) однієї, або більше результативних ознак. Зміна факторної ознаки при переході від однієї групи до іншої виявляє відповідні зміни результативної ознаки. Невдалий вибір інтервалів групування, або кількості груп може привести до помилок у визначенні зв’язку.

ПРИКЛАД –люба статистична таблиця.

Цей метод дозволяє лише охарактеризувати загальні риси залежності(напрямок зв’язку та уяву про форму), її тенденцію. Більш детальну інформацію метод групування не надає.

(Лекція 10)

Не того треба прагнути, щоб нас розумів кожний,

А того, щоб нас неможливо було не зрозуміти.

Вергілій.

4. Метод дисперсійного аналізу.

ПРИКЛАД – у певній країні треба встановити залежність інтенсивності захворювання (кількість хворих на 1000 населення) на хворобу А від рівня радіоактивного забруднення місцевості. Факторна ознака рівень забруднення. Результативна ознака – інтенсивності захворювання.

Країну поділили на n регіонів і дослідили (і на радіоактивність і на захворюваність). Вважають, що зв’язок між цими показниками існує тоді, коли зі зміною фактора спостерігається відповідна зміна іншої ознаки (нижчий фон – менше хворих). Але на хворобу А можуть впливати і інші чинники. Тому постає питання: якою мірою хвороба А пов’язана саме з радіоактивним фоном (і чи пов’язані вони взагалі)?

Дано: спостерігається варіація певної ознаки (інтенсивності захворювання). Треба встановити, в якій мірі вона викликана варіацією іншої ознаки (яку підозрюють за факторну). Інакше кажучи треба встановити, чи є зв’язок між цими ознаками і наскільки він сильний?

Вважається, що коли зі зміною фактора завжди спостерігається зміна результативної ознаки, то зв’язок між ними сильний. А коли фактор змінюється, а результат не змінюється, то зв’язку між ними нема. Ну і коли фактор змінюється сильно, а результат при цьому теж змінюється, але не дуже суттєво, то вважають, що між фактором і результатом існує частковий зв’язок.

Таким чином основна ідея полягає в наступному: вплив всіх інших чинників (за виключенням фактору) на результат залишити незмінним, а фактор примусити змінюватись. І спостерігати при цьому за поведінкою результативної ознаки. Якщо вона буде варіювати у всьому можливому діапазоні, то це викликано тільки варіацією фактору (бо всі інші чинники незмінні). Якщо результативна ознака незмінна, то зв’язку нема, ну а якщо результат варіює, але не в повній мірі, то зв’язок частковий. А, значить, повну варіацію результату викликають зміни інших чинників.

Коли до певної сукупності застосовують аналітичне групування, то намагаються досягти однієї мети, а саме - звузити діапазон варіації факторної ознаки у окремій групі у порівнянні з усією сукупністю і, таким чином, виключити (або суттєво зменшити) вплив варіації фактора на варіацію результату у групі. Тоді, якщо у такий групі спостерігається значна варіація результату, то зрозуміло, що викликана вона іншими причинами, а не варіацією факторної ознаки.

Нехай в результаті спостереження встановлено, що діапазон радіаційного забруднення на місцевостях, що досліджуються змінюється від Хmin до Хmax. Інтенсивність захворювання, що спостерігається у цих же місцевостях – від Ymin до Ymax.

Розіб’ємо всю сукупність із n досліджених регіонів території радіаційного забруднення на k груп, таким чином, щоб у кожну групу потрапили місцевості з несуттєвою різницею фону (чисті зони, незначний фон, слабкий фон, середній фон, середній фон … зона лиха). Зрозуміло, що кожна з цих груп якось будуть характеризуватись інтенсивністю захворювання на хворобу А. Таким чином утворені групи захворюваності (їх буде теж k ) викладемо у вигляді наступної таблиці.

Кожна група буде характеризуватись своєю чисельністю і своєю середньою захворюваністю по групі і величиною варіації.

з/п

Конкретні значення інтенсивності захворювання (результат y)

групування за фактором радіаційного забруднення (фактор х)

Чисельність групи (gі)

Середнє

групове

1

Y1 , ………………………………..Yg1

g1

Ỹ1

2

Y1 , ………………………………..Yg2

g2

Ỹ2

……

…………………………………….

………….

………..

k

Y 1 , ..……………………………….. Y gm

gm

Ỹk

Всього:

n

Якщо у кожній окремій групі спостерігаються дуже різна інтенсивність хвороби А (значна варіація захворюваності), то зрозуміло, що вона викликана чим завгодно, тільки не зміною рівня радіації (бо у кожній окремій групі рівень майже не змінний). Така ситуація свідчить про слабкий (або зовсім відсутній) зв’язок між радіацією і інтенсивністю хвороби А. Бо фон майже стабільний, а захворюваність при цьому різна.

І навпаки, якщо у кожній групі спостерігається незначна варіація результату, то це можна пояснити незначною варіацією фактора у групі (явне свідчення про наявність зв’язку).

Крім того від групи до групи збільшується фон. Якщо при цьому спостерігається збільшення середньої захворюваності по групах, то це можна пояснити якраз збільшенням фону. Тобто така залежність вказує на існування зв’язку між фактором і результатом.

Варіація, як відомо, характеризується дисперсією. Використання властивостей дисперсії дозволяє оцінити статистичний зв’язок між ознаками.

При аналітичному групуванні можна виділити три види дисперсій результативної ознаки:

Загальну для всієї сукупності (відносно середньої всієї сукупності Y¯, де Y¯- середній рівень інтенсивності захворювання на хворобу А по країні взагалі). Загальна дисперсія результативної ознаки характеризує змінність захворюваності під дією всіх причин, в тому числі і від інтенсивності радіоактивного забруднення (факторної ознаки).

Y¯= Σ Yi ⁄ n (n – це кількість спостережень:)

σ² = Σ (Yi - Y¯)²/n

Групову (в окремій групі відносно середньої захворюваності для певної групи. Тобто група розглядається як окрема сукупність. У окремій групі факторна ознака майже не змінюється, тому якщо спостерігається зміна (варіація) результативної ознаки, то це може бути викликано тільки іншими причинами, а не фактором. Тобто групова дисперсія характеризує змінність факторної ознаки під дією всіх причин за виключенням варіації факторної

Ỹi = Σ Yi /gi

σ²i = Σ (Yi - Ỹi )²/gi

Якщо групова дисперсія дорівнює нулю, це означає, що інші причини не змінюють результативної ознаки. Ознака не змінюється (тобто Yi = Ỹi), значить на неї ніщо не впливає.

Загальний вплив всіх інших чинників (за виключенням фактору) на варіацію результату по всій сукупності оцінюють за допомогою середньої з групових дисперсій., яка розраховується, як середня арифметична зважена. Вона є узагальнюючою мірою впливу, що характеризує вклад у загальну дисперсію всіх інших чинників за виключенням варіації факторної ознаки і враховує внесок кожної групи у цю величину. Тобто, як в середньому по всій сукупності дія всіх інших чинників впливає на варіацію результату.

σ¯² = Σ σ²i gi/ Σgi

Міжгрупову (характеризую варіацію групових середніх навколо загальної середньої). Вважається, що всі інші причини, що викликають варіацію результатів вимірювання у всіх групах однакові., і кожна група відрізняється лише рівнем радіоактивного забруднення. Тому, якщо при послідовному збільшенні значення рівня радіоактивного забруднення Хi не спостерігається змін у середньому значенні у групах інтенсивності захворювання на хворобу А (Y¯ = Ỹi) , то факторна ознака ніяк не пов’язана з результативною. Міжгрупова дисперсія може виникнути лише під впливом змінності факторної ознаки. Бо якщо змін середніх групових результату нема, то значить, що зміна факторної ознаки не впливає на зміну результативної. Тобто можна говорити про наявність, або відсутність певного зв’язку між ознаками (зв’язок – це коли одна зміна супроводжується іншою зміною).

δ² = Σ (Ỹi - Y¯ )² gi / Σgi

Відомий закон, що пов’язує ці види дисперсій. Логіка цього закону проста: загальна дисперсія, що виникає під дією всіх факторів дорівнює сумі дисперсій, що визначаються і фактором (δ²), і всіма іншими чинниками (σ¯²).

σ² = σ¯² + δ²

На підставі цих видів дисперсії вводять кореляційне відношення:

η² = δ²/ σ²

Тобто визначають яку частку у загальній дисперсії становить міжгрупова.

Інакше кажучи, визначають скільки відсотків загальної варіації обумовлено фактором, що покладений у основу групування, а скільки іншими чинниками. Кореляційне відношення змінюється від 0 (фактор не впливає на результат) до 1 (вплив інших чинників відсутній). Форма залежності ознак (лінійна, нелінійна) залишається невідомою.

Я кажу вам своє остаточне: “може бути”

Г. Спенсер.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]