- •Статистика
- •Тема 1. Предмет і метод статистики.
- •1.1. Статистика як суспільна наука
- •1.2. Предмет статистичної науки.
- •1.3. Поняття, категорії і показники статистичної науки
- •Тема 2. Статистичне спостереження
- •2.1. Поняття про статистичне спостереження, як перший етап статистичного дослідження
- •2.2. Основні організаційні форми статистичного спостереження, його види і способи проведення
- •2.3. Програмно-методологічні питання статистичного спостереження
- •2.4. Помилки статистичного спостереження та заходи щодо їх усунення
- •Тема 3. Зведення і групування статистичних даних.
- •2.1. Суть, організація і техніка статистичного зведення. Методологічні аспекти статистичних групувань.
- •3.2. Основні завдання і види статистичних групувань
- •Виробництво жирних сирів за видами в Україні.
- •У таблиці 3.3. Наведено приклад аналітичного групування.
- •Характеристика залежності прибутку малих
- •3.3. Принципи вибору групувальної ознаки та утворення груп
- •3.4. Статистичні ряди розподілу
- •3.5. Статистичні таблиці.
- •Макет статистичної таблиці
- •Територія та чисельність населення Галичини
- •Тема 4. Статистичні показники
- •4.1. Суть і види статистичних показників
- •4.2. Абсолютні статистичні величини
- •4.3. Відносні величини, їх суть та значення, види та способи розрахунку.
- •4.4. Середня, її суть і види
- •4.5. Середня арифметична проста і зважена.
- •Математичні властивості середньої арифметичної та її розрахунок.
- •4.6. Середня гармонічна та умови її застосування.
- •4.7. Порядкові середні величини.
- •4.8. Поняття варіації та її основні показники.
- •4.9. Математичні властивості дисперсії та способи її обчислення.
- •4.10. Види дисперсій та правило їх додавання.
- •4.11. Дисперсія альтернативної (якісної) ознаки.
- •Тема 5. Аналіз рядів розподілу.
- •5.1. Суть ряду розподілу. Види рядів розподілу, їх частотний аналіз.
- •5.2. Коефіцієнти варіації.
- •Тема 6. Вибірковий метод.
- •6.1. Поняття про вибіркове спостереження та його основні завдання
- •6.2. Методи і способи відбору одиниць у вибіркову сукупність
- •6.3. Знаходження середньої і граничної помилок.
- •Для середньої
- •6.4. Визначення обсягу вибірки.
- •Тема 7. Аналіз таблиць взаємної спряженості.
- •7.1. Таблиці взаємної спряженості.
- •7.2. Методологія проведення аналізу взаємної спряженості.
- •Розділ 8. Статистичні методи аналізу кореляційних звязків .
- •8.1. Види взаємозв’язків між явищами.
- •8.2. Метод аналітичного групування.
- •8.3. Основи кореляційно-регресійного аналізу.
- •Оцінка щільності та перевірка істотності кореляційного зв’язку. Множинна регресія.
- •Тема 9. Аналіз інтенсивності динаміки.
- •9.1. Поняття про ряди динаміки, їх види та правила побудови.
- •Парк тракторів у сільських спілках району
- •9.2. Основні характеристики рядів динаміки.
- •9.3. Середні показники динаміки.
- •Тема 10. Аналіз тенденцій розвитку.
- •Оцінка прискорення (уповільнення) розвитку.
- •10.2. Сезонні коливання, метолди їх вимірювання.
- •10.3. Аналіз тенденцій розвитку.
- •10.4. Ковзна середня.
- •Тема 11. Індекси.
- •11.1. Поняття статистичних індексів, їх види та роль.
- •11.2 Методологічні принципи побудови індексів.
- •11.3. Агрегатний індекс - основна форма загального індексу
- •11.4. Середньозважені індекси.
- •11.5. Індекси середніх величин.
- •Тема 12. Графічний метод.
- •12.1.Поняття статистичного графіка.
- •12.2. Основні елементи статистичних графіків.
- •Класифікація графіків.
- •12.4. Графіки рядів розподілу.
- •12.5. Графіки динаміки.
- •Список осоновної рекомендованої літератури
- •Список додаткової рекомендованої літератури
8.3. Основи кореляційно-регресійного аналізу.
У моделі регресійного аналізу характеристикою кореляційного зв’язку є теоретична лінія регресії , яка являється безперервною і описується функцією:
Y=ƒ(х) яка називаєтьсярівнянням регресії
Залежно від характеру зв’язку використовують:
- лінійні рівняння Y=a+bx, коли із змінноюХознакаУзмінюється більш менш рівномірно;
- нелінійні рівняння, коли зміна взаємопов’язаних ознак відбувається нерівномірно (із прискоренням, уповільненням або із змінним напрямком зв’язку), зокрема:
а) степеневе Y=axb
б)гіперболічне Y=a+b/x
в)параболічне Y=a+bx+cx2 тощо
У лінійному рівнянні параметр bназиваютькоефіцієнтом регресії. Він показує на скільки одиниць у середньому зміниться значення ознаки Y із зміною (збільшенням ) значення ознакиX на одиницю. Він має одиницю виміру результативної ознаки. У випадку прямого зв’язкуbвеличина додатна, а при зворотному – від’ємна.
Параметр a – це вільний член рівняння регресії, тобто це значенняY приx = 0 . Якщох не набуває нульових значень, цей параметр має лише розрахункове призначення. На етапі оцінки лінії регресії визначаються параметри обраного рівнянніметодом найменших квадратів, згідно з яким сума квадратів відхилень емпіричних значеньувід теоретичнихY мінімальна: ∑(y–Y)2→min
Для обчислення параметрів (a,b) треба скласти і розв’язати систему нормальних рівнянь.
звідси
Визначення тісноти зв’язку у кореляційно-регресійному аналізі , як і в методі аналітичного групування, ґрунтується на правилі складання дисперсій. На відміну від аналітичного групування, де оцінками лінії регресії є групові середні результативної ознаки, в кореляційно-регресійному аналізі – теоретичні значення результативної ознаки.Дисперсію теоретичних значень називаютьфакторною і обчислюють:
Як і в аналітичному групуванні, вона характеризує варіацію результативної ознаки у, пов’язану з варіацією факторної ознаких.
Замість середньої з групових дисперсій обчислюють залишкову дисперсію.
Залишкова дисперсія характеризує варіацію результативної ознаки у, не пов’язану з варіацією факторної ознаких.
Мірою тісноти зв’язку в кореляційно-регресійному аналізі є коефіцієнт детермінаціїR2 , аналогічний кореляційному відношенню:
Цей коефіцієнт характеризує ту частину варіації результативної ознаки y, яка відповідає лінійному рівнянню регресії. Коефіцієнт детермінаціїR2, як і кореляційне відношення, приймає значення від 0 до 1 .
При R2 = 0 теоретична дисперсія=0, всі теоретичні значенняYзбігаються з середнім значенняму. Лінійний кореляційний зв’язок міжхтаувідсутній .
При R2 = 1 теоретична дисперсія дорівнює загальні, залишкова дорівнює нулю, емпіричні значенняуі теоретичніYзбігаються, зв’язок між ознаками хта улінійно-функціональний.
Індекс кореляції – це корінь квадратний з коефіцієнта детермінації, він змінюється від 0 до 1 і характеризує тісноту зв’язку, але економічної суті немає.
Оцінка щільності та перевірка істотності кореляційного зв’язку. Множинна регресія.
Поряд з визначенням характеру зв’язку та ефектів впливу факторів хна результатуважливе значення має оцінка щільності зв’язку, тобто оцінка узгодженості варіації взаємопов’язаних ознак. Якщо вплив факторної ознаких на результативну у значний, це виявиться в закономірній зміні значеньузі зміною значеньх, тобто фактор хсвоїм впливом формує варіаціюу. За відсутністю зв’язку варіаціяуне залежить від варіаціїх.
Для оцінки щільності зв’язку статистика використовує низку коефіцієнтів з такими спільними властивостями:
1). За відсутності будь-якого зв’язку значення коефіцієнта наближається до нуля; при функціональному зв’язку – до 1.
2). За наявності кореляційного зв’язку коефіцієнт виражається дробом, який за абсолютною величиною тим більший, чим щільніший зв’язок.
Для вимірювання тісноти зв’язку при лінійній залежності використовують лінійний коефіцієнт кореляції Пірсона:
Однією з модифікацій зазначеної формули є :
або
Чим щільніший зв’язок між ознаками х тау, тим більша алгебраїчна сума добутків відхилень .
Значення r коливаються від –1 до +1 і характеризують не тільки тісноту , але й напрям зв’язку.Додатне значення r означаєпрямий зв’язок між ознаками, від’ємне – зворотний. На практиці застосовують різні модифікації лінійного коефіцієнту кореляції, наприклад таку:
=
Перевірка істотності зв’язку в кореляційно-регресійному аналізі здійснюється таким же чином, як і в моделі аналітичного групування, шляхом порівняння R2 і R21-a( k1, k2 ) (тобто фактичне значення з його критичним значенням, де а – це певний рівень істотності, аk1 і k2 – це число ступенів свободи).
У невеликих за обсягом сукупностяхкоефіцієнт регресіїсхильний довипадкових коливань. Томуслід визначити межі цих коливань,тобто довірчий інтервал коефіцієнта регресії.Середня помилка коефіцієнта регресіїобчислюється за формулою.
Величина граничної помилки залежить від імовірності Р:
Δх=tμx де коефіцієнт довіри при імовірності = 0,954t = 2, а гранична помилка у два рази більше від середньої.
Як правило кореляційно-регресійний аналіз проводиться за не згрупованими даними, але вихідна інформація може бути подана у вигляді аналітичного групування або комбінаційного розподілу.
Множинна регресіядає змогу оцінити зв’язок результативної ознаки з будь-якою факторною при фіксованому значенні інших, включених в регресійну модель. На практиці часто використовують множинні, факторні (багатофакторні лінійні) рівняння регресії, коли на величину результативної ознаки впливають два, три і більше факторів. Також можуть використовуватись рівняння, що приводяться до лінійного виду відповідними перетвореннями, тобто:
Y=b0+b1x1+b2x2+ … +bmxm
Параметр рівняння biназивають частинним коефіцієнтом регресії. Він показує, як у середньому змінюється результативна ознакаyзі зміною факторної ознаки хі на одиницю за умови, що інші факторні ознаки залишаються незмінними.
Для визначення параметрів b0 , b1 … bm треба скласти і розв’язати систему нормальних рівнянь:
.................................................................