Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методичка.doc
Скачиваний:
13
Добавлен:
06.02.2016
Размер:
832.51 Кб
Скачать

Методичні рекомендації до виконання курсової роботи

ВСТУП (2 сторінки)

У вступі обґрунтовують:

  • актуальність теми та стан проблеми;

  • ціль та завдання дослідження;

  • методи дослідження;

  • об'єкт дослідження.

1 Теоретичні основи використання статистичних методів при аналізі показників діяльності підприємств

1.1 Підготовка вихідних аналітичних даних. Засоби їх графічного представлення.

У цьому підрозділі називаються та розкриваються основні етапи статистичного дослідження: збирання первинного статистичного матеріалу (статистичне спостереження); систематизація та групування вихідних даних; аналіз варіації, динаміки, взаємозв'язків. Особливу увагу приділяють питанням використання методу групувань, у тому числі: одержання на основі групувань рядів розподілу; засоби графічного зображення рядів розподілу (полігон, гістограма, кумулята); можливість використання аналітичних групувань для встановлення зв'язків між факторною та результативною ознаками.

1.2. Використання середніх величин та характеристик варіації при аналізі економічних показників.

Даний підрозділ включає розгляд поняття середньої величини, сутності та умов її застосування, огляд видів середньої. Особливу увагу приділяють визначенню арифметичної середньої, у тому числі вказують на умови застосуванння зваженої та незваженої середньої. Надають поняття загальної середньої.

У підрозділі також повинні бути розглянуті питання надання загальної характеристики відмінностей одиниць сукупності за допомогою різних показників варіації, у тому числі розкрита сутність показників, їх недоліки та переваги. Особливу увагу слід приділити поняттю дисперсії та середнього квадратичного відхилення, аналізу відхилень за допомогою коефіцієнтів варіації. У підрозділі повинні бути викладені види дисперсії, їх сутністні характеристики та взаємозв'язок (загальна, факторна і т.д.)

1.3. Статистичні методи вимірювання взаємозв'язків та їх роль у прогнозуванні економічних показників.

У підрозділі необхідно викласти сутність та основний зміст статистичних методів вимірювання взаємозі'язків, у тому числі методу аналітичних угрупувань, однофакторного та багатофакторного регресійно-кореляційного аналізу. Крім того, слід розкрити підходи до відбору із множини досліджуваних факторів тих з них, що мають дійсну значимість з точки зору впливу їх на аналізований показник та необхідність перевірки адекватності регресійної моделі.

У підрозділі викладається можливість застосування даних статистичних методів при аналізі діяльності підприємств та їх роль у прогнозуванні економічних показників.

У висновках по розділу слід узагальнити місце та роль використання статистичних методів при аналізі показників діяльності підприємства, сфери використання різних методів

2 Методологічні основи статистичного аналізу соціально-економічних явищ і процесів

2.1 Методологія статистичних групувань. Оформлення статистичного угрупування у вигляді ряду розподілу та його графічне зображення.

У даному підрозділі викладається методологія статистичних групувань, особлива увага приділяється угрупуванням за кількісною ознакою.

Вказують, що якщо статистична сукупність потребує розподілу на групи за кількісною ознакою, то необхідно визначити величину інтервалу. При цьому розкривають різні підходи до її визначення. Серед методів визначення ширини рівних інтервалів розглядають метод Стреджеса та метод середнього квадратичного відхилення.

За методом Стреджеса ширину кожного інтервалу визначають за формулою

(2.1)

де Хmax, Хmin - найбільше та якнайменше значення ознаки,

m - кількість груп.

Кількість груп визначається або самостійно, або за формулою:

m = 1 + 2,30259 lg n, (2.2)

де n — обсяг сукупності;

m— число інтервалів (груп).

Визначаючи межі інтервалів, ширину h доцільно округлювати.

Надалі, шляхом добавлення величини інтервалу до мінімального значення ознаки у групі («нижньої границі»), одержують групи об'єктів за розміром аналізованої ознаки. Результати такого угрупування надаються у таблиці за формою таблиці 2.1

Таблиця 2.1 - Схема угрупування

№ групи

Межі групи

Кількість одиниць сукупності

в абсолютному вираженні

% до підсумку

….

Разом

100,0

Таким чином, на основі групування одиниць спостереження за однією ознакою та підрахунків числа одиниць в кожній групі одержують ряд розподілу, який складаєь'ться з двох елементів: варіант (окремі значення ознаки, що варіює) та частот.

Ряд розподілу за величиною груповочної ознаки можливо представити графічно у вигляді полігону або гістограми. У підрозділі слід викласти алгоритм побудови полігону та гістограми розподілу.

2.2 Розрахунок середньої та характеристик варіації. Оцінка довірчих меж для середньої.

Розрахунок середньої може відбуватися за згрупованими або незгрупованими даними. У кожному випадку застосовують відповідні розрахункові формули, які необхідно навести у підрозділі.

Вказують, що для характеристики статистичного розподілу недостатньо охарактеризувати лише центр угрупування (середню величину), але необхідно знати також ступінь варіації елементів сукупності. Тому у підрозділі наводять формули розрахунків різних показників варіації (за згрупованими та незгрупованими даними), у тому числі відносних (коефіцієнтів варіації).

Окремо визначається значення для статистичного аналізу таких показників варіації, як дисперсія та середнє квадратичне відхилення, у тому числі надаються різні формули розрахунку дисперсії (за її змістом, відлік від умовного нуля, формула різниці квдаратів).

Враховуючи, що аналіз показників буде проводитися за вибірковими даними, визначають поняття довірчих меж показника, у тому числі наводять відповідні формули. Так межі довірчого інтервалу для середньої визначаються на основі точкової оцінки та граничної помилки вибірки . Наприклад, для факторного показника визначення довірчих меж ввідбувається наступним чином:

; (2.3)

де  — стандартна (середня) помилка вибірки (необхідно надати її поняття);

t — квантиль розподілу ймовірностей (коефіцієнт довіри, що відповідає ймовірності ).

Величину стандартної помилки можна визначити за формулою для відбору:

повторного

(2.4)

безповторного

(2.5)

де n - обсяг вибірки,

D – частка вибіркової сукупності в генеральній

2.3 Методологія побудови та аналізу моделі парної регресії

Оскільки статистичні явища пов'язані між собою та обумовлюють одне одне, то необхідні спеціальні статистичні методи аналізу, які дозволяють вивчити форму, близькість та інші параметри статистичних взаємозв'язків. Одним з таких методів є кореляційний аналіз. На відміну від функціональних залежностей, при яких зміна будь-якої ознаки – функції – повністю та однозначно визначається зміною іншої ознаки-аргументу, при кореляційних формах зв'язку змінам одного або декількох факторів відповідає зміна середнього значення результативної ознаки. При цьому фактори, що розглядаються визначають результативну ознаку повністю.

За даними курсової роботи на рівень продуктивності праці оказують вплив не тільки показники фондомісткості, стажу та інші, но й багато інших: технічний рівень виробництва, характер організації праці і т.д. У тому випадку, якщо досліджується зв'язок між одним фактором та однією ознакою, зв'язок має назву однофакторного та кореляція є парною. Якщо досліджується зв'язок між декількома факторами та однією ознакою, зв'язок має назву багатофакторного та кореляція є множинною.

На першому етапі дослідження взаємозв'язків між факторами необхідно з множини факторів, які сформовані шляхом інтуітивних міркувань, відібрати ті, які дійсно вагомі з точки зору їхнього впливу на показник. Рішення завдань такого виду здійснюється за допомогою дисперсійного аналізу – однофакторного, якщо перевіряється істотність впливу того чи іншого фактора, або багатофакторного у випадку вивчення впливу на нього комбінації факторів.

Для вивчення зв'язку між явищами та їх ознакам будують кореляційну таблицю та аналітичне угрупування.

Кореляційна таблиця – це спеціальная комбінаційна таблиця, в якій наведено групування за двома пов'язаними ознаками: факторною та результативною. Концентрація частот біля діагоналей матриці свідчить про наявність кореляційного зв'язку між ознаками.

Аналітичне угрупування дозволяє вивчити взаємозв'язок факторної та результативної ознаки. Основні етапи проведення такого угрупування:

1. Обгрунтування факторної та результативної ознаки.

2. Підрахунок кількості одиниць в кожній з груп, що утворені.

3. Визначення обсягу ознак, що варіюють, в границях створених груп.

4. Розрахунок середніх значень результативної ознаки.

Результати групування оформлюються у таблиці (див. табл. 2.2).

Кількість груп можна визначити за формулою Стреджесса, методом «сігм» або прийняти самостійно.

Таблиця 2.2- Схема аналітичного угрупування

Межі угрупування по факторній ознаці, хj

Кількість одиниць сукупності,

fi

Середнє значення результативної ознаки у групі j, уj

f1

у1

f2

у2

::

::

Разом

fi

х

Відомо, що якщо сукупність розбито на групи за певною ознакою х, то для будь-якої іншої ознаки у можна обчислити середню як у цілому по сукупності, так і в кожній групі. Центром розподілу сукупності в цілому є загальна середня

або або(2.6)

центром розподілу в j-й групі — групова середня

або (2.7)

де fi – частота і-го елементу сукупності,

nj = fj - обсяг j-ї групи,

n - обсяг сукупності

Для перевірки істотності зв'язку можна використовувати характеристику F-критерій (критерій Фішера), який визначається за формулою:

, (2.8)

де , - відповідно факторна (міжгрупова) та залишкова дисперсія

k1, k2 - число ступенів свободи відповідно факторної та залишкової дисперсії

= m - 1;

= n – m (2.9)

де n, m - відповідно число одиниць сукупності та кількість груп.

(2.10)

(2.11)

Тобто

, (2.12)

де

(2.13)

(2.14)

де уij – значення показника у, якій відповідає і-му елементу в j–й групі

- середнє значення показника у в j–й групі

Надалі одержане розрахункове значення F порівнюється за табличним (критичним), для визначеного рівня істотності  (звичайно 0,05 або 0,01) та ступенів свободи k1 та k2 .

Якщо Fрозр ≤ F табл, то вплив відповідного фактора визнається неістотним. Якщо, навпаки, Fрозр ≥ Fтабл – вплив істотний.

Сформований у результаті процедури, що описана, набір істотних факторів використовується на наступних етапах дослідження: при побудові відповідних парних моделей регресії або рівняння множинної регресії.

Приклад визначення істотності впливу показника наведено у додатку 4.

Надалі проведемо дослідження зв'язку між одним фактором та однією ознакою, тобто аналіз моделі парної регресії. Рівняня регресії будемо досліджувати у вигляді Y=| (де Y — розрахунковий (теоретичний) рівень результативної ознаки).

Розрахунок коефіцієнтів рівняння можна здійснити за формулами

(2.15)

Необхідно побудувати кореляційне поле за емпіричними (вихідними) даними та «наложити» на нього лінію регресію, що побудована за визначенним рівнянням регресії, що дозволяє зробити попередні висновки про відповідність рівняння вихідним даним.

Вплив та напрямок однофакторного зв'язку характеризує лінійний коефіцієнт кореляції, який можна визначити за формулою

(2.16)

Зауважимо, що за формулою лінійного коефіцієнту розраховуються також парні коефіцієнти кореляції, які характеризують тісноту зв'язку між парами змінних, що розглядаються (без урахування їх взаємодії з іншими змінними).

Показником тісноти зв'язку між результативною та факторною ознакою є коефіцієнт детермінації (множинної кореляції)

(2.17)

де — загальна дисперсія ознаки y;

- факторна дисперсія;

σ - залишкова дисперсія

(2.18)

(2.19)

(2.20)

де Y, у|в| - відповідно розрахункові та фактичні значення результативної ознаки.

Тобто

(2.21)

Якщо , це свідчить про лінійний зв'зок міжх та у.

Для встановлення адекватності моделі можна також використовувати F-критерій Фішера

(2.22)

Тобто у випадку парної кореляції для лінійної моделі розрахункове значення F можна знайти за формулою

(2.23)

Як і в методі аналітичних групувань, надалі одержане розрахункове значення F порівнюється за табличним (критичним) для визначеного рівня істотності  (звичайно 0,05 або 0,01), тобто з Fα(1, n-2)

Якщо Fрозр ≤ F табл, то вплив відповідного фактора визнається неістотним. Якщо, навпаки, Fрозр ≥ Fтабл – вплив істотний.

Необхідно також здійснювати оцінку статистичної значущості коефіцієнтів b0 та b1. Така оцінка здійснюється за допомогою t-критерію Ст'юдента. При цьому визначають розрахункові (фактичні) значення:

- для параметру b1

(2.24)

- для параметру b0

(2.25)

де S(b) – середньоквадратичне відхилення відповідного параметру

(2.26)

(2.27)

де S2(b) – дисперсія відповідного параметру

Розрахункові значення t-критерію Ст'юдента порівнюють з табличними, які обираються в залежності від рівня істотності  та числа ступенів свободи

n -m -1 (де n – обсяг вибірки, m - кількість факторних ознак, що включено до моделі, тобто для однофакторної моделі число ступенів свободи дорівнює n-2). Критичні значення можна визначити за додатком 3 (наприклад, для одностороньої критичної області t0,05;14=1,76). Параметр визнається істотним, якщо розрахункове значення більше табличного.

За відповідними розрахунками можливо також одержати прогноз довірчого інтервалу для значення yn+1 та для його математичного очікування Myn+1.

Для значення yn+1 границі довірчих меж визначаються за формулою

(2.28)

Для значення Myn+1 границі довірчих меж визначаються за формулою

, (2.29)

де S2- незсунена оцінка для залишкової вибіркової дисперсії

, (2.30)

2.4. Методологія множинного регресійного аналізу.

Економічні явища залежать від великої кількості факторів. Тому на практиці часто використовують рівняння множинної|факторів| регресії, коли на величину результативної ознаки впливають два і більш фактори.

Одна з умов кореляційного аналізу - однорідність досліджуваної інформації. Критерієм однорідності інформації служать коефіцієнти варіації, які розраховуються по кожному факторному й результативному показнику.

Коефіцієнт варіації показує відносну міру відхилення окремих значень від середньоарифметичної.

Після|потім| відбору факторів і оцінки початкової|вихідної| інформації важливим|поважним| завданням|задачею| є|з'являється| моделювання зв'язку між факторним|факторами| і результативним показником. На практиці найчастіше використовують багатофакторні лінійні моделі |факторів| і моделі, які приводяться|наводять| до лінійного вигляду|виду| відповідними перетвореннями, тобто|цебто|

(2.31)

Рішення задачі багатофакторного кореляційного аналізу передбачає визначення парних коефіцієнтів кореляції, які характеризують тісноту зв'язку між парами змінних, що розглядаються (без врахування їхньої взаємодії з іншими змінними). Парні коєфіцієнти кореляції можна розрахувати за формулою лінійного коефіцієнту (див. формулу 2.16).

Показником тісноти зв'язку між результативною та факторними ознаками є коефіцієнт множинної кореляції. У випадку лінійного двохфакторного зв'язку він може бути розрахован за формулою

(2.32)

де r – лінійні (парні) коефіцієнти кореляції.

Значення цього коефіцієнту змінюється від 0 до 1. Коефіцієнт R2 має назву множинного коефіцієнту детермінації та показує, яка частка варіації результативної ознаки обумовлена впливом факторів, що враховано.

Наступним етапом кореляційно регресійного аналізу є побудова рівняння множинної регресії та визначення невідомих параметрів b0, b1 ,b2 ,….,bm обраноїх функції. Наприклад, рівняння двохфакторної лінійної регресії має вигляд

(2.33)

де Y - розрахункові значення результативної ознаки,

хі – значення факторних ознак,

b0, b1 ,b2параметри рівняння регресії

Для визначення параметрів , ... необхідно скласти і вирішити систему нормальних рівнянь. При двох факторах система рівнянь набуває вигляду

(2.34)

Рівняння лінійної множинної регресії можна також одержати, використовуючи програму «Microsoft Excel – Статистические функции – ЛИНЕЙН». Функція ЛИНЕЙН повертає масив {bm; bm-1; ... ; b1;b}, де m - кількість факторних ознак, що включено до моделі

Синтаксис функції ЛИНЕЙН

ЛИНЕЙН(відомі_значення_y;відомі_значення_x;конст;статистика)

Відомі_значення_y - це безліч значень y, що уже відомі для співвідношення y = b1x1 + b2x2 + ... + b

■ Якщо масив відомі_значення y має один стовпець, то кожний стовпець масиву відомі значення x інтерпретується як окрема змінна.

■ Якщо масив відомі значення y має один рядок, то кожний рядок масиву відомі значення x інтерпретується як окрема змінна.

Відомі значення x - це необов'язкова множина значень x, що уже відомі для співвідношення y = b1x1 + b2x2 + ... + b

■ Масив відомі значення x може містити одне або декілька множин змінних. Якщо використовується тільки одна змінна, то відомі значення y і відомі значення x можуть бути масивами будь-якої форми за умови, що вони мають однакову розмірність. Якщо використовується більш однієї змінної, то відомі значення y повинні бути вектором (тобто інтервалом висотою в один рядок або шириною в один стовпець).

■ Якщо відомі значення x опущені, то передбачається, що це масив {1;2;3;... } такого ж розміру як і відомі значення y.

Конст - це логічне значення, що вказує, чи потрібно, щоб константа b дорівнювала 0.

■ Якщо конст має значення ИСТИНА або опущена, то b обчислюється звичайним способом.

■ Якщо конст має значення ЛОЖЬ, то b покладається рівним 0 і значення bі підбираються так, щоб виконувалося співвідношення y = bx.

Статистика - це логічне значення, що вказує, чи потрібно повернути додаткову статистику по регресії.

■ Якщо статистика має значення ЛОЖЬ або опущена, то функція ЛИНЕЙН повертає тільки коефіцієнти bі і постійну b.

У цьому випадку регресійна статистика повертається за формою таблиці 2.3

Таблиця 2.3 – Регресійна статистика

bm

bm-1

.

b2

b1

b

  • Якщо статистика має значення ИСТИНА, то функція ЛИНЕЙН повертає додаткову регресійну статистику (див. табл. 2.4)

Таблиця 2.4 – Додаткова регресійна статистика

bm

bm-1

.

b2

b1

b

….

R2

- стандартна помилка для оцінки у

F-критерій

df (ступені свободи)

Наступним етапом є розрахунок та перевірка статистичної значущості коефіцієнту детермінації, що відповідає визначенному теоретичному рівнянню, та значущості коефіцієнтів регресії.

Коефіцієнт детермінації, який надає оцінку загальної якості моделі, розраховується за формулою

(2.35)

де

Перевірку статистичної істотності коефіцієнту детермінації можна здійснити за допомогою критерію Фішера, розрахункове значення якого визначається за формулою

(2.36)

де n – обсяг вибірки,

m - кількість факторних ознак, що включено до моделі (кількість змінних у рівнянні)

Одержане розрахункове значення F порівнюється з табличним для визначеного рівня істотності , тобто з Fα (m; n -m -1). Якщо Fрозр ≥ Fтабл – коефіцієнт детермінації статистично значущ.

Оцінка істотності коефіцієнтів регресії здійснюється за допомогою t-критерію Ст'юдента. При цьому визначають розрахункові (фактичні) значення

(2.37)

де - оцінка стандартної помилки коефіцієнту

Розрахункові значення t-критерію Ст'юдента порівнюють з табличними, які обираються в залежності від рівня істотності  та числа ступенів свободи

n-m-1. Параметр визначається істотним, якщо розрахункове значення перевищує табличне.