Тема 5 аналіз рядів розподілу методичні вказівки
Ряд розподілу характеризує склад і структуру сукупності за певною ознакою. Він утворюється з двох елементів: варіант — значень групувальної ознаки xj та частот (часток) fj. Співвідношенням варіант і частот подається закономірність розподілу.
Залежно від статистичної природи варіант ряди розподілу поділяються на атрибутивні та варіаційні. Частотними характеристиками будь-якого ряду є абсолютна чисельність j-ї групи — частота fj, відносна частота j-ї групи — частка dj, для варіаційних рядів також кумулятивна частота — частка .
Очевидно, що, а , або 100 %. Кумулятивні характеристики визначаються послідовним об’єднанням груп і підсумовуванням відповідних їм частот (часток).
Аналіз закономірностей розподілу ґрунтується на характеристиках: а) центру розподілу; б) варіації; в) форми розподілу (асиметрії, концентрації).
До характеристик центру розподілу відносять середню, моду та медіану. Середня величина характеризує типовий рівень ознаки в сукупності. За даними ряду розподілу середня обчислюється як арифметична зважена, де вагами є частоти fj або частки dj:
, ,
де j — номер групи; m — кількість груп.
В інтервальних рядах, припускаючи рівномірний розподіл елементів сукупності в межах j-го інтервалу, за варіанту беруть середину інтервалу. При цьому ширину відкритого інтервалу умовно вважають такою самою, як і сусіднього закритого інтервалу.
Модою (Мо) називають найпоширеніше значення ознаки. У дискретному ряді її визначають візуально за найбільшою частотою (часткою). В інтервальному ряді за таким принципом знаходять модальний інтервал, всередині якого конкретне модальне значення обчислюють за інтерполяційною формулою:
де та h — відповідно нижня межа та ширина модального інтервалу; — частота (частка) відповідно модального, передмодального та післямодального інтервалу.
Медіана (Ме) — це таке значення ознаки, що варіює, яке припадає на середину впорядкованого ряду, поділяючи його на дві рівні за обсягом частини. Для визначення медіани використовують кумулятивні частоти або частки . У дискретному ряді медіаною є значення ознаки, кумулятивна частота якої перевищує половину обсягу сукупності, тобто (для кумулятивної частки ). В інтервальному ряді за цим принципом визначають медіанний інтервал, а значення медіани всередині інтервалу, як і значення моди, обчислюють за інтерполяційною формулою:
,
де та h — відповідно нижня межа та ширина медіанного інтервалу; — частота медіанного інтервалу; — кумулятивна частота передмедіанного інтервалу.
У симетричному розподілі всі три зазначені характеристики центра розподілу однакові: , у помірно асиметричному відстань медіани до середньої втричі менша за відстань середньої до моди, тобто .
В одних сукупностях індивідуальні значення ознаки щільно групуються навколо центра розподілу, в інших — значно відхиляються, варіюють. Чим менша варіація, тим однорідніша сукупність, більш надійні й типові характеристики центра розподілу, передусім середня величина. Для вимірювання та оцінювання варіації використовують абсолютні та відносні характеристики.
Найпростішою з таких характеристик є варіаційний розмах R, що характеризує діапазон варіації і визначається як різниця між максимальним і мінімальним значеннями ознаки:
R = .
Більшість характеристик варіації визначають, усереднюючи відхилення індивідуальних значень ознаки від центра розподілу, поданого середньою величиною. Оскільки алгебраїчна сума відхилень дорівнює нулю (), то усереднюються модулі або квадрати відхилень. Середній з модулів відхилень називають середнім лінійним відхиленням , середній квадрат відхилень — дисперсією , корінь квадратний з дисперсії — середнім квадратичним відхиленням :
; .
За первинними, незгрупованими даними наведені характеристики обчислюють за принципом незваженої середньої:
або .
Середнє лінійне та середнє квадратичне відхилення — іменовані числа (в одиницях вимірювання ознаки), за змістом вони ідентичні, проте згідно з математичними властивостями > .
Дисперсію для ознак метричної шкали обчислюють за формулою:
,
де — середній квадрат значень ознаки; — квадрат середньої величини.
Дисперсія альтернативної ознаки обчислюється як добуток часток: , де — частка елементів сукупності, яким притаманна ознака, — частка решти елементів .
Порівнюючи варіації різних ознак або однієї ознаки в різних сукупностях, використовують коефіцієнти варіації V. Вони визначаються відношенням абсолютних іменованих характеристик варіації (,, R) до центра розподілу і найчастіше виражаються у процентах. Отже, маємо коефіцієнти варіації:
лінійний ;
квадратичний ;
осциляції .
Аналіз закономірностей розподілу передбачає оцінку ступеня однорідності сукупності та симетричності розподілу. Критерієм однорідності сукупності вважається квадратичний коефіцієнт варіації, значення якого в симетричному розподілі становить .
Найпростішою мірою асиметричності розподілу є відхилення між характеристиками центра розподілу. Чим помітніша асиметрія, тим більше відхилення . Стандартизоване відхилення називають коефіцієнтом асиметрії . У разі правосторонньої асиметрії А > 0, у разі лівосторонньої — А < 0.
Оцінка нерівномірності розподілу між окремими складовими сукупності (наприклад, розподілу майна чи доходів між окремими групами населення) ґрунтується на порівнянні часток двох розподілів — за кількістю елементів сукупності і обсягом значень ознаки Якщо розподіл значень ознаки в сукупності рівномірний, то = , а відхилення часток свідчать про певну неоднорідність, яка вимірюється коефіцієнтами:
локалізації концентрації
Lj , .
Коефіцієнт локалізації визначається для кожної складової сукупності, коефіцієнт концентрації є узагальнюючою для сукупності характеристикою відхилення розподілу від рівномірного.
Порівняння структур на основі відхилень часток — ефективний спосіб вимірювання диференціації сукупності за даними інтервальних рядів з нерівними інтервалами та атрибутивних рядів. У разі рівномірного розподілу всі значення Lj = 1, а К = 0. Чим помітніша диференціація, тим більше значення цих коефіцієнтів відхиляються, відповідно, від 1 та 0.
Структура будь-якої статистичної сукупності динамічна. Зміна часток окремих складових сукупності свідчить про структурні зрушення. Мірою інтенсивності структурних зрушень (у процентних пунктах — п. п.) є середнє лінійне або середнє квадратичне відхилення часток:
; ,
де та — частки відповідно базисного та поточного періодів; m — кількість складових сукупності.
[1, с. 58—74; 2, с. 64—78; 3, с. 153—163; 184—191; 4, с. 93—108]
Кумулятивна частота (частка) характеризує обсяг сукупності зі значеннями варіант, які не перевищують xj.
Абсолютні міри варіації: варіаційний розмах, середнє лінійне та середнє квадратичне відхилення, дисперсії.
Відносні міри варіації: коефіцієнти варіації, локалізації, концентрації.
Однорідна сукупність — це така сукупність, елементи якої мають спільні властивості і належать до одного типу. В однорідних сукупностях розподіли одновершинні (одномодальні).
-
Як виявляється закономірність розподілу?
-
Назвіть частотні характеристики розподілу і їх особливості.
-
Поясніть сутність характеристик центра розподілу. Як вони співвідносяться?
-
Середня величина ознаки у двох сукупностях однакова. Чи може бути різною варіація цієї ознаки?
-
Поясніть сутність середнього лінійного і середнього квадратичного відхилень. Чи ідентичні вони за змістом і чи однакові за значенням?
-
Як порівняти варіацію різних ознак або однієї ознаки в різних сукупностях?
-
На яких засадах ґрунтується оцінка нерівномірності розподілу? Поясніть зміст і особливості розрахунку коефіцієнтів локалізації та концентрації.
-
Які характеристики варіації застосовують для оцінювання інтенсивності структурних зрушень?