Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
malyuzhenko_m_v_statistika_oporni_lekci.doc
Скачиваний:
7
Добавлен:
08.05.2019
Размер:
696.32 Кб
Скачать
  1. Види статистичних показників.

Намагання охарактеризувати певну сукупність шляхом надання інформації про всі її елементи справа безглузда. Сукупності часто бувають настільки великі, що людина просто незмозі “осягнути неосяжне”. Інша річ, якби вдалося всю сукупність описати одним числом (на худий кінець двома-трьома). Але здоровий глузд підказує, що характеризувати множину неоднакових елементів декількома числами якось не зовсім коректно.

Тим не менш з більшою, або меншою правомірністю це робиться завжди і скрізь. Сукупності, що складаються з “різношерстих” елементів описують одним числом. Справа тут в тому, що одним числом характеризують властивості самої сукупності, а не всіх її елементів одразу. Це не одне і теж. Слід зауважити, що такі характеристики достатньо однобічні: одні сторони сукупності висвітлюються добре, інші залишаються в тіні.

В якості таких показників використовують:

  1. Загальний обсяг ознаки.

Одним числом, наприклад, можна охарактеризувати загальний обсяг ознаки по сукупності – тобто її сумарну величину. Цей загальний обсяг ознаки створюють всі елементи сукупності.

ПРИКЛАД. Для сукупності зарплат у певному колективі загальним обсягом ознаки буде фонд заробітної плати цього колективу. Для множини новозбудованих квартир (різних за своєю площею) загальним обсягом ознаки буде загальна площа всіх цих новозабудов.

  1. Мода.

Мода для певної сукупності є значенням, яке домінує у цій сукупності.

Часто трапляються такі сукупності де певна варіанта зустрічається у переважній більшості елементів, а інші варіанти не такі поширені.

ПРИКЛАД. В Криму питома вага родин з різною кількістю дітей має наступну картину (2002р.):

Кількість дітей

0

1

2

3

4

5

6

7

% родин до загальної кількості

10,0

25,0

55,0

8,0

1,3

0,5

0,1

0,1

Як видно з таблиці найбільш поширеною варіантою буде 2 дитини (55% родин від загальної чисельності).

Такі сукупності з певною натяжкою можна характеризувати одним числом – домінуючою (найбільш поширеною) варіантою - модою. Мода є домінантою, але не завжди “контрольним пакетом” . Тому не всі сукупності правомірно характеризувати саме модою.

ПРИКЛАД. Для сукупності А: 1, 2, 2, 5, 6, 10, 15, 100, 150, 200 модою буде 2.

Для сукупності Б: 1, 2, 2, 2, 2, 2, 2, 2, 3, 3, модою теж буде 2.

Крім того модальна варіанта з однаковим успіхом може припадати як на найбільші, так і на найменші значення по сукупності. А тому в якості загальної характеристики мода може як занижувати, так і завищувати дійсний характер сукупності

ПРИКЛАД. Маємо дані про погодинну оплату праці (грн/год) на 12 посад у двох колективах.

Колектив А: 10, 10, 10, 10, 10, 20, 30, 30, 50, 100, 100, 250.

Колектив Б: 10, 10, 20, 20, 25, 25, 30, 70, 70, 70, 70, 90

Якщо охарактеризувати стан погодинної оплати праці в колективі А модою (10), то загальна картина того, як оплачується праця занижується, а у колективі Б (70) – навпаки завищується.

Якщо певна сукупність представлена графічно, як ряд розподілу, то для дискретних ознак моду легко знайти візуально (це буде вершина полігону). У безперервному ряду (на гістограмі) візуально можна виділити лише модальний інтервал (інтервал, що відповідає найвищому стовпчику). Зрозуміло, що мода буде знаходитись десь в межах цього інтервалу.

Коли при розрахунках треба уточнити де саме в цих межах вона знаходиться використовують наступну інтерполяційну формулу:

Мо = хо + h [(fо – f-1) / [(fо – f-1 )+(fо – f+1)]]

де хо – ліва межа модального інтервалу;

h – ширина модального інтервалу;

fо – висота модального стовпчику;

f-1 – висота передмодального стовпчику;

f+1 – висота післямодального стовпчику;

Зрозуміло, що це не дійсне значення моди, а число, яке беруть в якості її оцінки. Логіка цієї формули наступна: якщо схили гістограми навколо модального інтервалу симетричні, то в якості моди беруть значення, що відповідає середині цього інтервалу. Якщо несиметричні, то модальне значення від середини переміщується в сторону більш пологого схилу таким чином, що модальний інтервал поділяється модою в такому ж співвідношенні, як і величини: (fо – f-1) і (fо – f+1.). Іноді така оцінка себе виправдовує.

Основним недоліком моди в якості загальної характеристики сукупності є її “нечутливість” до зміни значень у інших елементів сукупності (звісно, якщо при цьому не з’явиться іншої моди). Тобто сукупність змінилася, потрібно очікувати і зміни показника, що її характеризує. Мода ж залишилась тою самою.

Тим не менш є ситуації, коли зручно користуватись наведеним показником. Мода важлива для виробників товару при встановлення цінової політики (для визначення які ціни є найбільш ліквідними), або для формування товарних запасів (наприклад за найбільш ходовими розмірами взуття, одягу, тари).

3. Медіана.

Медіана – це таке значення ознаки, яке поділяє сукупність на дві рівні частини таким чином, що одна половина елементів мають не перевищують це значення, а друга половина не нижчі за нього.

ПРИКЛАД. Для сукупності чисел: 1, 1, 1, 1, 2, 2, 2, 3, 3, 4, 5, 6, 7, 9, 9. Медіаною буде 3. Перші сім елементів сукупності не перевищують це значення, а останні сім не нижчі за нього.

Для визначення медіани треба саму сукупність впорядкувати - вишикувати у порядку зростання і поділити навпіл. Як це було зроблено у наведеному прикладі. Центральний елемент і буде медіаною. Зрозуміло, що це можливе лише тоді, коли чисельність сукупності непарна. Інакше кажучи: коли чисельність сукупності непарна вона завжди має медіану серед своїх елементів. Якщо чисельність сукупності парна, то центральних елементів у сукупності виявляється два. Тоді в якості медіани беруть середню арифметичну цих двох центральних елементів (нагадуємо, що елементи сукупності при цьому треба попередньо розташувати у зростаючому порядку).

Медіана, в певному розумінні, це значення, що найближче розташоване до всіх елементів сукупності одночасно. Це означає, що сума модулів відхилень варіант сукупності від медіани мінімальна:

Σ |xi – Мe| fi = min

Цю властивість медіани використовують при розташуванні терміналів, заготівельних пунктів, зупинок транспорту і т. і.

ПРИКЛАД. Якщо певна організація планує побудувати низку автозаправок на трасі, що розташовані на відстанях х1, х23, …, хn від міста. То нафтобазу потрібно розташувати на такому відстані від міста, яке є медіаною наведеної сукупності.

Медіану сукупності можна визначити, коли в наявності є графік кумуляти (огіви). Горизонтальна лінія, що проведена через вісь ординат в точці половини частоти, або частки перетинає графік огіви саме там, де на осі абсцис йому відповідає значення медіани.

100 %

50%

0% Ознака

Коли в наявності є гістограма певної сукупності, то встановлення медіани зводиться до наступного:

  • визначають медіанний інтервал (це буде перший інтервал, кумулятивна частота якого перевищує 50% від обсягу сукупності);

  • в середині цього інтервалу визначають медіану за допомогою інтерполяційної формули:

Ме = хо + h [0,5 - S-1) / fме ]

де хо – нижня межа медіанного інтервалу;

h – ширина медіанного інтервалу;

S-1 – кумулятивна частка передмедіанного інтервалу;

fме – частка медіанного інтервалу (не кумулятивна);

Якщо гістограма зображена в координатах не ознака-частка, а ознака-частота, то у формулі будуть незначні заміни: замість 0,5 треба підставити половину обсягу сукупності, в якості S-1 – кумулятивну частоту передмедіанного інтервалу, а fме – частоту медіанного інтервалу.

Логіка формули полягає у наступному: висота стовпчику огіви, що стоїть на певному інтервалі, відповідає значенню ознаки на кінці, а не початку цього інтервалу. А зростання частоти (або частки) в межах цього інтервалу вважають рівномірним. Останнє припущення не обов’язково вірне, але дозволяє хоч якось визначитись в умовах відсутності відповідної інформації. Крім того при невеликих інтервалах групування похибка, що при цьому може виникнути, є незначною.

Частка

100%

50%

0 Ознака

Як не важко здогадатись дві половини сукупності, що розбиті медіаною рівні за своєю чисельністю, але можуть суттєво різнитись загальним обсягом ознаки (сумою варіант по кожній з половин). В деяких випадках це робить медіану нерепрезентативним показником.

ПРИКЛАД. Характеризувати медіаною споживання води будинками у районі міста, коли 55% району складає приватний сектор і 45% висотні будинки призведе до невірної уяви про цей район міста.

Тому інколи медіану доповнюють додатковими характеристиками – квартилями, що поділяють сукупність на чотири рівні частини, або децилями, що поділяють сукупність на десять рівних частин. При цьому суттєво уточнюються дійсний характер сукупності, але одночасно суттєво збільшується кількість необхідних для цього показників. Чого намагались уникнути на початку, до того повернулись.

Медіана більш суттєва характеристика ніж мода, оскільки є “центром” для всієї сукупності. А “центр” визначається загальним виглядом сукупності, хоч і не дозволяє її детально охарактеризувати. Основним недоліком медіани є її “нечутливість” до зміни значень у крайніх елементів сукупності.

Медіана є зручним показником для сукупності де невелика частина елементів значно відрізняються від загальної маси.

ПРИКЛАД. Треба оцінити дохід на родину у шахтарському містечку, де переважна більшість родин отримує менше ніж 1000 грн на місяць. Але в число мешканців входять володарі шахти, які отримують стільки ж, скільки всі інші разом взяті. Зрозуміло, що медіана в якості загальної оцінки доходу родини шахтарського містечка буде достатньо представницькою.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]