Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
malyuzhenko_m_v_statistika_oporni_lekci.doc
Скачиваний:
7
Добавлен:
08.05.2019
Размер:
696.32 Кб
Скачать
  1. Середнє квадратичне відхилення

Дисперсія хоч і є достатньо зручною характеристикою того, як взагалі елементи сукупності відрізняються від свого середнього рівня, але погано сприймається за своїм змістом. Дійсно якось важко второпати, що лінійну величину (відхилення від середнього рівня) потрібно характеризувати квадратичною. Тому часто застосовують не саму дисперсію, а корінь квадратний з неї. Ця величина носить назву середнє квадратичне відхилення.

σ = √ σ ²

Середнє лінійне та середнє квадратичне відхилення за змістом ідентичні. Це іменовані числа. За величиною вони майже ніколи не співпадають. Більш зрозумілим є середнє лінійне відхилення, але більш поширеним у статистиці є середнє квадратичне відхилення. Все як у житті – штучне і не зовсім зрозуміле часто витісняє логічне завдяки зручності користування.

5. Дисперсія альтернативної ознаки.

σ ² = Σ(хі - х‾)² / n, хі = 0, 1

х‾ = 1+1+1…..+1+0+0+….+0 / N = p/N (у відносних одиницях - р)

σ ² = [(1-р) ²р + (0-р) ²q] / N

σ ² = р q

Легко встановити, що максимальне значення при цьому сягає 0,25 при р = q = 0,5

3.2. Відносні характеристики:

Коефіцієнт варіації.

  • Лінійний : Vd = d / х‾

  • Квадратичний: Vσ = σ / х‾

  • Осціляції: VR = R / х‾

Коефіцієнт варіації є критерієм однорідності сукупності. В статистиці однорідною вважають таку сукупність, для якої квадратичний коефіцієнт варіації не перевищує 33% (якщо це не оговорюється окремо).

3.3. Умови однорідності сукупності, поділеною за альтернативною ознакою.

Традиційно сукупність вважається однорідною, коли її коефіцієнт варіації не перевищує 33%:

σ / х‾ < 33%.

Підставив значення σ і х‾ для альтернативних ознак отримаємо наступне:

рq p < 0,33. pq / p² = 0,11 q / p = 0,11 q = 0,11 p

Таким чином сукупність, що поділена за альтернативною ознакою буде вважатися однорідною, коли одна якісна частина на порядок перевищує іншу. Причому ця умова симетрична: наприклад, якщо сукупність поділена на частини за ознакою брак, то однорідність може бути у розумінні , що майже вся сукупність бракована, або майже вся сукупність якісна.

(Лекція 5)

Тема 5. Характеристики розподілу.

Зазвичай істина лежить посередині.

І в більшості випадків без пам’ятника.

С. Є. Лець

1. Форма розподілу.

Незважаючи на свою універсальність середні величини не завжди є достатньо інформативними, щодо сукупності:

ПРИКЛАД. Твердження, що середня температура у хворих в палаті становить 36,6° може означати що:

  • або всі здорові,

  • або у одних пацієнтів жар, а інші вже померли і мають температуру повітря в палаті.

Коли вимоги до аналізу сукупності достатньо високі, то навіть доповнення середніх величин загальними характеристиками варіації (такими, як розмах, дисперсія та іншими) виявляється недостатнім.

Найбільш вичерпним описанням сукупності буде таке, коли наводиться “вагомість” кожної варіанти. Інакше кажучи встановлюється яких значень більше (і у скільки разів) ніж інших в межах варіаційного розмаху. Саме таку інформацію і надають за допомогою полігона або гістограми. Висота стовпчиків гістограми і буде давати уяву про кількісний розподіл сукупності в межах відповідних значень ознаки. Ламана, що проходить через середини верхівок стовпчиків гістограми утворює певну характерну форму. Зменшуючи інтервали групувань (ширину стовпчиків) ця форма набуває більш “впевненого” вигляду, який і відбиває загальну картину сукупності, що досліджується. Це і називається встановити форму розподілу. Таким чином форма розподілу дає загальну уяву про те які значення і в якій кількості зустрічаються у сукупності.

Слід зауважити, що форма розподілу є характеристикою сукупності якоюсь одною ознакою і для тієї ж самої сукупності елементів форми розподілу за іншими ознаками можуть суттєво різнитись.

ПРИКЛАД- одне і теж саме населення по різному буде розподілятись за віком, зростом, доходом, національністю, інтелектом.

Зрозуміло, що чим меншим буде інтервал групування при побудові гістограми, тим детальніше буде передаватись форма розподілу статистичної сукупності.

Форми гістограми, або полігону є достатньо інформативними щодо властивостей сукупності: вони дозволяють спостерігати варіаційний розмах ознаки, співвідношення частот різних варіант, навіть дозволяють визначити середнє значення, моду, медіану, дисперсію, а також розрахувати багато інших кількісних характеристик. Творець кібернетики Н. Вінер називав статистику наукою про розподіли.

ПРИКЛАД – розподіл безробітних за віком (Київ 2000р.).

Вікова група

До 20

20-25

25-30

30 -35

35 -40

40 -45

45-50

50-55

55-60

%

8

19

22

17

12

8

6

4

4

20

15

10

5

20 25 30 35 40 45 50 55 60

Форма розподілу відбиває певний стан статистичної сукупності, який формується під впливом внутрішніх факторів (тобто властивостей самих елементів), та зовнішніх (умов існування сукупності). Спільна дія цих чинників, в загальному випадку, і визначає як межі, в яких змінюється ознака (діапазон), так і кількісний розподіл відповідних значень(висоту стовпчиків гістограми) .

Для подальших висновків реальну форму розподілу (“гістограму” або “полігон”) замінюють (апроксимують) підходящим аналітичним виразом, що дозволяє залучити до аналізу готовий апарат математичної статистики. Тобто реальний розподіл моделюємо ідеальним.

Теоретичних законів (стандартних форм) розподілу, що використовують у статистиці, налічується близько тридцяти. Як це не дивно, безліч різних за своєю природою статистичних сукупностей проявляють настільки схожі форми гістограм, що в більшості випадків всі їх можна звести до цих трьох десятків теоретичних законів. Цього достатньо для описання різних за своєю природою сукупностей: від розподілу галактик у всесвіті до розподілу хабарів у окремому відомстві. Мабуть Піфагор не помилявся, коли казав, що світом правлять числа.

Вигляд деяких теоретичних розподілів наведено нижче:

Рівномірний

Експоненціальний

Хі-квадрат

Сімпсона

Накагамі

Арксинуса

Гамма-розподіл

2. Нормальний розподіл

В багатьох, різних за своєю природою, сукупностях можна спостерігати наявність певного середнього рівня ознаки навколо якого групується більшість елементів сукупності. Причому чим більше ті, чи інші варіанти відрізняються від цього середнього рівня, тим менше вони зустрічаються. Детальні дослідження встановили, що у більшості випадків ознака у таких сукупностях розподілена за характерною симетричною “дзвоноподібною” формою. Таку форму назвали нормальним розподілом (інша назва – розподіл Гауса). Поняття нормального розподілу покладено в основу багатьох методів статистики.

ПРИКЛАД – вага, зріст людини, характеристики промислових виробів (розмір, вага, опір, пружність, ресурс). Всі ці ознаки розподілені за нормальним розподілом.

Використання напрацювань математичної статистики дозволяє залучати готові підходи для кількісного аналізу закономірностей суспільних явищ.

ПРИКЛАД – якщо встановлено, що розподіл певної ознаки по сукупності підкоряється нормальному закону, то можна оцінити долю елементів сукупності, що відрізняються від середнього значення на величину кратну СКВ.

σ: =0,68269

2 σ = 0,95450

3 σ = 0,99730.

Іншими словами, при розподілі Гауса 68% елементів сукупності відрізняються від середнього рівня на величину не більшу за σ, а 95% елементів відрізняються від того ж середнього рівня на величину не більшу за 2σ. Для інших розподілів ці співвідношення можуть бути іншими.

3. Характеристики форми розподілу

Аналіз закономірностей розподілу дозволяє кількісно оцінити ступень однорідності сукупності і обрати ті чи інші методи статистичного дослідження. В однорідних сукупностях розподіли одновершинні (одномодальні), оскільки вплив різних факторів призводить до виділення певної домінуючої варіанти у сукупності біля якої групуються всі інші. Багатовершинність (полімодальність) свідчить про неоднорідний склад сукупності. Описати багатовершинні розподіли теоретично важко. У такому разі необхідно перегрупувати дані, відокремити однорідні групи.

Одновершинний розподіл може бути симетричним та асиметричним (коли вершина зміщена). Асиметрія буває лівостороння та правостороння. Напрям асиметрії протилежний напряму зміщення вершини (за правилом хвоста), Асиметрія виникає під впливом домінуючої причини, яка обмежує варіацію в одному напрямку.

У суспільних процесах це може відбуватись навмисно.

Симетричний розподіл: хˉ = Мо = Ме

Правостороння асиметрія: хˉ >Ме>Мо

Лівостороння асиметрія: хˉ <Ме<Мо.

Чим більша асиметрія тим більше відхилення хˉ-Мо. Тому за міру асиметрії іноді беруть коефіцієнт скошеності (відносне відхилення): хˉ-Мо.

А = -------

σ

Правостороння: А>0, лівостороння: А<0.

Теоретично відносне відхилення не має меж, а на практиці не перевищує одиниці.

ПРИКЛАД –Рівень забезпеченості житловою площею міського населення України, доходи населення

Строге оцінювання характеру розподілу базується на, так званих, центральних моментах розподілу. Це поняття запозичене з механіки. Моменти у механіці визначають ефективність дії різних сил для надання тілу обертального руху. Моменти в статистиці характеризують загальний вплив зовнішніх і внутрішніх чинників, які формують величину і розподіл варіант по сукупності.

Математично момент – це середня арифметична r-того ступеня відхилення індивідуальних значень ознаки від середньої.

σ ² = [ Σ(хі - х‾)ʳ ] / n

Момент 2-го порядку – це дисперсія.

Момент 3-го порядку – це коефіцієнт асиметрії

Момент 4 -го порядку – це ексцес.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]