Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
матан 3 курс 2013 / открытое занятие.doc
Скачиваний:
40
Добавлен:
13.04.2015
Размер:
1.02 Mб
Скачать
    1. Збирання інформації студентами: обговорення – аналізування – формування висновків.

Встановлення статистичних закономірностей, властивих масовим випадковим явищам, засновано на вивченні статистичних даних – відомостей про те, які значення прийняла в результаті спостережень випадкова величина Х. В даному випадку в якості випадкової величини Х ми розглядаємо регіональну популярність запиту «В контакті» в пошуковій системі Яндекс.

Як приклад, розглянемо рівень регіональної популярності запиту в Україні. Для цього, розглянемо таблицю 1, в якій представлені дані про регіональну популярність сайту «В контакті» в містах України(отримані дані в %). Різні значення випадкової величини Х називаються варіантами.

Для зручності вивчення даного статистичного матеріалу по-перше упорядкуємо (по зростанню чи спаданню) варіанти ряду:

По-друге, проведемо групування варіантів (розіб’ємо їх на інтервали).

Число інтервалів т треба брати не дуже великим, щоб після групування ряд не був громіздким, і не дуже малим, щоб не утратити особливості розподілу признака.

Число інтервалів, що рекомендуються , а ширина інтервалу .

В нашому прикладі , m = 5.

За початок першого інтервалу беруть , тобто

Отримаємо наступний згрупований ряд.

№ інтервалу

і

Регіональна популярність запиту

«В контакті»

в пошуковій системі «Яндекс» (у %)

Частота (кількість запитів в інтервалі)

пі

Частість (частина запитів в інтервалі)

Накопичена частота

Накопичена частість

80,79-87,79

1

0,05

1

0,05

87,79-94,79

2

0,1

3

0,15

94,79-101,79

7

0,35

10

0,5

101,79-108,79

3

0,15

13

0,65

108,79-115,79

7

0,35

20

1,00

20

1,00

Числа, що показують кількість варіантів даного інтервалу, називаються частотами (пі), а відношення їх до загального числа спостережень – частостями, тобто . Частоти і частості називаються вагами варіаційного ряду.

Варіаційним рядом називається розташований в порядку зростання чи спадання ряд варіантів з відповідними їм вагами. Накопичена частота показує кількість варіантів із значенням ознаки, меншим фіксованого значення х. Відношення накопиченої частоти до загального числа спостережень п називається накопиченою частістю . Для завдання варіаційного ряду достатньо вказати варіанти і відповідні їх частоти або накопичені частоти.

Варіаційний ряд називається дискретним, якщо будь-які його варіанти відрізняються на постійну величину; неперервним – якщо варіанти можуть відрізнятися один від одного на скільки завгодно малу величину (в таблиці – неперервний варіаційний ряд).

Для графічного розподілу варіаційних рядів використовують полігон, гістограму, кумулятивну криву.

Полігон застосовують для зображення дискретного варіаційного ряду і представляє собою ломану, в якій кінці відрізків прямої мають координати (хі,пі).

Гістограма служить тільки для зображення неперервних варіаційних рядів і представляє собою фігуру, складену з прямокутників. Довжина кожного прямокутника – величина відповідного інтервалу, висота – частота варіантів відповідного інтервалу.

Кумулята (огіва) – крива накопичених частот. Для дискретного ряду кумулята (огіва) – це ламана, що з’єднує точки з координатами (хі,пінак).

Для інтервального варіаційного ряду ломана починається з точки, абсциса якої дорівнює початку першого інтервалу, а ордината – накопиченій частоті, що дорівнює нулю.

Емпіричною функцією розподілу називається відносна частота того, що випадкова величина Х прийме значення, менше заданого, тобто .

Для даного х емпіричну функцію розподілу представляє накопичена частість .

Побудуємо полігон, кумуляту, гістограму і емпіричну функцію розподілу для випадкової величини Х - регіональна популярності запиту «В контакті» в пошуковій системі «Яндекс» в містах України.

Для безперервного варіаційного ряду маємо значення функції розподілу Fп(х) на кінцях інтервалу. Тому для графічного зображення цієї функції доцільно її до визначити, з’єднавши точки графіка, відповідаючі кінцям інтервалів, відрізками прямої. В результаті отримана ломана співпадає з кумулятою.

Варіаційний ряд є статистичним аналогом розподілу випадкової величини Х і вміщує достатньо повну інформацію щодо мінливості досліджуваної ознаки. Однак, на практиці достатньо знати лише числові характеристики варіаційних рядів.

Середні величини – характеризують значення ознаки, навколо якого концентруються спостереження. Середньою арифметичною варіаційного ряду називається сума добутків всіх варіантів на відповідні частоти, поділена на суму частот: . Оскільки , то . Для досліджуваної нами випадкової величини середня арифметична дорівнює:

, де числа 83,5; 91,29; 98,29; 105,29; 112,29 – середини відповідних інтервалів.

Медіаною варіаційного ряду називається значення ознаки, що приходиться на середину впорядкованого ряду спостережень. Для нашої випадкової величини = 101,75%.

Модою варіаційного ряду називається варіант, якому відповідає найбільша частота. Для нашої випадкової величини = 98,29%, = 112,29%.

Показники варіації характеризують мінливість досліджуваної випадкової величини Х. Основними показниками варіації є дисперсія та середнє квадратичне відхилення.

Дисперсією варіаційного ряду називається середня арифметична квадратів відхилень варіантів від їх середньої арифметичної . Дисперсію називають вибірковою. Для спрощення обчислення дисперсії користуються властивістю дисперсії: дисперсія дорівнює різниці між середньою арифметичною квадратів варіантів і квадратом середньої арифметичної. Для нашої випадкової величини дисперсія дорівнює

Середнє квадратичне відхилення . Для нашої випадкової величини .

З отриманих даних можна зробити наступні висновки: регіональна популярність запиту «В контакті» в пошуковій системі Яндекс в Україні в середньому складає 102,8%. Але, враховуючи середнє квадратичне відхилення можна припустити, що розбіжність показника популярності в середньому може бути в межах від 94,34% до 110,66%.