Збирання інформації студентами: обговорення – аналізування

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Донецкий национальный университет

Предмет:

Математика

Файл:

матан 3 курс 2013 / открытое занятие.doc

Скачиваний:

Добавлен:

13.04.2015

Размер:

1.02 Mб

Скачать

☆

<<< < Предыдущая 1 2 34 / 74 5 6 7 > Следующая >>>

Збирання інформації студентами: обговорення – аналізування – формування висновків.

Встановлення статистичних закономірностей, властивих масовим випадковим явищам, засновано на вивченні статистичних даних – відомостей про те, які значення прийняла в результаті спостережень випадкова величина Х. В даному випадку в якості випадкової величини Х ми розглядаємо регіональну популярність запиту «В контакті» в пошуковій системі Яндекс.

Як приклад, розглянемо рівень регіональної популярності запиту в Україні. Для цього, розглянемо таблицю 1, в якій представлені дані про регіональну популярність сайту «В контакті» в містах України(отримані дані в %). Різні значення випадкової величини Х називаються варіантами.

Для зручності вивчення даного статистичного матеріалу по-перше упорядкуємо (по зростанню чи спаданню) варіанти ряду:

По-друге, проведемо групування варіантів (розіб’ємо їх на інтервали).

Число інтервалів т треба брати не дуже великим, щоб після групування ряд не був громіздким, і не дуже малим, щоб не утратити особливості розподілу признака.

Число інтервалів, що рекомендуються , а ширина інтервалу .

В нашому прикладі , m = 5.

За початок першого інтервалу беруть , тобто

Отримаємо наступний згрупований ряд.

№ інтервалу і	Регіональна популярність запиту «В контакті» в пошуковій системі «Яндекс» (у %)	Частота (кількість запитів в інтервалі) п_і	Частість (частина запитів в інтервалі)	Накопичена частота	Накопичена частість
	80,79-87,79	1	0,05	1	0,05
	87,79-94,79	2	0,1	3	0,15
	94,79-101,79	7	0,35	10	0,5
	101,79-108,79	3	0,15	13	0,65
	108,79-115,79	7	0,35	20	1,00
	∑	20	1,00

Числа, що показують кількість варіантів даного інтервалу, називаються частотами (п_і), а відношення їх до загального числа спостережень – частостями, тобто . Частоти і частості називаються вагами варіаційного ряду.

Варіаційним рядом називається розташований в порядку зростання чи спадання ряд варіантів з відповідними їм вагами. Накопичена частота показує кількість варіантів із значенням ознаки, меншим фіксованого значення х. Відношення накопиченої частоти до загального числа спостережень п називається накопиченою частістю . Для завдання варіаційного ряду достатньо вказати варіанти і відповідні їх частоти або накопичені частоти.

Варіаційний ряд називається дискретним, якщо будь-які його варіанти відрізняються на постійну величину; неперервним – якщо варіанти можуть відрізнятися один від одного на скільки завгодно малу величину (в таблиці – неперервний варіаційний ряд).

Для графічного розподілу варіаційних рядів використовують полігон, гістограму, кумулятивну криву.

Полігон застосовують для зображення дискретного варіаційного ряду і представляє собою ломану, в якій кінці відрізків прямої мають координати (х_і,п_і).

Гістограма служить тільки для зображення неперервних варіаційних рядів і представляє собою фігуру, складену з прямокутників. Довжина кожного прямокутника – величина відповідного інтервалу, висота – частота варіантів відповідного інтервалу.

Кумулята (огіва) – крива накопичених частот. Для дискретного ряду кумулята (огіва) – це ламана, що з’єднує точки з координатами (х_і,п_і^нак).

Для інтервального варіаційного ряду ломана починається з точки, абсциса якої дорівнює початку першого інтервалу, а ордината – накопиченій частоті, що дорівнює нулю.

Емпіричною функцією розподілу називається відносна частота того, що випадкова величина Х прийме значення, менше заданого, тобто .

Для даного х емпіричну функцію розподілу представляє накопичена частість .

Побудуємо полігон, кумуляту, гістограму і емпіричну функцію розподілу для випадкової величини Х - регіональна популярності запиту «В контакті» в пошуковій системі «Яндекс» в містах України.

Для безперервного варіаційного ряду маємо значення функції розподілу F_п(х) на кінцях інтервалу. Тому для графічного зображення цієї функції доцільно її до визначити, з’єднавши точки графіка, відповідаючі кінцям інтервалів, відрізками прямої. В результаті отримана ломана співпадає з кумулятою.

Варіаційний ряд є статистичним аналогом розподілу випадкової величини Х і вміщує достатньо повну інформацію щодо мінливості досліджуваної ознаки. Однак, на практиці достатньо знати лише числові характеристики варіаційних рядів.

Середні величини – характеризують значення ознаки, навколо якого концентруються спостереження. Середньою арифметичною варіаційного ряду називається сума добутків всіх варіантів на відповідні частоти, поділена на суму частот: . Оскільки , то . Для досліджуваної нами випадкової величини середня арифметична дорівнює:

, де числа 83,5; 91,29; 98,29; 105,29; 112,29 – середини відповідних інтервалів.

Медіаною варіаційного ряду називається значення ознаки, що приходиться на середину впорядкованого ряду спостережень. Для нашої випадкової величини = 101,75%.

Модою варіаційного ряду називається варіант, якому відповідає найбільша частота. Для нашої випадкової величини = 98,29%, = 112,29%.

Показники варіації характеризують мінливість досліджуваної випадкової величини Х. Основними показниками варіації є дисперсія та середнє квадратичне відхилення.

Дисперсією варіаційного ряду називається середня арифметична квадратів відхилень варіантів від їх середньої арифметичної . Дисперсію називають вибірковою. Для спрощення обчислення дисперсії користуються властивістю дисперсії: дисперсія дорівнює різниці між середньою арифметичною квадратів варіантів і квадратом середньої арифметичної. Для нашої випадкової величини дисперсія дорівнює

Середнє квадратичне відхилення . Для нашої випадкової величини .

З отриманих даних можна зробити наступні висновки: регіональна популярність запиту «В контакті» в пошуковій системі Яндекс в Україні в середньому складає 102,8%. Але, враховуючи середнє квадратичне відхилення можна припустити, що розбіжність показника популярності в середньому може бути в межах від 94,34% до 110,66%.

<<< < Предыдущая 1 2 34 / 74 5 6 7 > Следующая >>>

Збирання інформації студентами: обговорення – аналізування – формування висновків.