Пункт 1
Статистическая обработка результатов эксперимента в случае выборки большого объема () начинается с группировки выборочных значений, то есть с разбиения наблюдаемых значений CB на к частичных интервалов равной длины и подсчета частот попадания значений CB в частичные интервалы.
Сделаем группировку наблюдаемых значений. Оптимальную длину интервала определим по формуле Стэрджеса:
,
где Хmax, Хmin – соответственно максимальное и минимальное выборочные значения Х- высота сосен, м., n – объем выборки.
Для Х- высота сосен, м, n=100, Хmax=90, Хmin=15. Следовательно,
.
В качестве левого конца первого интервала возьмем величину, равную
а1 = Хmin –h/2=15-9,8/2=10,1.
Если ai – начало i-го интервала, тогда
а2 = а1+h = 10,1+9,8=19,9
и т. д. составим таблицу (табл. 2).
Таблица 2.
Вспомогательная таблица для расчета числовых характеристик выборки.
Интервалы (аi;ai+1] |
Середины интервалов |
Подсчет частот |
Частоты ni |
Относительные частоты Wi=ni/n |
Накопленные относительные частоты |
(10,1; 19,9] |
15 |
|
4 |
0,04 |
0,04 |
(19,9; 29,7] |
24,8 |
|
10 |
0,1 |
0,14 |
(29,7; 39,5] |
34,6 |
|
14 |
0,14 |
0,28 |
(39,5; 49,3] |
44,4 |
|
20 |
0,2 |
0,48 |
(49,3; 59,1] |
54,2 |
|
19 |
0,19 |
0,67 |
(59,1; 68,9] |
64 |
|
15 |
0,15 |
0,82 |
(68,9; 78,7] |
73,8 |
|
13 |
0,13 |
0,95 |
(78,7; 88,5] |
83,6 |
|
4 |
0,04 |
0,99 |
(88,5; 98,3] |
93,4 |
|
1 |
0,01 |
1,00 |
Пункт 2
Первый и пятый столбцы таблицы 2составляют интервальный статистический ряд относительных частот, графическое изображение которого – гистограмма относительных частот (ступенчатая фигура на рис. 1).
Дискретный статистический ряд относительных частот задается вторым и пятым столбцами, графическое изображение которого – полигон относительных частот (изображен на рис. 1 ломаной линией).
Гистограмма
Полигон
Рис. 1
Пункт 3
Эмпирическая функция распределения F*(x) выборки служит для оценки функции распределения F(x) генеральной совокупности. Функция F*(x) определяет для каждого значения x относительную частоту события Х<x:
F*(x) = ,
где n x – число выборочных значений, меньших x;
n – объем выборки.
Шестой столбец таблицы 1 содержит накопленные частоты, то есть значения эмпирической функции распределения F*(x), они относятся к верхней границе частотного интервала.
Эмпирическая функция распределения F*(x) имеет вид:
F*(х)=
График эмпирической функции распределения F*(x) изображен на рис. 2 (для непрерывных распределений значения F*(x) распространяются на интервалы линейным интерполированием).
Рис 2. – График эмпирической функции распределения – высоты сосен