- •Лабораторная работа № 1 первичная обработка данных
- •Лабораторная работа № 2 Подбор закона распределения одномерной случайной величины
- •Лабораторная работа № 3 Построение регрессионной модели системы двух случайных величин
- •Варианты заданий для лабораторНых работ по математической статистике
- •Задание для экономических специальностей
- •Приложение а (справочное) Таблица значений функции плотности стандартного нормального распределения
- •Приложение б (справочное) Таблица значений функции Лапласа
- •Приложение в (справочное) Критические точки распределения 2
- •Приложение г (справочное) Критические точки распределения Стьюдента
- •Приложение д (справочное) Критические точки распределения Фишера
Лабораторная работа № 1 первичная обработка данных
При проведении экспериментов фиксировались значения случайной величины X, характеризующей время простоя оборудования в ожидании ремонта (в часах).
Задание:произвести первичную обработку полученных опытных данных с целью изучения свойств случайной величиныSummary Statistics for Col_1
Count |
35 |
Average |
4907,8 |
Median |
4872,42 |
Mode |
|
Geometric mean |
4881,29 |
5% Trimmed mean |
4896,1 |
5% Winsorized mean |
4901,61 |
Variance |
267820, |
Standard deviation |
517,513 |
Coeff. of variation |
10,5447% |
Standard error |
87,4756 |
5% Winsorized sigma |
514,478 |
MAD |
289,06 |
Sbi |
524,112 |
Minimum |
4003,22 |
Maximum |
6115,63 |
Range |
2112,41 |
Lower quartile |
4628,01 |
Upper quartile |
5243,49 |
Interquartile range |
615,48 |
1/6 sextile |
4399,2 |
5/6 sextile |
5416,94 |
Intersextile range |
1017,74 |
Skewness |
0,174692 |
Stnd. skewness |
0,421921 |
Kurtosis |
-0,10255 |
Stnd. kurtosis |
-0,123841 |
Sum |
171773, |
Sum of squares |
8,52132E8 |
The StatAdvisor
This table shows summary statistics for Col_1. It includes measures of central tendency, measures of variability, and measures of shape. Of particular interest here are the standardized skewness and standardized kurtosis, which can be used to determine whether the sample comes from a normal distribution. Values of these statistics outside the range of -2 to +2 indicate significant departures from normality, which would tend to invalidate any statistical test regarding the standard deviation. In this case, the standardized skewness value is within the range expected for data from a normal distribution. The standardized kurtosis value is within the range expected for data from a normal
distribution.
1) Составим расчетную таблицу, в которой запишем вариационный ряд (элементы выборки в порядке возрастания признака) и произведем расчеты, необходимые для вычисления числовых характеристик.
Таблица 1 – Расчетная таблица
Номер п/п |
Выборка, т |
Вариационный ряд, , час. |
|
|
|
|
1 |
5161,48 |
4003,22 |
-904,577 |
818259,8 |
-740179119 |
6,69549E+11 |
2 |
4435,68 |
4046,02 |
-861,777 |
742659,8 |
-640007278 |
5,51544E+11 |
3 |
5100,58 |
4046,73 |
-861,067 |
741436,6 |
-638426716 |
5,49728E+11 |
4 |
4885,41 |
4051,41 |
-856,387 |
733398,9 |
-628073421 |
5,37874E+11 |
5 |
5416,94 |
4293,44 |
-614,357 |
377434,7 |
-231879703 |
1,42457E+11 |
6 |
4496,66 |
4399,2 |
-508,597 |
258671,1 |
-131559359 |
66910714034 |
7 |
4722,08 |
4435,68 |
-472,117 |
222894,6 |
-105232360 |
49682001184 |
8 |
5537,91 |
4496,66 |
-411,137 |
169033,8 |
-69496053 |
28572408719 |
9 |
5074,01 |
4628,01 |
-279,787 |
78280,85 |
-21901974 |
6127890742 |
10 |
4807,09 |
4683,93 |
-223,867 |
50116,5 |
-11219437 |
2511663337 |
11 |
4046,02 |
4687,59 |
-220,207 |
48491,19 |
-10678105 |
2351395097 |
12 |
4683,93 |
4722,08 |
-185,717 |
34490,86 |
-6405543,4 |
1189619227 |
13 |
4872,42 |
4736,68 |
-171,117 |
29281,08 |
-5010494,2 |
857381445,7 |
14 |
4003,22 |
4752,14 |
-155,657 |
24229,15 |
-3771439,7 |
587051521,8 |
15 |
4628,01 |
4788,77 |
-119,027 |
14167,46 |
-1686312,4 |
200716943,7 |
16 |
4293,44 |
4795,27 |
-112,527 |
12662,36 |
-1424859 |
160335307,1 |
17 |
5035,7 |
4807,09 |
-100,707 |
10141,93 |
-1021364,7 |
102858716,2 |
18 |
5780,28 |
4872,42 |
-35,3771 |
1251,542 |
-44275,989 |
1566357,97 |
19 |
4752,14 |
4885,41 |
-22,3871 |
501,1842 |
-11220,082 |
251185,5676 |
20 |
6115,63 |
5007,53 |
99,73286 |
9946,643 |
992007,1 |
98935702,87 |
21 |
4788,77 |
5035,7 |
127,9029 |
16359,14 |
2092380,9 |
267621489,9 |
22 |
5140,42 |
5074,01 |
166,2129 |
27626,71 |
4591915 |
763235319,8 |
23 |
5856,44 |
5100,58 |
192,7829 |
37165,23 |
7164819,2 |
1381254322 |
24 |
5243,49 |
5124,75 |
216,9529 |
47068,54 |
10211655 |
2215447667 |
25 |
5007,53 |
5140,42 |
232,6229 |
54113,39 |
12588012 |
2928259374 |
26 |
5321,63 |
5161,48 |
253,6829 |
64354,99 |
16325758 |
4141564996 |
27 |
5124,75 |
5243,49 |
335,6929 |
112689,7 |
37829125 |
12698967210 |
28 |
5296,32 |
5296,32 |
388,5229 |
150950 |
58647529 |
22785905677 |
29 |
4046,73 |
5321,63 |
413,8329 |
171257,6 |
70872036 |
29329177084 |
30 |
4051,41 |
5416,94 |
509,1429 |
259226,4 |
131983295 |
67198351851 |
31 |
4795,27 |
5428,04 |
520,2429 |
270652,6 |
140805098 |
73252846347 |
32 |
4736,68 |
5537,91 |
630,1129 |
397042,2 |
250181403 |
1,57643E+11 |
33 |
4687,59 |
5780,28 |
872,4829 |
761226,3 |
664156929 |
5,79466E+11 |
34 |
4399,2 |
5856,44 |
948,6429 |
899923,3 |
853705782 |
8,09862E+11 |
35 |
5428,04 |
6115,63 |
1207,833 |
1458860 |
1,762E+09 |
2,12827E+12 |
Итого |
171772,9 |
171772,9 |
-2,7E-11 |
9105866 |
776178006 |
6,50271E+12 |
2) Найдем размах выборки = 6115,63- 4003,22 = 2112,41
3) Длина интервала =(2112,41)\1+3,322*ln35=(2112,41)/1+3,322*1,544 =344,636.
4) границы интервалов: = 4003,22;=4003,22+344,636 = 4347,856;=4347,856+344,636=4692,492;
=4692,492+344,636=5037,128; =5037,128+344,636=5726,4;=5726,4+344,636=6071,036;
=6071,036+344,636=6415,67.
5) Построим интервальный статистический ряд:
Таблица 2 – Интервальный статистический ряд
-
Границы интервалов
, час.
Частоты
Частосты
Накопленные частосты
[4003,22;4347,856)
5
5/35
5/35
[4347,856;4692,492)
6
6/35
11/35
[4692,492; 5037,128)
12
12/35
23/35
[5037,128;5726,4)
7
7/35
30/35
[5726,4;6071,036)
3
3/35
33/35
[6071,036;6415,67)
2
2/35
35/35
Итого
35
1
6) Вычислим числовые характеристики.
В качестве оценки математического ожиданияиспользуется среднее арифметическоенаблюденных значений. Эта статистика называетсявыборочным средним.
.
Для оценивания по выборочным данным моды распределения, используется то значение сгруппированного статистического ряда , которому соответствует наибольшее значение частоты. По интервальному статистическому ряду определяется модальный интервал, в который попалонаибольшее число элементов выборки, и в качестве точечной оценки моды может использоваться среднее значение этого интервала.
.
Для определения выборочного значения медианы используется вариационный ряд. В качестве оценки медианы принимают средний (т. е.-й) член этого ряда, если значениеn– нечётно и среднее арифметическое между двумя средними (т. е. между-м и-м) членами этого ряда, еслиn– чётно. В нашем случае объем выборки= 35 -нечетное, т.е. в качестве оценки медианы примем
.
В качестве оценки дисперсии используется статистика
Оценка среднего квадратического отклонения =.
Оценка коэффициента вариации
Оценка коэффициента асимметрии .
Оценка коэффициента эксцесса
7) Для приближённого построения эмпирической функции распределения воспользуемся соотношением:
8) Построим гистограмму частот и эмпирическую функцию распределения.
Рисунок 1 – Гистограмма частот
Рисунок 2 – Функция распределения
Вывод. В результате исследования выборки значений непрерывной случайной величины, характеризующей время простоя оборудования в ожидании ремонта, получили следующие результаты, час: минимальное время простоя – 0,21, максимальное – 34,54, среднее значение времени простоя оборудования – 5,28, наиболее вероятное время простоя оборудования – 2,922, средневероятное – 3,095, среднеквадратическое отклонение времени простоя оборудования от среднего значения составило 6,933. Оценка коэффициента вариации составила 131,3%, что указывает на большую колеблемость признака относительно среднего значения, оценка коэффициента асимметрии составила 3,074, оценка коэффициента эксцесса составила 9,423.