task_74895
.pdf10 ГЛАВА 1. ВАРИАЦИОННЫЕ РЯДЫ И ИХ ХАРАКТЕРИСТИКИ
Эмпирическая функция Fв(x) служит для оценки теоретической функции распределения генеральной совокупности.
Значения эмпирической функции Fв(x) принадлежат промежутку [0; 1]; ее графиком служит кусочно-постоянная кривая (рис. 1). Она имеет
скачки в точках, которые соответствуют вариантам xi . При обработке ре-
Fв (x)
1
0
x1 |
x2 |
x3 |
xi |
xn |
x |
|
Рис. 1. Кумулята и эмпирическая функция распределения.
зультатов эксперимента, например, результатов механических испытаний,
целесообразно вместо ступенчатой кривой вычерчивать плавную кривую (на рис. 1 это штриховая линия), которая проходит через точки, располо- женные посередине вертикальных частей ступенчатой кривой [11]. Абс- циссами этих точек служат значения механической характеристики xi , а
ординатами — эмпирическая функция Fв (x), характеризующая оценку ве- роятности события Х ≤ хi .
§ 2. Расчет выборочных характеристик статистического распределения
Рассмотрим выборку объема n со значениями x1, x2 , . . ., xn призна-
ка Х. Для характеристики важнейших свойств статистического распреде- ления используют средние показатели, называемые выборочными число- выми характеристиками. Если значения xi признака Х не сгруппированы
в вариационные ряды (табл. 2, 3, 4) и объем выборки n небольшой, то
оценки для неизвестных математического ожидания а и дисперсии σ2 на- ходят по формулам:
n
x = 1n åxi (2)
i=1
12 ГЛАВА 1. ВАРИАЦИОННЫЕ РЯДЫ И ИХ ХАРАКТЕРИСТИКИ
для математического ожидания и
|
n |
n |
|
S 2 |
= 1n å(x − x)2 |
= 1n åxi2 − x2 |
(3) |
|
i=1 |
i=1 |
|
для дисперсии [8].
Если результаты наблюдений сгруппированы в дискретный вариаци- онный ряд (табл. 3), то те же оценки находят по формулам:
|
|
|
k |
k |
|
|
x = |
1 |
å xi ni , n = |
åni , |
|
|
n |
||||
|
|
|
i=1 |
i=1 |
|
|
k |
n |
|||
S 2 |
= 1n å(xi − x)2ni = |
1 |
åni xi2 − x2 . |
||
n |
|||||
|
i=1 |
i=1 |
(4)
(5)
Несомненно, что формулы (2) и (4), как и (3) и (5) дают одинаковые результаты соответственно для x и S2.
По формуле (5) вычисляют S 2 в случае, если объем выборки n ³ 50.
|
|
|
|
|
€2 |
по формуле: |
Если же n < 50 , то вычисляют исправленную дисперсию S |
||||||
Sˆ 2 |
|
|
|
|
n |
|
= |
1 |
å(xi − x)2 |
(6) |
|||
n−1 |
||||||
|
|
|
|
|
i=1 |
|
для простой выборки, или |
|
|
|
|
|
|
Sˆ |
|
|
|
|
k |
|
2 = |
1 |
å(xi − x)2ni |
(7) |
|||
n−1 |
i=1
для взвешенной выборки.
Выборочное среднее квадратическое отклонение находят по форму-
лам
S = |
S |
2 |
ˆ |
= |
ˆ 2 |
(8) |
|
или S |
S |
при различных объемах выборки.
Для анализа вариационных рядов вычисляют такие статистики, как моду и медиану.
§ 2. Расчет выборочных характеристик |
13 |
Модой M o X называют варианту, которая имеет наибольшую часто- ту. Например, для вариационного ряда
|
|
|
xi |
|
4 |
|
9 |
|
14 |
|
19 |
|
|
||||||||||
|
|
|
ni |
|
3 |
|
7 |
|
2 |
|
5 |
|
|
||||||||||
мода равна M o X = 9 . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Медианой Me X |
называют варианту, |
|
|
которая делит вариационный |
|||||||||||||||||||
ряд на равные по числу вариант части [2]. |
|
|
|
|
|
|
|
|
|
||||||||||||||
При нечетном объеме выборки n = 2k +1 медиана равна Me X = xk +1 . |
|||||||||||||||||||||||
Например, для вариационного ряда |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
xi |
|
|
3 |
|
|
5 |
|
|
8 |
|
|
12 |
|
|
15 |
|
||||||
|
|
|
|
|
|
|
|||||||||||||||||
|
ni |
|
|
6 |
|
|
2 |
|
|
4 |
|
|
5 |
|
|
8 |
|
медиана равна Me X = x13 = 12 .
При четном объеме выборки n = 2k медиана находится по формуле:
M |
e |
X = |
xk +xk +1 |
. |
(9) |
|
|||||
|
2 |
|
|
Здесь xk — варианта, которая находится слева от середины вариа- ционного ряда, а xk +1 — справа от нее. Например, для следующего вариа- ционного ряда:
xi |
2 |
5 |
7 |
10 |
12 |
14 |
ni |
3 |
4 |
8 |
2 |
3 |
6 |
медиана равна Me X = 7 .
Для вычисления выборочной средней x , выборочной дисперсии S 2 , асимметрии As и эксцесса Ex при достаточно большом объеме выборки
( n > 30 ) применяют метод произведений [3]. При этом вводят условные
варианты ui, которые вычисляют по формуле: |
|
ui = xi h−C , |
(10) |
где C = Mo X, h — шаг (длина интервала).
Составляется расчетная табл. 6.
14ГЛАВА 1. ВАРИАЦИОННЫЕ РЯДЫ И ИХ ХАРАКТЕРИСТИКИ
Та б л и ц а 6
|
|
|
|
|
|
|
контрольный |
|||
xi |
ni |
ui |
niui |
n u2 |
n u3 |
n u4 |
столбец |
|||
|
|
|
|
i i |
i i |
i i |
n (u |
|
+1)2 |
|
|
|
|
|
|
|
|
i |
|||
|
|
|
|
|
|
|
i |
|
||
|
|
|
|
|
|
|
|
|
|
|
строка |
Σ = |
Σ = |
Σ = |
Σ = |
Σ = |
Σ = |
Σ = |
|||
сумм: |
||||||||||
|
|
|
|
|
|
|
|
|
Контроль вычислений ведут по формуле:
åni + 2åniui + åniui2 = åni (ui +1)2 .
Пользуясь табл. 6, вычисляют [3] условные начальные моменты по формулам:
M1* = 1n åniui , |
(11) |
M 2* = 1n åniui2 , |
(12) |
M3* = 1n åniui3 , |
(13) |
M 4* = 1n åniui4 . |
(14) |
Тогда выборочную среднюю находят по формуле: |
|
x = M1*h + C . |
(15) |
Выборочную дисперсию находят по формуле: |
|
S2 = (M2* − M1*2)h2 . |
(16) |
Выборочное среднее квадратическое отклонение находят по форму-
ле:
|
|
|
|
S = S 2 . |
(17) |
Асимметрию и эксцесс находят по формулам:
§ 2. Расчет выборочных характеристик |
15 |
||||
A = |
m3 |
, |
(18) |
||
|
|
||||
s |
|
S3 |
|
||
Ex = |
m4 |
− 3, |
(19) |
||
4 |
|||||
|
S |
|
где
m = (M * − 3M *M * + 2M * 3 ) h3 |
(20) |
||||
3 |
3 |
2 |
1 |
1 |
|
— условный центральный момент третьего порядка, а
m4 = (M 4* − 4M3*M1* + 6M 2*M1*2 − 3M1*4 )h4 |
(21) |
— условный центральный момент четвертого порядка.
Для характеристики колеблемости признака Х используют [2] отно- сительный показатель — коэффициент вариации V, который для положи- тельной случайной величины Х вычисляют по формуле:
V = S / |
|
. |
(22) |
x |
Коэффициент вариации подобного вида был предложен Пирсоном (1895) в несколько иной форме:
V ′ = 100S / x .
§ 3. Интервальные (доверительные) оценки параметров распределения
Выборочные характеристики x и S 2 являются надежными количе-
ственными оценками генеральных характеристик a и s2 только при большом объеме выборки. При ограниченных объемах выборки возникает необходимость указать степень точности и надежности оценок генераль- ных характеристик.
При решении практических задач, связанных со статистическим ана- лизом характеристик изучаемого признака Х, например, механических свойств конструкционных материалов, несущей способности элементов конструкций, пропускной способности нефтегазопроводов, себестоимости единицы производимой продукции и т. д., как правило, значения генераль- ной дисперсии и математического ожидания неизвестны.
Для оценки генеральной средней M (X ) = a и генерального средне-
квадратического отклонения σ по выборочной средней x и выборочному среднеквадратическому отклонению S находят [6] доверительные интер- валы по формулам:
x - |
S |
|
×tγ < a < x + |
S |
|
×tγ , |
(23) |
||
|
|
|
|
||||||
|
n |
|
n |
||||||
|
|
|
|
|
|
|
|
§ 3. Интервальные оценки параметров распределения |
17 |
где tγ находят из таблицы (см. приложение 3) по заданным n и γ (γ — уро-
вень доверия или надежность, которая задается заранее).
Для генерального среднего квадратического отклонения доверитель-
ные интервалы находят [6] по формулам: |
|
S(1− q) < σ < S(1+ q) (при q <1), |
(24) |
или |
|
0 < σ < S(1+ q) (при (q >1). |
(25) |
Величину q находят по таблице значений q = (γ, n) (приложение 4) по за- данным n и γ.
К о н т р о л ь н ы е в о п р о с ы
1.Что называется статистической совокупностью?
2.Что понимается под генеральной совокупностью?
3.Что называется выборкой?
4.Что называется вариационным рядом?
5.Описать алгоритм построения непрерывного вариационного ряда.
6.Рассказать о графическом изображении дискретного и непрерыв- ного вариационных рядов.
7.Что называется эмпирической функцией распределения? Сформу- лировать ее свойства и рассказать о ее назначении.
8.По каким формулам находятся выборочные средние статистиче- ского распределения?
9.Дать определение выборочной дисперсии и рассказать о ее назна-
чении.
10.Записать формулы для вычисления дисперсии для простой и взвешенной выборки.
11.Записать формулы для вычисления исправленной дисперсии и рассказать для чего она вводится.
12.Что называется модой и медианой вариационного ряда?
13.Рассказать о нахождении медианы при различном объеме выбор-
ки.
14.Сформулировать алгоритм вычисления x и S 2 по методу произ-
ведений.
15.Дать определения асимметрии и эксцесса статистического рас- пределения и рассказать об их назначении.
16.Записать доверительные интервалы для оценки генеральных ма- тематического ожидания и среднего квадратического отклонения.
§ 4. Лабораторная работа № 1. Построение вариационных рядов. Расчет числовых характеристик
Ц е л ь р а б о т ы: овладение способами построения рядов распре- деления и методами расчета числовых характеристик.
Выполнение лабораторной работы № 1 рассмотрим на примере сле-
дующей задачи. |
|
|
|
|
|
|
|
|
|
З а д а ч а. Имеются |
данные об обводненности нефти из насосных |
||||||||
скважин (в %): |
|
|
|
|
|
|
|
|
|
61,2 |
61,4 |
60,2 |
61,2 |
61,3 |
60,4 |
61,4 |
60,8 |
61,2 |
60,6 |
61,6 |
60,2 |
61,3 |
60,3 |
60,7 |
60,9 |
61,2 |
60,5 |
61,0 |
61,4 |
61,1 |
60,9 |
61,5 |
61,4 |
60,6 |
61,2 |
60,1 |
61,3 |
61,1 |
61,3 |
60,3 |
61,3 |
60,6 |
61,7 |
60,6 |
61,2 |
60,8 |
61,3 |
61,0 |
61,2 |
60,5 |
61,4 |
60,7 |
61,3 |
60,9 |
61,2 |
61,1 |
61,3 |
60,9 |
61,4 |
60,7 |
61,2 |
60,3 |
61,1 |
61,0 |
61,5 |
61,3 |
61,9 |
61,4 |
61,3 |
61,6 |
61,0 |
61,7 |
61,1 |
60,9 |
61,5 |
61,6 |
61,4 |
61,5 |
61,2 |
61,6 |
61,3 |
61,8 |
61,1 |
61,7 |
60,9 |
62,2 |
61,1 |
62,1 |
61,0 |
61,5 |
61,7 |
62,3 |
62,3 |
61,7 |
62,9 |
62,5 |
62,8 |
62,6 |
61,5 |
62,1 |
62,6 |
61,6 |
62,5 |
62,4 |
62,3 |
62,1 |
62,3 |
62,2 |
62,1 |
С о д е р ж а н и е р а б о т ы: на основе совокупности данных опыта выполнить следующее:
1.Построить ряды распределения (интервальный и дискретный ва- риационные ряды). Изобразить их графики.
2.Построить график накопительных частот — кумуляту.
3.Составить эмпирическую функцию распределения и изобразить ее графически.
4.Вычислить моду, медиану, выборочную среднюю, выборочную дисперсию, выборочное среднее квадратическое отклонение, коэффициент вариации, асимметрию, эксцесс.
§ 4. Лабораторная работа № 1 |
19 |
5.Построить доверительные интервалы для истинного значения из-
меряемой величины и среднего квадратического отклонения генеральной совокупности.
6.Раскрыть смысловую сторону каждой характеристики.
Методические указания по выполнению работы
1.1. Построить интервальный вариационный ряд. Для этого найти: а) размах варьирования признака по формуле R = xmax − xmin , где
xmin — наименьшая, xmax — наибольшая варианты в данной выборочной
совокупности; б) число интервалов вариационного ряда, пользуясь одним из приве-
денных ниже соотношений:
k ≈ n , 6 < k < 12, k ≈ 1+ log2 n ≈ 1+ 3,2lg n, где n — объем выборки; в) длину h частичных интервалов по формуле h = Rk и, если необхо-
димо, округлить это значение до некоторого числа; г) записать полученный интервальный вариационный ряд, заполнив
табл. 2, §1. Сделать контроль, убедившись, что åni = n .
1.2.Построить дискретный вариационный ряд, взяв в качестве вари- ант середины вариант-интервалов непрерывного вариационного ряда, а в качестве частот — частоты непрерывного вариационного ряда (табл. 3).
1.3.Изобразить графически интервальный и дискретный вариацион- ные ряды (построить гистограмму и полигон частот).
2. Построить график накопленных частот — кумуляту, т.е. ломаную, проходящую через точки с координатами xi и соответствующими накоп-
ленными частотами. Предварительно составить табл. 5 § 1.
3. Найти эмпирическую функцию распределения и изобразить ее графически.
4.1.Найти моду M o X и медиану Me X .
4.2.Для вычисления остальных статистик воспользоваться методом произведений. Ввести условные варианты ui = xi h−C , где C = M o X , h —
шаг (длина интервала). Составить расчетную табл. 6, § 2. Контроль вычислений произвести по формуле:
åni + 2åniui + åniui2 = åni (ui +1)2 .
4.3.Пользуясь табл. 6, вычислить начальные моменты (11) — (14):
M1* = 1n åniui , M2* = 1n åniui2 , M3* = 1n åniui3 , M4* = 1n åniui4 .