Учебное пособие 283
.pdfназываются критическими точками. Для определения критических точек используют принцип практической невозможности событий, имеющих малую вероятность. При
этом задаются достаточно малой величинойa , называемой уровнем значимости критерия, и определяют критическую область как множество тех значенийq , вероятность которых принадлежать к области w0 равнялась бы a , т.е.
P{q Îw 0 } = a .
Если по данным выборки при данном уровне значимости получается, что q Îw 0 , то это может служить основанием для
отклонения гипотезы H 0 . |
|
|
|
|
|
||
Рассмотрим |
|
проверку |
гипотезы |
о |
нормаль |
||
распределении |
X |
генеральной |
совокупностиX . |
Пусть |
|||
распределение |
неизвестно, но |
есть |
|
основание |
|||
предположить, |
что |
X имеет |
нормальное |
распределение, т.е. |
|||
выдвигается |
гипотеза H 0 |
о |
нормальности |
СВ |
X . |
||
Статистический |
критерий, с |
помощью которого |
проверяется |
нулевая гипотеза, называется критерием согласия. Имеется несколько критериев согласия. Обычно в них используются
статистики, |
имеющие |
|
таблицы |
распределений, |
|||||
подготовленные |
заранее: |
статистику |
с |
нормальным |
|||||
нормированным распределением, статистику c2 и статистику |
|||||||||
Фишера. Рассмотрим критерий согласия Пирсона(критерий |
|||||||||
согласия c2 Пирсона, c 2 - «хи квадрат»). |
|
|
|
||||||
|
Пусть для X получена |
выборка объемаn , |
заданная в |
||||||
виде статистического ряда с равноотстоящими вариантами: |
|||||||||
|
|
|
|
|
|
|
|
|
|
|
хi |
|
х1 |
|
х2 |
|
… |
хm |
|
|
ni |
|
n1 |
|
n2 |
|
… |
nm |
|
19
Найдем |
|
|
по |
|
данным |
|
|
выборке |
|
величиныxB |
и |
s B . |
|
|||||||||||||||||||
Предполагая, |
|
|
что |
X |
|
|
имеет |
|
нормальное |
|
|
распределение, |
|
|||||||||||||||||||
вычислим величины |
|
n¢i : |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
n ×h |
|
|
æ xi - |
|
ö |
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
||||||
|
|
n¢i = |
|
|
|
xB |
j(u) = |
|
×e |
-u2/2 |
, |
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
×j ç |
|
|
|
|
|
÷, |
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
s B |
|
|
|
s B |
|
2p |
|
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
è |
|
|
ø |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
называемые теоретическими частотами, в противоположность |
|
|||||||||||||||||||||||||||||||
чему ni |
здесь называют эмпирическими частотами. |
|
|
|
|
|
||||||||||||||||||||||||||
В качестве статистики q выбирают СВ c 2 : |
|
|
|
|
|
|
|
|
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
s |
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
- n¢i ) . |
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
c 2 = å(ni |
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i=1 |
|
n¢i |
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Она |
подчиняется |
распределению c 2 |
|
с |
числом |
степеней |
|
|||||||||||||||||||||||||
свободы |
v = s - r -1 , |
|
|
где |
s - число различных значений xi ; |
|
|
|||||||||||||||||||||||||
r - число параметров, от которых зависит распределение. Для |
|
|||||||||||||||||||||||||||||||
нормального закона |
|
таких параметров два: |
a = |
|
= M ( X ) |
и |
|
|||||||||||||||||||||||||
|
xB |
|
||||||||||||||||||||||||||||||
s = s = |
DB × |
|
|
n |
|
, т.е. |
r = 2 , |
и v = s - 3 . Если эмпирическое и |
|
|||||||||||||||||||||||
n |
-1 |
|
||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
теоретическое |
|
|
распределение |
|
совпадают, то |
|
c 2 = 0 . |
По |
|
|||||||||||||||||||||||
данному уровню значимости а и числу степеней свободы v |
в |
|
||||||||||||||||||||||||||||||
таблице |
распределения c2 |
|
находят |
|
критическое |
значение |
|
|||||||||||||||||||||||||
c2 крит. |
и |
|
|
|
|
|
|
|
|
определяют |
|
|
|
критическую |
|
: |
обл |
|||||||||||||||
c2 < c2 крит., w |
0 |
= |
{ |
c 2 |
: c 2 ³ c 2крит. . |
|
Затем |
|
|
|
|
|
|
вычисляют |
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
} |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
наблюдаемое значение c2 , |
т.е. |
c 2 |
набл. по формуле |
|
|
|
|
|
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
s |
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
c2 |
набл. |
= å(ni - n¢i ) . |
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i=1 |
|
n¢i |
|
|
|
|
|
|
|
|
|
|
|
|
|
20
Если |
окажется, |
что |
c2 набл. < c2 крит. , |
то |
нулевую гипотезу |
|||||||||
H 0 о |
том, |
что |
X |
имеет |
нормальное |
распределение, |
||||||||
принимают. В этом случае опытные данные выборки хорошо |
||||||||||||||
согласуются |
с |
гипотезой |
о |
нормальном |
|
распределении |
||||||||
генеральной совокупности. |
|
|
|
|
|
|
|
|
|
|||||
Пример 6. При |
уровне a = 0, 05 |
проверить гипотезу о |
||||||||||||
нормальном распределении генеральной совокупности, если |
||||||||||||||
известны эмпирические и теоретические частоты: |
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ni |
|
6 |
|
12 |
16 |
40 |
|
13 |
|
8 |
|
5 |
|
|
n¢i |
|
4 |
|
11 |
15 |
43 |
|
15 |
|
6 |
|
6 |
|
Решение. Число различных вариантm равно 7, значит степеней свободы распределения c2 равно 7-3=4. По таблице критических точек распределения c2 , по уровню значимости
a = 0, 05 |
и |
числу |
степеней |
свободы4 |
находим |
c 2 крит. =9,5. |
|||
Вычислим c 2 |
набл. , для чего составим расчетную таблицу. |
||||||||
|
|
|
|
|
|
|
|
|
|
1 |
2 |
|
3 |
|
4 |
|
5 |
6 |
|
i |
ni |
|
n¢i |
|
ni - n¢i |
|
(ni - n¢i)2 |
(ni - n¢i)2 |
|
|
|
|
|
|
|
|
|
|
n¢i |
|
|
|
|
|
|
|
|
|
|
1 |
6 |
|
4 |
|
2 |
|
4 |
1 |
|
2 |
12 |
|
11 |
|
1 |
|
1 |
0,09 |
|
3 |
16 |
|
15 |
|
1 |
|
1 |
0,061 |
|
4 |
40 |
|
43 |
|
-3 |
|
9 |
0,21 |
|
5 |
13 |
|
15 |
|
-2 |
|
4 |
0,27 |
|
6 |
8 |
|
6 |
|
2 |
|
4 |
0,7 |
|
7 |
5 |
|
6 |
|
-1 |
|
1 |
0,17 |
21
c2 набл. = 2, 5 |
|
|
|
Так |
как c2 набл. < c2крит. то |
нулевая гипотеза |
о |
нормальности генеральной совокупности принимается.
Пример 7. Дано статистическое распределение выборки:
xi |
1,6 |
3,0 |
4,4 |
5,8 |
7,2 |
6,6 |
10,0 |
ni |
3 |
7 |
15 |
35 |
22 |
13 |
5 |
Решение.
1.Найдем методом произведений выборочные: среднюю, дисперсию и среднее квадратичное отклонени. Воспользуемся методом произведений, для чего составим таблицу 1.
|
|
|
|
|
Таблица 1 |
xi |
ni |
ui |
niui |
niui 2 |
ni (ui +1)2 |
|
|
|
|
|
|
1,6 |
3 |
-3 |
-9 |
27 |
12 |
3,0 |
7 |
-2 |
-14 |
28 |
7 |
4,4 |
15 |
-1 |
-15 |
16 |
0 |
5,8 |
35 |
0 |
0 |
0 |
35 |
7,2 |
22 |
1 |
22 |
22 |
88 |
8,6 |
13 |
2 |
26 |
52 |
117 |
10, |
5 |
3 |
15 |
45 |
80 |
0 |
|
|
|
|
|
|
n = åni |
|
åni ×ui = 2 |
åni ×ui2 =189 |
åni (ui +1)2 = 33 |
|
|
|
|
|
|
22
В качестве ложного нуля принимаем=5,8С |
– варианта с |
|||||||
наибольшей |
частотой 35. |
Шаг |
|
выборки |
||||
h = x2 - x1 = 3, 0 -1, 6 =1, 4 . |
Тогда |
условные |
варианты |
|||||
определяем по формуле ui = |
xi -C |
= |
xi - 5,8 |
. |
|
|
||
|
|
|
|
|||||
|
|
h |
1, 4 |
|
|
|
||
Подсчитываем |
условные вариантыui и |
заполняем |
все |
столбцы.
Последний столбец служит для контроля вычислений по тождеству:
2 2
åni (ui +1) = åniui + 2åniui + n
x = h1 ×u + C1 ; y = h2 ×v + C2 ; s x = h1 su ; s y = h2sv Контроль:
339 =189 + 2 ×25 +100 .
Вычисления произведены верно. Найдем условные моменты.
|
åniui |
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
M 1* = |
|
|
|
25 |
|
|
|
M 2* = |
åniui |
|
189 |
|
|
|
||||||
|
= |
|
= 0, 25; |
|
|
= |
|
=1,89. |
||||||||||||
n |
|
|
|
100 |
||||||||||||||||
|
100 |
|
|
|
|
|
|
|
n |
|
|
|
||||||||
Вычисляем выборочную среднюю: |
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
= M 1 *×h + C = 0, 25 ×1, 4 + 5,8 = 6,15. |
|
|||||||||||||||
|
|
|
xB |
|
||||||||||||||||
Находим выборочную дисперсию: |
|
|
|
|
|
|
|
|
||||||||||||
é |
|
|
|
|
|
2 |
ù |
|
2 |
é |
|
- (0, 25) |
2 |
ù |
|
2 |
= 3,58. |
|||
dB = ëM 2 * -(M1*) |
|
û ×h |
|
= ë1,89 |
|
û ×1, 4 |
|
Определяем выборочное среднее квадратическое отклонение:
s B = dB = 3, 58 =1, 89.
2.Строим нормальную кривую.
Для облегчения вычислений все расчеты сводим в таблице 2.
23
|
|
|
|
|
|
|
|
|
|
|
|
|
Таблица 2 |
|
xi |
ni |
x - |
|
= |
|
xi |
-xB |
|
xi |
-6,15 |
j (u i ) |
|
|
|
x |
ui = |
= |
|
|
||||||||||
|
|
i B |
|
|
|
|
|
|
¢ |
|
||||
|
|
|
|
s |
|
|
1,89 |
|
|
ni =74,07×j(ui ) |
|
|||
|
|
=xi -6,15 |
|
|
|
|
|
|
|
|||||
|
|
|
|
B |
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
1,6 |
3 |
-4,55 |
|
|
-2,41 |
|
|
0,0219 |
2 |
|
||||
3,0 |
7 |
-3,15 |
|
|
-1,67 |
|
|
0,0989 |
7 |
|
||||
4,4 |
15 |
-1,75 |
|
|
-0,92 |
|
|
0,2613 |
19 |
|
||||
5,8 |
35 |
-0,35 |
|
|
-0,18 |
|
|
0,3925 |
30 |
|
||||
7,2 |
22 |
1,05 |
|
|
0,56 |
|
|
|
0,3410 |
25 |
|
|||
8,6 |
13 |
2,45 |
|
|
1,30 |
|
|
|
0,1714 |
13 |
|
|||
10,0 |
5 |
3,58 |
|
|
2,04 |
|
|
|
0,0498 |
4 |
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
100 |
|
|
|
|
|
|
|
|
|
|
|
n = ån¢i =100 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Заполняем первые три столбца.
В четвертом столбце записываем условные варианты по формуле, указанной в «шапке» таблицы. В пятом столбце находим значения функции
j(u) = 1 ×e-u2 / 2 . 2p
Функция j (ui ) четная, т.е. |
j(-ui) = j(ui) . |
Значения функции j (ui ) в |
зависимости от аргументаui |
(берутся положительные ui , |
т.к. функция j (ui ) четная) |
находим из таблицы.
Теоретические частоты теоретической кривой находим по формуле
n¢i = n × pi = n ×h × 1 ×j(ui) = nh j(ui) = s B s B
= 100 ×1, 4 j(ui) = 74, 07j(ui) 1,89
24
И заполняем последний столбец. Отметим, что в последнем |
|
|||||
столбце |
частоты n¢i |
округляются |
до |
целого |
числа |
и |
ån¢i = åni =100 .
В системе координат(xi ; yi = n¢i) строим нормальную
(теоретическую) кривую (рис.2) по выравнивающим частотам n¢i (они отмечены кружками). Полигон наблюдаемых частот построен в системе координат (x 'i ; yi = n i ) .
Рис. 2
3. Проверяем гипотезу о нормальностиX при уровне значимости a = 0, 05 .
Вычислим c 2набл. , для чего составим расчетную таблицу 3.
25
|
|
|
|
|
Таблица 3 |
|||
ni |
n¢i |
ni - n¢i |
(ni - n¢i)2 |
(ni - n¢i)2 |
ni 2 |
|
ni 2 |
|
|
|
|
|
¢ |
|
|
n¢i |
|
|
|
|
|
n i |
|
|
|
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
|
|
3 |
2 |
1 |
1 |
0,5 |
9 |
4,5 |
||
7 |
7 |
0 |
0 |
0 |
49 |
7 |
|
|
15 |
19 |
-4 |
16 |
0,84 |
225 |
11,84 |
||
35 |
30 |
5 |
25 |
0,83 |
1225 |
40,83 |
||
22 |
25 |
3 |
9 |
0,36 |
484 |
19,36 |
||
13 |
13 |
0 |
0 |
0 |
169 |
13 |
|
|
5 |
4 |
1 |
1 |
0,25 |
25 |
6,25 |
||
100 |
100 |
|
|
c 2набл. = 2, 78 |
|
102,78 |
||
|
|
|
|
|
|
|
|
|
Суммируя числа пятого столбца, получаем c2 набл. = 2, 78 . Суммируя числа последнего столбца, получаем 102,78. Контроль: c2 набл. = 2, 78
åni 2 - åni = 102, 78 -100 = 2, 78 . n¢i
Совпадение результатов подтверждает правильность вычислений.
Найдем число степеней свободы, учитывая, что число групп выборки (число различных вариантов) 7. v =7-3=4.
По таблице критических точек распределенияc 2 , по
уровню значимости a = 0, 05 |
и числу степеней свободы v =4 |
||||
находим c2 кр =9,5. |
|
|
|
|
|
Так как c2 |
набл. < c2кр. , то нет оснований отвергать нулевую |
||||
гипотезу. Другими словами, |
расхождение эмпирических и |
||||
теоретических частот незначимое. Следовательно, |
данные |
||||
наблюдений |
согласуются |
с |
гипотезой |
о |
нормальности |
распределения генеральной совокупности. |
|
|
26
|
|
4. Найдем |
доверительный |
|
интервал |
для |
оценки |
||||||||
неизвестного MO M(X), полагая что |
X |
имеет |
нормальное |
||||||||||||
распределение, |
среднее |
|
|
квадратическое |
отклонение |
||||||||||
s = s X = s B =1,89 и доверительная вероятность g = 0,95 . |
|
||||||||||||||
|
|
Известен объем выборки: |
n = 100 , выборочная средняя |
||||||||||||
|
|
= 6,15 . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
xB |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Из соотношения 2F(t) = g |
получим F(t) = 0, 475 . |
По |
|||||||||||
таблице находим параметр t =1, 96 . |
|
|
|
|
|
||||||||||
|
|
Найдем точность оценки |
|
|
|
|
|
|
|
||||||
|
|
|
d = |
|
ts |
= |
1, 96 ×1,89 |
= 0,37 . |
|
|
|||||
|
|
|
|
n |
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
100 |
|
|
|
|
|
|
|
|
|
Доверительный интервал таков: |
|
|
|
|
|
||||||||
|
|
|
|
|
-d < M (X ) < |
|
+ d |
|
|
|
|||||
|
|
|
|
xB |
xB |
|
|
|
|||||||
или 6,15 - 0,37 < M ( X ) < 6,15 + 0,37 Û 5, 78 < M ( X ) < 6,52 . |
|
||||||||||||||
|
|
Надежность |
g = 0,95 |
указывает, |
что |
если |
произведено |
достаточно большое число выборок, то 95% из них определяет такие доверительные интервалы, в которых параметр действительно заключен.
|
4. Элементы теории корреляции |
|
|||
Корреляционный |
анализ – широко |
известный |
и |
||
эффективный |
метод |
статистики, позволяющий |
по |
совокупности значений показателей выявлять и описывать связи между показателями.
Если каждому значению величиныX соответствует несколько значений величины Y , но число этих значений, как и сами значения, остается не вполне определенным, то такие связи называются статистическими. Например, уровень
27
производительности труда на предприятиях тем выше, чем больше его электровооруженность. Вместе с тем, нет никаких оснований утверждать об однозначности этой зависимости.
|
|
Если изменение одной из переменных сопровождается |
|
||||||||||||||||
изменениями |
|
условного |
|
|
среднего |
значения |
друг |
||||||||||||
переменной |
величины, то |
|
такая |
зависимость |
является |
||||||||||||||
корреляционной. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
Под |
условным |
средним |
|
|
|
подразумевают |
среднее |
|
|||||||||
yx |
|
||||||||||||||||||
арифметическое |
значение Y , |
|
соответствующих |
|
значению |
|
|||||||||||||
|
X = x . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Например, пусть при x1 = 2 величина Y приняла значения |
|
||||||||||||||||
|
y1 = 5 , y2 = 6 , |
y3 =10 . Тогда условное среднее равно |
|
|
|||||||||||||||
|
|
|
|
|
|
|
= |
(5 + 6 +10) |
= 7 . |
|
|
|
|
|
|
||||
|
|
|
|
|
|
y2 |
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
3 |
|
|
|
|
|
|
|
|
|
|
|
|
Корреляционной |
зависимостью Y |
от X |
|
|
называют |
|
|||||||||||
функциональную |
зависимость |
|
условной |
средней |
|
|
от x : |
|
|||||||||||
|
yx |
|
|||||||||||||||||
|
|
= f (x) . Это уравнение называют уравнением регрессииY |
|
||||||||||||||||
|
yx |
|
|||||||||||||||||
на X , а ее график – линией регрессии Y на X . |
|
|
|
|
|
||||||||||||||
|
|
Корреляционный |
анализ |
|
рассматривает |
две |
основные |
|
|||||||||||
задачи. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Первая задача теории корреляции– установить форму корреляционной связи, т.е. вид функции регрессии (линейная, квадратичная и т.д.)
Вторая |
задача |
теории |
корреляции– |
оценить |
тесноту |
|
(силу) корреляционной связи. |
|
|
|
|
||
Теснота |
корреляционной |
связи(зависимости) |
Y |
на |
||
X оценивается по |
величине рассеивания |
значенийY |
вокруг |
условного среднего. Большое рассеивание свидетельствует о слабой зависимости Y от X , малое рассеивание указывает на наличие сильной зависимости.
28