Доверительный интервал (xB ; xB ) (5,4 1,24;5,4 1,24) (4,16;6,64).
Пример. Найти минимальный объём выборки, при котором с надёжностью
0,95 точность оценки математического ожидания нормально распределённого признака по выборочной средней будет равна 0,2, если среднее квадратиче-
ское отклонение равно 2.
Решение. Дано: 0,95; |
0,2; |
0,2; найти n. |
||||||||
Из формулы t |
|
|
|
|
|
t |
2 2 |
. Из условия 2Ф(t) 0,95 находим |
||
|
|
|
находим n |
|
|
|
||||
|
|
|
|
2 |
||||||
|
|
|
n |
|
|
|
|
|
||
t 1,96. Тогда n |
1,962 22 |
|
|
|
|
|||||
|
|
|
|
|
384,16 385. |
|||||
0,22 |
|
|||||||||
|
|
|
|
|
|
|
Пример. По заданным значениям характеристик нормально распределённого признака найти доверительный интервал для оценки неизвестного математи-
ческого ожидания: 0,95; n 12; S 1,5; xB 16,8.
Решение. t S . Из табл. 4 по данным γ и n находим t 2,20. Тогда n
2,20 1,5 0,95. 12
Доверительный интервал (16,8 0,95;16,8 0,95) (15,85;17,75).
§33. Понятие о критериях согласия
Статистической называется гипотеза о неизвестном законе распре-
деления случайной величины или о параметрах закона распределения, вид которого известен.
|
|
Нулевой (основной) гипотезой называется выдвинутая гипотеза Н0. |
|||||||||||
|
|
Конкурирующей (альтернативной) гипотезой называется гипотеза |
|||||||||||
Н1, которая противоречит нулевой гипотезе Н0. |
|
|
|
|
|||||||||
|
|
Пусть имеется статистическое распределение выборки для случайной |
|||||||||||
величины Х: |
|
|
|
|
|
|
|
|
|
|
|||
|
хi |
|
х1 |
|
х2 |
|
х3 |
|
… |
|
хk |
|
k |
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
ni n |
|
ni |
|
n1 |
|
n2 |
|
n3 |
|
… |
|
nk |
|
|
|
|
|
|
|
|
|
i 1 |
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
61
По виду полигона или гистограммы, сравнивая их с графиками дифференци-
альных функций распределения, делаем предположение о виде закона рас-
пределения случайной величины.
Сделанное предположение (гипотеза) подтверждается расчётами критерия согласия. Имеются различные критерии согласия: Хинчина, Колмогорова,
Пирсона. Например, критерий Пирсона (хи-квадрат)
2 |
k |
(ni ni)2 |
|
|
|
|
n |
|
|
i 1 |
i |
позволяет сравнивать близость частот ni – данного статистического распре-
деления с теоретическими частотами ni, найденными с помощью функции распределения предполагаемого закона:
n np nP(x X x |
) n[F(x |
) F(x )] nf |
|
xi xi 1 |
|
(x |
x ), |
||||
|
|||||||||||
i |
i |
i |
i 1 |
i 1 |
i |
|
2 |
|
i 1 |
i |
|
|
|
|
|
|
|
|
|
|
|
||
i 0,1,2, ,k 1, где |
f (x) – дифференциальная, |
F(x) |
– интегральная |
функции предполагаемого распределения.
Если вычисленное значение критерия 2 не превосходит некоторого крити-
ческого значения 2кр, взятого по таблице, то выдвинутая гипотеза принима-
ется с заданным уровнем надёжности (вероятности) 1 . В противном случае гипотеза отвергается.
В табл. 6 приложения:
α – уровень значимости, это вероятность отвергнуть гипотезу; s – число степеней свободы, s k 1 r, где
r – число параметров предполагаемого распределения: r 2 для нормального распределения (а и σ), r 1 для показательного распределения (λ).
При проверке гипотезы Н0 возможны следующие ошибки:
ошибка первого рода – отвергнуть гипотезу Н0 при её правильности;
ошибка второго рода – принятие гипотезы Н0 при правильности альтерна-
тивной гипотезы Н1.
62
§34. Виды зависимостей между случайными величинами Х и Y
X, Y – количественные признаки, связанные между собой.
xi, yi – их возможные значения.
Функциональная зависимость – каждому значению признака Х соответст-
вует единственное значение признака Y: x y f (x).
Статистическая зависимость– каждомузначению признака Х соответствует статистическое распределение признака Y:
x |
yi |
| |
y1 |
y2 yk |
. |
ni |
| |
n1 |
|
||
|
n2 nk |
Корреляционная зависимость – каждому значению признака Х соответствует среднее значение признака Y (условная средняя yx ):
x yx f (x).
Аналогично: y xy (x).
xyx f (x) – уравнение регрессии у по х.
yxy (x) – уравнение регрессии х по у.
Примеры. Площадь квадрата Y есть функция от длины стороны квадрата Х: y x2, зависимость функциональная.
Товарооборот магазина Y зависит от числа торговых работников Х. Эта зависимость корреляционная.
Две основные задачи теории корреляции:
1.Определить форму корреляционной связи, то есть определить вид уравнения регрессии.
2.Оценить тесноту (силу) корреляционной связи.
§35. Корреляционная таблица
Все наблюдения числовых признаков X и Y с соответствующими частотами записываются в корреляционную таблицу.
Пример.
х |
у |
2 |
4 |
6 |
nх |
1 |
|
2 |
– |
4 |
6 |
3 |
|
– |
5 |
6 |
11 |
5 |
|
3 |
9 |
3 |
15 |
nу |
|
5 |
14 |
13 |
n = 32 |
Числа 1; 3; 5 (левый столбец таблицы) показывают наблюдаемые значения признака Х. Числа 2; 4; 6 (первая строка) показывают наблюдаемые значения
63
признака Y.
Числа внутри таблицы показывают частоту появления соответствующей пары значений (X, Y). Например, пара (1; 2) наблюдалась 2 раза, пара (3; 4) – 5 раз, пара (1; 4) не наблюдалась ни разу (соответствующая частота равна 0).
По данным наблюдений вычислены частоты nx, ny, n: nx – частота появления данного значения Х,
ny – частота появления данного значения Y,
n – объём выборки, количество всех наблюдаемых пар (X, Y).
Так, значение х = 1 наблюдалось 2 + 4 = 6 раз; значение х = 5 наблюдалось 3 + 9 + 3 =15 раз и т.д. Объём выборки n =6 + 11 + 15+ 32 или n = 5 + 14 + 13 + 32.
В общем виде корреляционная таблица выглядит так:
|
х |
у |
|
|
у1 |
|
|
|
|
|
у2 |
… уm |
|
|
|
|
nx |
|
|
|||||||
|
х1 |
|
|
|
n11 |
|
|
|
|
|
n12 |
… n1m |
|
|
|
|
nx |
|
|
|||||||
|
х2 |
|
|
|
n21 |
|
|
|
|
|
n22 |
… n2m |
|
|
|
|
|
1 |
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
nx2 |
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
хk |
|
|
|
nk1 |
|
|
|
|
|
nk2 |
… nkm |
|
|
|
|
n |
xk |
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ny |
|
|
|
ny |
|
|
|
|
|
ny |
… |
|
ny |
m |
|
|
|
|
n |
|
|
||||
|
|
|
|
|
|
1 |
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
m |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
k |
|
|
|
||
nxi ni1 ni2 nim nij; |
|
nyj n1j n2 j nkj |
nij; |
|
|
|||||||||||||||||||||
|
|
|
|
|
j 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i 1 |
|
|
|
|||
|
|
|
|
|
k |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
m |
|
|
|
n nx1 nx2 nxk nxi |
или n ny1 |
ny2 |
nym |
|
nyj . |
|||||||||||||||||||||
|
|
|
|
i 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
j 1 |
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
m |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
y1nl1 |
y2nl2 ymnlm |
|
|
|
yjnlj |
||||||||||
Условные средние по х: |
|
y |
x xl |
|
|
|
|
j 1 |
|
. |
||||||||||||||||
|
|
|
|
|
|
|
|
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
nl1 nl2 nlm |
|
|
|
|
|
nx |
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
l |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
k |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x n |
x n |
|
x n |
|
|
|
xinit |
|
|
||||||
Условные средние по у: |
|
x |
y y |
|
|
|
1 1t |
2 2t |
|
|
k kt |
|
i 1 |
|
. |
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
|
|
|
|
|
|
t |
|
|
|
|
n1t n2t nkt |
|
|
|
|
|
nyt |
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
§36. Виды уравнений регрессии |
|
|
|
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||
Вид регрессии |
|
|
|
Уравнение регрессии |
|
Сведениек линейномувиду |
||||||||||||||||||||
1. Линейная |
|
|
|
|
|
|
|
y |
x |
ax b |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
xy |
cy d |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
64
2. |
Гиперболическая |
|
|
y |
x |
a |
b |
|
t |
1 |
|
|
|
y |
x a bt |
||||||||
|
|
x |
x |
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
ln |
y |
x |
|
lna xlnb |
||||||
3. |
Показательная |
|
|
|
y |
|
abx |
ln |
y |
x |
|
Y |
|
|
|
||||||||
|
|
|
x |
lna A |
|
Y A Bx |
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
lnb B |
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
Вид регрессии |
Уравнение регрессии |
Сведениек линейномувиду |
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
ln |
y |
x |
|
lna bln x |
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
ln |
y |
x |
|
Y |
|
|
|
|||
4. Степенная |
|
|
|
yx axb |
lna A |
|
Y A bX |
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
ln x X |
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
5. |
Параболическая |
|
|
x a |
|
|
b |
t |
|
|
|
|
|
|
x at b |
||||||||
|
y |
|
x |
|
x |
|
|
y |
|||||||||||||||
6. |
Параболическая |
y |
x ax2 |
bx c |
к линейной не сводится |
В случаях 1–5 параметры линейной зависимости находятся по формулам, указанным в следующем параграфе. Для случая 6 применяется непосредственно метод наименьших квадратов.
Пример. Дана таблица
i |
1 |
2 |
3 |
|
4 |
|
|
5 |
|
6 |
|
7 |
8 |
|
9 |
|||||
X |
0,25 |
0,37 |
0,44 |
|
0,55 |
|
0,60 |
|
0,62 |
|
0,68 |
0,70 |
|
0,73 |
||||||
Y |
2,57 |
2,31 |
2,12 |
|
1,92 |
|
1,75 |
|
1,71 |
|
1,60 |
1,51 |
|
1,50 |
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
i |
|
10 |
|
11 |
|
12 |
13 |
|
14 |
|
15 |
|
16 |
17 |
|
|
||
|
|
X |
|
0,75 |
|
0,82 |
|
0,84 |
0,87 |
|
0,88 |
|
0,90 |
0,95 |
1,00 |
|
|
|||
|
|
Y |
|
1,41 |
|
1,33 |
|
1,31 |
1,25 |
|
1,20 |
|
1,19 |
1,15 |
1,00 |
|
|
Определить коэффициент корреляции rxy и уравнения линий регресии.
Решение. Составим расчётную таблицу:
i |
Х |
Y |
X2 |
Y2 |
XY |
|
|
|
|
|
|
1 |
0,25 |
2,57 |
0,0625 |
6,6049 |
0,6425 |
|
|
|
|
|
|
2 |
0,37 |
2,31 |
0,1369 |
5,3361 |
0,8547 |
|
|
|
|
|
|
3 |
0,44 |
2,12 |
0,1936 |
4,4944 |
0,9328 |
|
|
|
|
|
|
4 |
0,55 |
1,92 |
0,3025 |
3,6864 |
1,0560 |
|
|
|
|
|
|
5 |
0,60 |
1,75 |
0,3600 |
3,0625 |
1,0500 |
|
|
|
|
|
|
65
|
|
6 |
|
0,62 |
|
1,71 |
|
0,3844 |
2,9241 |
|
1,0602 |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
7 |
|
0,68 |
|
1,60 |
|
0,4624 |
2,5600 |
|
1,0880 |
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
8 |
|
0,70 |
|
1,51 |
|
0,4900 |
2,2801 |
|
1,0570 |
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
9 |
|
0,73 |
|
1,50 |
|
0,5329 |
2,2500 |
|
1,0950 |
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
10 |
|
0,75 |
|
1,41 |
|
0,5625 |
1,9881 |
|
1,0575 |
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i |
|
|
Х |
|
Y |
|
X2 |
|
Y2 |
|
|
XY |
||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
11 |
|
0,82 |
|
1,33 |
|
0,6724 |
1,7689 |
|
1,0906 |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
12 |
|
0,84 |
|
1,31 |
|
0,7056 |
1,7161 |
|
1,1004 |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
13 |
|
0,87 |
|
1,25 |
|
0,7569 |
1,5625 |
|
1,0875 |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
14 |
|
0,88 |
|
1,20 |
|
0,7744 |
1,4400 |
|
1,0560 |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
15 |
|
0,90 |
|
1,19 |
|
0,8100 |
1,4161 |
|
1,0710 |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
16 |
|
0,95 |
|
1,15 |
|
0,9025 |
1,3225 |
|
1,0925 |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
17 |
|
1,00 |
|
1,00 |
|
1,0000 |
1,0000 |
|
1,0000 |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
11,95 |
|
26,83 |
|
9,1095 |
45,4127 |
|
17,3917 |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
17 |
|
|
|
17 |
|
|
|
|
|
|
|
Из таблицы получаем: xi |
11,95, |
yi 26,83, |
|
|
|
|
||||||||||
|
|
|
|
|
i 1 |
|
|
i 1 |
|
|
|
|
|
|
||
17 |
|
|
17 |
|
|
17 |
|
|
|
|
17 |
|
|
|
||
xi2 |
9,1095, |
xi2 9,1095, yi2 45,4127, xi yi |
17,3917. |
|||||||||||||
i 1 |
|
|
i 1 |
|
|
i 1 |
|
|
|
i 1 |
|
|
|
|||
Теперь находим |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
x |
11,95/17 0,7029, |
y |
26,83/17 1,5782; |
||||||||||
|
|
2x |
9,1095/17 (0,7029)2 |
0,0418, |
x |
0,2042, |
||||||||||
|
|
2y |
45,4127/17 (1,5782)2 |
0,1806, |
y |
0,4250; |
||||||||||
|
|
|
Cxy |
17,3917/17 0,7029 1,5782 0,0863; |
||||||||||||
|
|
|
|
rxy |
( 0,0863)/(0,2042 0,4250) 0,9943. |
Вычисляем значение произведения | rxy | n 1; так как
| rxy | n 1 0,9943 4 3,9772 3, то связь достаточно обоснована.
Уравнения линий регрессии:
66
y
yx y rxy x (x x),
т.е. yx 1,5782 0,9943 0,4250(x 0,7029); 0,2042
yx 2,0695x 3,0329;
xx x rxy x (y y),y
т.е. xy 0,7029 0,9943 0,2042(y 1,5782); 0,4250
xy 0,4776y 1,4566.
Построив точки, определяемые таблицей, и линии регрессии, видим, что обе линии регрессии проходят через точку М(0,7029; 1,5782). Первая линия отсе-
кает на оси ординат отрезок 3,0329, а вторая – на оси абсцисс отрезок 1,4566.
Точки (xi, yi) расположены близко к линиям регрессии.
yx 2,0695x 3,0329;
xy 0,4776y 1,4566.
§37. Метод наименьших квадратов
Служит для нахождения параметров уравнения регрессии. Пусть даны соответствующие значения рассматриваемых признаков X и Y:
хi |
х1 |
х2 |
… |
хk |
67
уi |
|
у1 |
|
у2 |
… |
уk |
Подберём функцию y |
f (x), |
наилучшим образом отражающую зависимость |
||||
между признаками X и Y. |
|
|
|
|
|
Подставляя хi в функцию, получим теоретическое значение Y (обозначим yiт ): yiт f (xi ).
(yiт yi ) – отклонения теоретических значений yiт от эмпирических значе-
ний yi.
Суть метода наименьших квадратов: параметры выбранной функции y f (x)
находят так, чтобы сумма квадратов отклонений теоретических значений от эмпирических была наименьшей, т.е.
n
(yiт yi)2 min.
i 1
Нахождение параметров уравнения линейной регрессии:
yax b.
1.Из системы нормальных уравнений:
|
n |
|
|
|
n |
|
n |
|
|
|
|
|
|
|
|
|
|
|||||||||
a xi2 b xi xi yi |
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
i 1 |
|
|
|
i 1 |
|
i 1 |
|
|
|
|
|
|
|
|
|
|
||||||||||
|
n |
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
||||||
a xi nb yi. |
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
i 1 |
|
|
|
|
|
|
|
i 1 |
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
xy |
x |
y |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
2. |
a |
|
|
; |
|
b |
y |
ax |
, |
где 2x x2 |
|
x |
2. |
|||||||||||||
|
|
|
|
|
|
|
|
|||||||||||||||||||
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
y |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
xy |
x |
y |
|
|
|
|||||
3. |
y y R |
|
(x x), где R |
. |
|
|
||||||||||||||||||||
x |
|
x y |
|
|
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
§38. Показатели тесноты корреляционной связи
Н – корреляционное отношение (для линейной и нелинейной связи). R – коэффициент корреляции (только для линейной связи). Свойства:
|
|
R |
|
|
H Hy/x |
1. |
| R| 1 |
или 1 R 1. |
1. |
0 H 1. |
|
2. |
R 0 |
Х и Y не связаны линей- |
2. |
H 0 |
Y не связано с Х. |
ной зависимостью (эта зависимость может быть нелинейной).
68
|
|
|
|
|
|
R |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
H Hy/x |
|
|
|||||
3. | R| 1, т.е. R 1 |
Х и Y свя- |
|
3. H 1 |
Y связано с Х функцио- |
|||||||||||||||||||||||||
заны функциональной зависимостью. |
|
нальной зависимостью. |
|
|
|||||||||||||||||||||||||
Если R 0, |
то связь прямая, т.е. с |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
ростом Х растёт Y. Если R 0, то |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
связь обратная, т.е. с ростом Х убы- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
вает Y. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
4. Чем ближе Н к единице, тем кор- |
||||||||||||||
4. Чем | R| |
ближе к единице, тем |
|
|||||||||||||||||||||||||||
линейная корреляционная связь тес- |
|
реляционная связь теснее. |
|
|
|||||||||||||||||||||||||
нее. |
|
|
|
|
|
|
|
|
|
|
|
Всегда H | R|. |
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Шкала Чаддока |
|||
| R|, H |
(0; 0,3) |
|
|
[0,3; 0,5) |
[0,5; 0,7) |
|
|
[0,7; 0,9) |
|
[0,9; 1) |
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
теснота |
|
|
слабая |
|
|
умеренная |
|
заметная |
|
|
высокая |
|
весьма |
||||||||||||||||
связи |
|
|
|
|
|
|
|
|
высокая |
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
межгр. |
|
|
|
|
|
||
Формулы для вычислений: R |
xy |
xy |
|
; H |
. |
|
|
|
|
||||||||||||||||||||
x y |
|
общ. |
|
|
|
|
|||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
1. Ну/х – корреляционное отношение у к х, где |
|
|
|
|
|
|
|
|
|||||||||||||||||||||
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
межгр2 |
|
( |
y |
xi |
y |
)2 nxi |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
. |
i 1 |
|
|
|
|
|
|
|
|
– межгрупповая дисперсия, характеризует разброс |
|||||||||||||||||||
|
|
|
n |
|
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
условных средних |
y |
xi |
от общей средней |
y |
, общ2 |
. 2y |
– общая дисперсия, |
||||||||||||||||||||||
характеризует разброс фактических данных уi |
от их общей средней |
y |
. |
||||||||||||||||||||||||||
2. Нх/у – корреляционное отношение х к у, где |
|
|
|
|
|
|
|
|
|||||||||||||||||||||
|
|
m |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
( |
x |
yj |
x |
)2 nyj |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
межгр2 |
. |
j 1 |
|
– межгрупповая дисперсия, характеризует разброс |
|||||||||||||||||||||||||
|
|
|
|
||||||||||||||||||||||||||
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
условных средних |
x |
xi |
от общей средней |
x |
, общ2 . 2x |
– общая дисперсия, |
|||||||||||||||||||||||
характеризует разброс фактических данных хj |
от их общей средней |
x |
. |
§39. Пример составления уравнения линейной регрессии и оценки
тесноты корреляционной связи
Пусть Х – оценка студента по математике в школе, Y – оценка по математике в первом семестре.
В результате опроса составлена следующая корреляционная таблица:
69
х |
у |
2 |
3 |
4 |
5 |
nx |
3 |
|
– |
1 |
– |
– |
1 |
4 |
|
4 |
26 |
25 |
5 |
60 |
5 |
|
– |
12 |
22 |
19 |
53 |
ny |
|
4 |
39 |
47 |
24 |
n = 114 |
Оценить тесноту корреляционной связи между Х и Y, вычислив коэффициент корреляции R. Составить уравнение линейной регрессии Y по Х.
Решение. Для вычисления R найдём |
x |
, |
y |
, |
xy |
, x2, |
y2, x, y. |
|||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
k |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
xinxi |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
Общие средние: |
|
x |
|
i 1 |
|
|
3 1 4 60 5 53 |
|
|
|
508 |
4,46; |
||||||||||||||||||||||||||||||||||||||||||||||||
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
114 |
||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
yjnyj |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
114 |
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
2 4 3 39 4 47 5 24 |
433 |
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||
|
y |
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3,80; |
|||||||||||||||||
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
114 |
|
|
|
|
|
|
|
|
114 |
||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
xi yjnij |
|
|
|
2 4 4 3 3 1 3 4 26 3 5 12 4 4 25 4 5 22 |
|||||||||||||||||||||||||||||||||||||||||||||||
|
xy |
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
114 |
|
|
|
|
|
|
|
|||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
5 4 5 5 5 19 |
|
1948 |
17,09; |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
114 |
|
|
|
|
|
|
|
|
|
|
114 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
xi2nxi |
|
32 |
|
1 42 60 52 53 2294 |
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||||||
|
x |
2 |
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
20,12; |
|||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
114 |
|
|
|
|
|
|
114 |
|
|||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||
|
|
|
|
|
|
|
|
y2jnyj |
|
|
|
|
|
22 4 32 |
39 42 47 52 |
24 1719 |
||||||||||||||||||||||||||||||||||||||||||||
|
y |
2 |
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
15,08; |
||||||||||
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
114 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
114 |
|
|
|
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
y |
|
|
|
|
y2 |
|
y |
2 |
|
|
|
|
15,08 3,802 |
0,81; |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
|
|
|
|
x2 |
|
x |
2 |
|
|
|
|
20,12 4,462 |
0,52; |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||
|
R |
xy |
|
x |
|
y |
|
|
17,09 4,46 3,80 |
0,39 |
|
|
линейная связь умеренная. |
|||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
x y |
|
|
|
|
|
|
|
0,52 0,81 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||
|
y |
x |
ax b – уравнение линейной регрессии Y по Х. |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||||||||
a |
|
xy |
xy |
|
17,09 4,46 3,80 |
|
0,61; |
|
b |
y |
ax |
3,80 0,61 4,46 1,08; |
||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
2x |
|
|
|
|
|
|
|
0,522 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
yx 0,61x 1,08.
Это уравнение выражает зависимость средней оценки по математике в первом семестре от оценки в школе.
Аналогично, xy cy d – уравнение регрессии Х по Y.
70