- •Основные вопросы программы Математическая статистика
- •Задание 1
- •1. Построить гистограмму и полигон частот.
- •2. Составить эмпирическую функцию распределения и изобразить ее графически.
- •3. Вычислить числовые характеристики:
- •5. Найти теоретические частоты нормального закона распределения, проверить согласие эмпирической функции распределения с нормальным законом с помощью критерия Пирсона.
- •6. Найти интервальные оценки параметров нормального закона распределения (доверительную вероятность принять равной 0,99).
- •Задание 2
- •Рекомендуемая литература
Задание 2
Пример. По данным корреляционной таблицы найти условные средние и . Оценить тесноту линейной связи между признаками Х и Y и составить уравнения линейной регрессии Y по Х и Х по Y.
Y
|
X |
ny |
|||||
10 |
15 |
20 |
25 |
30 |
35 |
||
35 |
5 |
1 |
|
|
|
|
6 |
45 |
|
6 |
2 |
|
|
|
8 |
55 |
|
|
5 |
40 |
5 |
|
50 |
65 |
|
|
2 |
8 |
7 |
|
17 |
75 |
|
|
|
4 |
7 |
8 |
19 |
nx |
5 |
7 |
9 |
52 |
19 |
8 |
n=100 |
Решение. В таблице приведены полученные в результате выборочных наблюдений значения признаков Х и Y с частотами nx, ny. Частота nxy, стоящая на пересечении соответствующих строки и столбца, показывает, сколько раз наблюдалась пара значений (х, у). Например, пара значений (25, 55) наблюдалась 40 раз.
В таблице каждому значению Х соответствует статическое распределение признака Y. Например, для Х = 20
Y |
35 |
45 |
55 |
65 |
75 |
nxy |
0 |
2 |
5 |
2 |
0 |
Отсюда среднее значение Y при условии, что Х = 20, или условное среднее:
.
Аналогично,
;
;
;
;
;
.
Условные средние :
;
;
;
;
.
Оценка тесноты линейной связи между признаками Х и Y производится с помощью коэффициента линейной корреляции r:
.
При этом ‑1 ≤ r ≤ 1, знак указывает на вид связи (прямая или обратная). Величина указывает на связи:
Таблица 1
Значение r |
0 ‑ 0,1 |
0,1 ‑ 0,3 |
0,3 ‑ 0,5 |
0,5 ‑ 0,7 |
0,7 ‑ 0,9 |
0,9 ‑ 0,99 |
1 |
Теснота линейной связи |
нет |
слабая |
умерен- ная |
замет- ная |
высо- кая |
очень высокая |
функ- циона- льная |
При r > 0 связь прямая, т.е. с ростом Х растет Y.
При r < 0 связь обратная, т.е. с ростом Х убывает Y.
Для нахождения r вычислим общие средние , , , также средние квадратичные отклонения х и у. Вычисления поместим в таблицы 2 и 3.
Таблица 2
х |
nx |
xnx |
x2nx |
|
|
10 |
5 |
50 |
500 |
35 |
1750 |
15 |
7 |
105 |
1575 |
43,57 |
4570 |
20 |
9 |
180 |
3600 |
55 |
9900 |
25 |
52 |
1300 |
32500 |
58 |
75400 |
30 |
19 |
570 |
17100 |
65,05 |
37648 |
35 |
8 |
280 |
9800 |
75 |
21000 |
|
100 |
2485 |
65075 |
‑ |
150268 |
Таблица 3
y |
ny |
xny |
y2ny |
|
|
35 |
6 |
210 |
7350 |
11 |
2310 |
45 |
8 |
360 |
16200 |
16,25 |
5850 |
55 |
50 |
2750 |
151250 |
25 |
68750 |
65 |
17 |
1105 |
71825 |
26,47 |
29282,5 |
75 |
19 |
1425 |
106875 |
31 |
44075 |
|
100 |
5850 |
353500 |
‑ |
150268 |
Замечание. Равенство окончательных сумм может оказаться приближенным, что связано с приближенными вычислениями условных средних.
С помощью таблиц 2 и 3 находим общие средние, средние квадратов, среднюю произведения и средние квадратичные отклонения:
;
;
;
;
;
;
;
Отсюда коэффициент корреляции равен:
.
При r > 0 связь прямая, т.е. с ростом Х возрастает Y. По таблице 1 определяем, что линейная связь высокая.
Найдем линейное уравнение Y по Х с помощью равенства
.
Тогда
.
После преобразований получим:
.
Аналогично найдем линейное уравнение регрессии Х по Y с помощью формулы
.
Тогда
.
После преобразований получим:
.
Зависимость между признаками Х и Y задана корреляционной таблицей. В задачах 2.1. – 2.30. требуется:
-
Вычислить выборочный коэффициент корреляции.
-
Составить уравнения прямых линий регрессии Х на Y и Y на Х.
-
Y
X
ny
4
9
14
19
24
29
10
2
3
–
–
–
–
5
20
–
7
3
–
–
–
10
30
–
–
2
50
2
–
54
40
–
–
1
10
6
–
17
50
–
–
–
4
7
3
14
nx
2
10
6
64
15
3
n=100
Y
|
X |
ny |
|||||
10 |
15 |
20 |
25 |
30 |
35 |
||
30 |
2 |
6 |
– |
– |
– |
– |
8 |
40 |
– |
4 |
4 |
– |
– |
– |
8 |
50 |
– |
– |
7 |
35 |
8 |
– |
50 |
60 |
– |
– |
2 |
10 |
8 |
– |
20 |
70 |
– |
– |
– |
5 |
6 |
3 |
14 |
nx |
2 |
10 |
13 |
50 |
22 |
3 |
n=100 |
-
Y
X
ny
15
20
25
30
35
40
5
4
2
–
–
–
–
6
10
–
6
4
–
–
–
10
15
–
–
6
45
2
–
53
20
–
–
2
8
6
–
16
25
–
–
–
4
7
4
15
nx
4
8
12
57
15
4
n=100
-
Y
X
ny
15
20
25
30
35
40
6
4
2
–
–
–
–
6
12
–
6
2
–
–
–
8
18
–
–
5
40
5
–
50
24
–
–
2
8
7
–
17
30
–
–
–
4
7
8
19
nx
4
8
9
52
19
8
n=100
-
Y
X
ny
5
10
15
20
25
30
20
1
5
–
–
–
–
6
30
–
5
3
–
–
–
8
40
–
–
9
40
2
–
51
50
–
–
4
11
6
–
21
60
–
–
–
4
7
3
14
nx
1
10
16
55
15
3
n=100
-
Y
X
ny
5
10
15
20
25
30
8
2
4
–
–
–
–
8
12
–
3
7
–
–
–
8
16
–
–
5
30
10
–
50
20
–
–
7
10
8
–
20
24
–
–
–
5
6
3
14
nx
2
7
19
45
24
3
n=100
-
Y
X
ny
2
7
12
17
22
27
10
2
4
–
–
–
–
6
20
–
6
2
–
–
–
8
30
–
–
3
50
2
–
55
40
–
–
1
10
6
–
17
50
–
–
–
4
7
3
14
nx
2
10
6
64
15
3
n=100
-
Y
X
ny
11
16
21
26
31
36
25
2
4
–
–
–
–
6
35
–
6
3
–
–
–
9
45
–
–
6
45
4
–
55
55
–
–
2
8
6
–
16
65
–
–
–
4
7
3
14
nx
2
10
11
57
17
3
n=100
-
Y
X
ny
4
9
14
19
24
29
8
3
3
–
–
–
–
6
18
–
5
4
–
–
–
9
28
–
–
40
2
8
–
50
38
–
–
5
10
6
–
21
48
–
–
–
4
7
3
14
nx
3
8
49
16
21
3
n=100
-
Y
X
ny
5
10
15
20
25
30
11
4
2
–
–
–
–
6
21
–
5
3
–
–
–
8
31
–
–
5
45
5
–
55
41
–
–
2
8
7
–
17
51
–
–
–
4
7
3
14
nx
4
7
10
57
19
3
n=100
-
Y
X
ny
5
10
15
20
25
30
10
2
6
–
–
–
–
8
20
–
7
3
–
–
–
10
30
–
–
2
40
2
–
44
40
–
–
1
10
13
–
24
50
–
–
–
4
7
3
14
nx
2
13
6
54
22
3
n=100
-
Y
X
ny
15
20
25
30
35
40
30
1
6
–
–
–
–
7
40
–
–
4
–
–
5
9
50
–
4
7
30
9
–
50
60
–
–
2
10
8
–
20
70
5
–
–
–
6
3
14
nx
6
10
13
40
23
8
n=100
-
Y
X
ny
4
9
14
19
24
29
5
–
–
4
2
–
–
6
10
–
6
–
–
–
4
10
15
45
–
6
–
2
–
53
20
–
6
2
8
–
–
16
25
7
–
–
4
–
4
15
nx
52
12
12
14
2
8
n=100
-
Y
X
ny
2
7
12
17
22
27
6
–
–
–
4
2
–
6
12
–
5
3
–
–
–
8
18
–
5
–
40
5
–
50
24
–
–
2
8
–
7
17
30
8
–
–
4
7
–
19
nx
8
10
5
56
14
7
n=100
-
Y
X
ny
11
16
21
26
31
36
20
–
–
–
–
7
–
7
30
–
4
3
–
–
–
7
40
1
–
9
40
2
–
52
50
–
6
4
11
6
–
27
60
–
–
–
4
–
3
7
nx
1
10
16
55
15
3
n=100
-
Y
X
ny
2
7
12
17
22
27
8
2
–
–
–
–
4
6
12
–
3
7
–
–
–
10
16
–
–
5
30
10
–
45
20
–
4
7
10
8
–
29
24
5
1
–
–
4
–
10
nx
7
8
19
40
22
4
n=100
-
Y
X
ny
11
16
21
26
31
36
10
–
4
–
–
1
–
5
20
2
–
2
–
–
6
10
30
–
6
3
40
2
–
51
40
10
–
1
2
6
–
19
50
–
–
–
4
8
3
15
nx
12
10
6
46
17
9
n=100
-
Y
X
ny
11
16
21
26
31
36
25
–
–
4
–
1
1
6
35
7
–
2
–
–
2
11
45
–
–
6
40
4
–
50
55
–
8
2
–
9
–
19
65
3
–
–
4
7
–
14
nx
10
8
14
44
21
3
n=100
-
Y
X
ny
5
10
15
20
25
30
8
–
–
1
–
4
1
6
18
5
–
4
–
–
–
9
28
–
–
40
–
8
2
50
38
–
10
5
–
6
–
21
48
–
–
–
4
7
3
14
nx
5
10
50
4
25
6
n=100
-
Y
X
ny
2
7
12
17
22
37
11
–
–
–
2
–
4
6
21
3
5
–
–
–
–
8
31
–
–
5
45
–
–
50
41
–
8
2
–
7
–
17
51
–
–
–
4
7
8
19
nx
3
13
7
51
14
12
n=100
-
Y
X
ny
4
9
14
19
24
29
10
2
3
–
1
–
–
6
20
–
4
3
–
–
3
10
30
–
2
–
50
2
–
54
40
–
–
1
10
6
–
17
50
–
–
–
4
7
2
13
nx
2
9
4
65
15
5
n=100
Y
|
X |
ny |
|||||
10 |
15 |
20 |
25 |
30 |
35 |
||
30 |
2 |
3 |
– |
3 |
– |
– |
8 |
40 |
– |
4 |
‑ |
– |
4 |
– |
8 |
50 |
– |
7 |
‑ |
35 |
8 |
– |
50 |
60 |
2 |
– |
2 |
10 |
6 |
– |
20 |
70 |
5 |
– |
– |
‑ |
6 |
3 |
14 |
nx |
9 |
14 |
2 |
48 |
24 |
3 |
n=100 |
-
Y
X
ny
15
20
25
30
35
40
5
4
‑
–
–
2
–
6
10
–
6
‑
–
–
4
10
15
–
5
6
40
2
–
53
20
–
4
2
4
6
–
16
25
–
–
7
4
‑
4
15
nx
4
15
15
48
10
8
n=100
-
Y
X
ny
15
20
25
30
35
40
6
4
1
–
–
–
1
6
12
–
5
2
–
1
–
8
18
–
5
5
35
5
–
50
24
–
–
4
6
7
–
17
30
–
1
–
4
7
7
19
nx
4
12
11
45
20
8
n=100
-
Y
X
ny
5
10
15
20
25
30
20
1
4
–
–
–
1
6
30
2
3
3
–
–
–
8
40
–
–
7
40
2
2
51
50
–
1
4
10
6
–
21
60
–
1
–
4
7
2
14
nx
3
9
14
54
15
5
n=100
-
Y
X
ny
5
10
15
20
25
30
8
2
3
–
–
–
1
8
12
–
3
4
–
3
–
8
16
–
5
5
25
10
–
50
20
4
–
7
10
4
–
20
24
–
–
–
5
6
3
14
nx
6
11
16
40
23
4
n=100
-
Y
X
ny
2
7
12
17
22
27
10
2
3
–
–
–
1
6
20
–
4
2
–
2
–
8
30
–
4
3
46
2
–
55
40
2
–
1
10
4
–
17
50
–
–
–
4
7
3
14
nx
4
11
6
60
15
4
n=100
-
Y
X
ny
11
16
21
26
31
36
25
1
4
–
1
–
–
6
35
1
6
2
–
–
–
9
45
–
–
6
43
4
2
55
55
1
–
2
7
6
–
16
65
2
–
–
4
5
3
14
nx
5
10
10
55
15
5
n=100
-
Y
X
ny
4
9
14
19
24
29
8
3
2
–
–
–
1
6
18
2
5
2
–
–
–
9
28
–
4
40
2
4
–
50
38
–
–
3
10
6
2
21
48
–
1
–
3
7
3
14
nx
5
12
45
15
17
6
n=100
-
Y
X
ny
5
10
15
20
25
30
11
2
2
–
–
2
–
6
21
2
3
3
–
–
–
8
31
–
–
5
45
5
–
55
41
–
–
2
11
4
–
17
51
–
–
–
4
7
3
14
nx
4
5
10
60
18
3
n=100