- •§ 2. Закон распределения вероятностей дискретной двумерной случайной величины
- •§ 3. Функция распределения двумерной случайной величины.
- •§ 4. Свойства функции распределения двумерной случайной величины
- •§ 5. Вероятность попадания случайной точки в полуполосу
- •§ 6. Вероятность попадания случайной точки в прямоугольник
- •§ 7. Плотность совместного распределения вероятностей непрерывной двумерной случайной величины (двумерная плотность вероятности)
- •§ 8. Нахождение функции распределения системы по известной плотности распределения
- •§ 9. Вероятностный смысл двумерной плотности вероятности.
- •§ 10. Вероятность попадания случайной точки в произвольную область
- •§11. Свойства двумерной плотности вероятности
- •§ 12. Отыскание плотностей вероятности составляющих двумерной случайной величины
- •§ 13. Условные законы распределения составляющих системы дискретных случайных величин
- •§ 14. Условные законы распределения составляющих системы непрерывных случайных величин
- •§ 15. Условное математическое ожидание
- •§ 16. Зависимые и независимые случайные величины
- •§ 17. Числовые характеристики системы двух случайных величин. Корреляционный момент. Коэффициент корреляции
- •§ 18. Коррелированность и зависимость случайных величин
- •§ 19. Нормальный закон распределения на плоскости
- •§ 20. Линейная регрессия. Прямые линии среднеквадратической регрессии
- •§ 21. Линейная корреляция. Нормальная корреляция
- •§ 1. Задачи математической статистики
- •§ 2. Краткая историческая справка
- •§ 3. Генеральная и выборочная совокупности
- •§ 4 Повторная и бесповторная выборки. Репрезентативная выборка
- •§ 5. Способы отбора
- •§ 6. Статистическое распределение выборки
- •§ 7. Эмпирическая функция распределения
- •§ 8. Полигон и гистограмма
- •§ 1. Статистические оценки параметров распределения
- •§ 2. Несмещенные, эффективные и состоятельные оценки
- •§ 3. Генеральная средняя
- •§ 4. Выборочная средняя
- •§ 5. Оценка генеральной средней по выборочной средней. Устойчивость выборочных средних
- •§ 6. Групповая и общая средние
- •§ 7. Отклонение от общей средней и его свойство
- •§ 8. Генеральная дисперсия
- •§ 9. Выборочная дисперсия
- •§ 10. Формула для вычисления дисперсии
- •§11. Групповая, внутригрупповая, межгрупповая и общая дисперсии
- •§ 12. Сложение дисперсий
- •§ 13. Оценка генеральной дисперсий по исправленной выборочной
- •§14. Точность оценки, доверительная вероятность (надежность). Доверительный интервал
- •§ 15. Доверительные интервалы для оценки математического ожидания нормального распределения при известном σ
- •§ 16. Доверительные интервалы для оценки математического ожидания нормального распределения при неизвестном σ
- •§ 17. Оценка истинного значения измеряемой величины
- •§ 18. Доверительные интервалы для оценки среднего квадратического отклонения σ нормального распределения
- •§ 19. Оценка точности измерений
- •§ 20. Оценка вероятности (биномиального распределения) по относительной частоте
- •§ 21. Метод моментов для точечной оценки параметров распределения
- •§ 22. Метод наибольшего правдоподобия
- •§ 23. Другие характеристики вариационного ряда
- •§ 1. Условные варианты
- •§ 2. Обычные, начальные и центральные эмпирические моменты
- •§ 3. Условные эмпирические моменты. Отыскание центральных моментов по условным
- •§ 4. Метод произведений для вычисления выборочных средней и дисперсии
- •§ 5. Сведение первоначальных вариант к равноотстоящим
- •§ 6. Эмпирические и выравнивающие (теоретические) частоты
- •§ 7. Построение нормальной кривой по опытным данным
- •§ 8. Оценка отклонения эмпирического распределения от нормального. Асимметрия и эксцесс
- •§ 1. Функциональная, статистическая и корреляционная зависимости
- •§ 2. Условные средние
- •§ 3. Выборочные уравнения регрессии
- •§ 4. Отыскание параметров выборочного уравнения прямой линии среднеквадратичной регрессии по не сгруппированным данным
- •§ 5. Корреляционная таблица
- •§ 6. Отыскание параметров выборочного уравнения прямой линии регрессии по сгруппированным данным
- •§ 7. Выборочный коэффициент корреляции
- •§ 8. Методика вычисления выборочного коэффициента корреляции
- •§ 9. Пример на отыскание выборочного уравнения прямой линии регрессии
- •§ 10. Предварительные соображения к введению меры любой корреляционной связи
- •§ 11. Выборочное корреляционное отношение
- •§ 12. Свойства выборочного корреляционного отношения
- •§ 13. Корреляционное отношение как мера корреляционной связи. Достоинства и недостатки этой меры
- •§ 14. Простейшие случаи криволинейной корреляции
- •§ 15. Понятие о множественной корреляции
- •§ 1. Статистическая гипотеза. Нулевая и конкурирующая, простая и сложная гипотезы
- •§ 2. Ошибки первого и второго рода
- •§ 3. Статистический критерий проверки нулевой гипотезы. Наблюдаемое значение критерия
- •§ 4. Критическая область. Область принятия гипотезы. Критические точки
- •§ 5. Отыскание правосторонней критической области
- •§ 6. Отыскание левосторонней и двусторонней критических областей
- •§ 7. Дополнительные сведения о выборе критической области. Мощность критерия
- •§ 8. Сравнение двух дисперсий нормальных генеральных совокупностей
- •§ 9. Сравнение исправленной выборочной дисперсии с гипотетической генеральной дисперсией нормальной совокупности
- •§ 10. Сравнение двух средних нормальных генеральных совокупностей, дисперсии которых известны (независимые выборки)
- •§ 11( Сравнение двух средних произвольно распределенных генеральных совокупностей (большие независимые выборки)
- •§ 12. Сравнение двух средних нормальных генеральных совокупностей, дисперсии которых неизвестны и одинаковы (малые независимые выборки)
- •§ 13. Сравнение выборочной средней с гипотетической генеральной средней нормальной совокупности а. Дисперсия генеральной совокупности известна.
- •§ 14. Связь между двусторонней критической областью и доверительным интервалом
- •§ 15. Определение минимального объема выборки при сравнении выборочной и гипотетической генеральной средних
- •§ 16. Пример на отыскание мощности критерия
- •§ 17. Сравнение двух средних нормальных генеральных совокупностей с неизвестными дисперсиями (зависимые выборки)
- •§ 18. Сравнение наблюдаемой относительной частоты с гипотетической вероятностью появления события
§ 7. Выборочный коэффициент корреляции
Как следует из предыдущего параграфа, выборочный коэффициент корреляции определяется равенством
.
где х, у—варианты (наблюдавшиеся значения) признаков Х и Y; nxy—частота пары вариант (х, у); n—объем выборки (сумма всех частот); ,—выборочные средние квадратические отклонения;, —выборочные средние.
Известно, что если величины Y и Х независимы, то коэффициент корреляции r=0 (см. гл. XIV, § 17); если ,г = ±1,тоY и Х связаны линейной функциональной зависимостью (см. гл. XIV, § 20). Отсюда следует, что коэффициент корреляции г измеряет силу (тесноту) линейной связи между Y и X.
Выборочный коэффициент корреляции rв является оценкой коэффициента корреляции г генеральной совокупности и поэтому также служит для измерения линейной связи между величинами—количественными признаками Y и X. Допустим, что выборочный коэффициент корреляции, найденный по выборке, оказался отличным от нуля. Так как выборка отобрана случайно, то отсюда еще нельзя заключить, что коэффициент корреляции генеральной совокупности также отличен от нуля. Возникает необходимость проверить гипотезу о значимости (существенности) выборочного коэффициента корреляции (или, что то же, о равенстве нулю коэффициента корреляции генеральной совокупности). Если гипотеза о равенстве нулю генерального коэффициента корреляции будет отвергнута, то выборочный коэффициент корреляции значим, а величины Х и Y коррелированы; если гипотеза принята, то выборочный коэффициент корреляции незначим, а величины Х и Y не коррелированы.
Проверка гипотезы о значимости выборочного коэффициента корреляции для случая нормальной корреляции изложена далее (см. гл. XIX, § 21).
Если выборка имеет достаточно большой объем и хорошо представляет генеральную совокупность (репрезентативна), то заключение о тесноте линейной зависимости между признаками, полученное по данным выборки, в известной степени может быть распространено и на генеральную совокупность. Например, для оценки коэффициента корреляции rг нормально распределенной генеральной совокупности (при n ≥ 50) можно воспользоваться формулой
.
Замечание 1. Знак выборочного коэффициента корреляции совпадает со знаком выборочных коэффициентов регрессии,» что следует из формул (см. § 6):
; . (*)
Замечание 2. Выборочный коэффициент корреляции равен среднему геометрическому выборочных коэффициентов регрессии. Действительно, перемножив левые и правые части равенств (*), получим
.
Отсюда
.
Знак при радикале в соответствии с замечанием 1 должен совпадать со знаком коэффициентов регрессии.
§ 8. Методика вычисления выборочного коэффициента корреляции
Пусть требуется по данным корреляционной таблицы вычислить выборочный коэффициент корреляции. Можно значительно упростить расчет, если перейти к условным вариантам (при этом величина rв не изменится)
ui=(xi—С1)/h1 и υj=:(yj—С2)/h2.
В этом случае выборочный коэффициент корреляции вычисляют по формуле
.
Величины u, υ и можно найти методом произведений (см. гл. XVII, § 4), а при малом числе данных— непосредственно исходя из определений этих величин. Остается указать способ вычисления , где — частота пары условных вариант (u, υ).
Можно доказать, что справедливы формулы (см. пояснение в конце параграфа):
, где ,
, где .
Для контроля целесообразно выполнить расчеты по обеим формулам и сравнить результаты; их совпадение свидетельствует о правильности вычислений.
Покажем на примере, как пользоваться приведенными формулами.
Пример 1. Вычислить ^ "по"" П0 данным корреляционной табл. 14.
Таблица 14
Y
|
X
|
ny
| |||||
10
|
20
|
30
|
40
|
50
|
60
| ||
15
|
5
|
7
|
—
|
—
|
—
|
—
|
12
|
25
|
—
|
20
|
23
|
—
|
—
|
—
|
43
|
35
|
—
|
—
|
30
|
47
|
2
|
—
|
79
|
45
|
—
|
—
|
10
|
11
|
20
|
6
|
47
|
55
|
—
|
—
|
—
|
9
|
7
|
3
|
19
|
nx
|
5
|
27
|
63
|
67
|
29
|
9
|
n=200
|
Решение. Перейдем к условным вариантам: ui=(xi—С1)/h1 = = (xi —40)/10 (в качестве ложного нуля С1 взята варианта х=40. расположенная примерно в середине вариационного ряда; шаг h1 равен разности между двумя соседними вариантами: 20—10 = 10) и υj=:(yj—С2)/h2 = (yj —35)/10 (в качестве ложного нуля С2 взята варианта у =35, расположенная в середине вариационного ряда; шаг h2 равен разности между двумя соседними вариантами: 25—15=10).
Составим корреляционную таблицу в условных вариантах. Практически это делают так: в первом столбце вместо ложного нуля С2 (варианты 35) пишут 0; над нулем последовательно записывают —1, —2; под нулем пишут 1, 2. В первой строке вместо ложного нуля С1 (варианты 40) пишут 0; слева от нуля последовательно записывают —1, —2, —3; справа от нуля пишут 1, 2. Все остальные данные переписывают из первоначальной корреляционной таблицы. В итоге получим корреляционную табл. 15 в условных вариантах.
Таблица 15
υ
|
|
|
u
|
nυ
| |||
-3
|
-2
|
- 1
|
0
|
1
|
2
| ||
—2
|
5
|
7
|
—
|
—
|
—
|
—
|
12
|
—1
|
—
|
20
|
23
|
—
|
—
|
—
|
43
|
0
|
—
|
—
|
30
|
47
|
2
|
—
|
79
|
1
|
—
|
—
|
10
|
11
|
20
|
6
|
47
|
2
|
—
|
—
|
—
|
9
|
7
|
3
|
19
|
nu
|
5
|
27
|
63
|
67
|
29
|
9
|
n = 200
|
Теперь для вычисления искомой суммы составим расчетную табл. 16. Пояснения к составлению табл. 16:
1. В каждой клетке, в которой частота nuυ ≠ 0, записывают в правом верхнем углу произведение частоты nuυ на варианту u. Например, в правых верхних углах клеток первой строки записаны произведения: 5·(—3) = —15; 7·(—2) = —14.
2. Складывают все числа, помещенные в правых верхних углах клеток одной строки и их сумму записывают в клетку этой же строки столбца u. Например, для первой строки U == —15+(—14)= —29.
3. Умножают варианту υ на U и полученное произведение заци-сывают в последнюю клетку той же строки, т. е. в клетку столбца υU. Например, в первой строке таблицы υ = —2, U = —29; следовательно, υU = (—2)·(—29) = 58.
4. Наконец, сложив все числа столбца υU, получают сумму , которая равна искомой сумме . Например, для табл. 16 имеем = 169; следовательно, искомая сумма = 169.
Таблица 16
υ |
u
ч 1
|
U= = |
υU | |||||
-3
|
-2
|
—1
|
0
|
1
|
2
| |||
-2
|
—15 5 -10 |
-14 7 -14
|
—
|
—
|
—
|
—
|
—29
|
58
|
-1
|
—
|
—40 20 -20
|
—23 23 —23
|
—
|
—
|
—
|
-63 |
63
|
0
|
—
|
—
|
-30 30 0
|
0 47 0
|
2 2 0
|
—
|
—28
|
0
|
1
|
—
|
—
|
—10 10 10
|
0 11 11
|
20 20 20
|
12 6 6
|
22
|
22
|
2
|
—
|
—
|
—
|
0 9 18
|
7 7 14
|
6 3 6
|
13
|
26
|
V= =
|
—10
|
-34
|
—13
|
29
|
34
|
12
|
|
= =169
|
uV
|
30
|
68
|
13
|
0
|
34
|
"
|
==169 |
Контроль
|
Для контроля аналогичные вычисления производят по столбцам:
произведения nuυυ записывают в левый нижний угол клетки, содержащей частоту nuυυ ≠ 0; все числа, помещенные в левых нижних углах клеток одного столбца, складывают и их сумму записывают в строку V; далее умножают каждую варианту u на V и результат записывают в клетках последней строки.
Наконец, сложив все числа последней строки, получают сумму , которая также равна искомой сумме . Например, для табл. 16 имеем = 169; следовательно,= 169.
Теперь, когда мы научились вычислять , приведем пример на отыскание выборочного коэффициента корреляции.