- •Реферат по математической статистике
- •Содержание
- •Вместо предисловия
- •Все о корреляции
- •Виды корреляции
- •Отрицательная и положительная корреляция
- •Самостоятельное вычисление корреляции
- •Пример вычисления корреляции
- •Расчет доверительных интервалов
- •Доверительный интервал для математического ожидания
- •Доверительный интервал для дисперсии
- •Доверительный интервал для корреляции
- •Проверка гипотез
- •Регрессия
- •Список литературы и источников Коэффициенты корреляции и их свойства
Пример вычисления корреляции
На таблице ниже представлены данные о среднемесячной заработной плате учителей РФ за 2012 год и данные о количестве медалистов в данном субъекте Российской Федерации (отношение количества медалистов к общему числу выпускников).
|
|
|
|
| ||||||||||||||||||||||||
|
|
|
|
| ||||||||||||||||||||||||
|
|
|
|
| ||||||||||||||||||||||||
|
|
|
|
| ||||||||||||||||||||||||
|
|
|
|
|
Чтобы определить корреляцию, применим формулу:
–ковариация случайных величин .
–среднеквадратичное отклонение .
Для того, чтобы отыскать ковариации и среднеквадратичные отклонения случайных величин, необходимо сначала найти их математические ожидания:
В нашем случае математическое ожидание величин можно найти с помощью среднего арифметического, значит:
Найдем дисперсию по формуле:
Чтобы облегчить вычисления, сведем все в таблицу:
хi-х |
yi-y |
(xi-x)^2 |
(yi-y)^2 |
4.95 |
-0.07 |
24.5025 |
0.0049 |
-7.95 |
-0.37 |
63.2025 |
0.1369 |
-6.95 |
-0.07 |
48.3025 |
0.0049 |
-7.75 |
5.23 |
60.0625 |
27.3529 |
-0.15 |
-0.87 |
0.0225 |
0.7569 |
17.85 |
-3.87 |
318.6225 |
14.9769 |
Далее определим среднеквадратичное отклонение наших величин по формуле:
Определим ковариацию по формуле:
Для упрощения сведем в таблицу данные:
хi-х |
yi-y |
(xi-x)(yi-y) |
4.95 |
-0.07 |
-0.3465 |
-7.95 |
-0.37 |
2.9415 |
-6.95 |
-0.07 |
0.4865 |
-7.75 |
5.23 |
-40.5325 |
-0.15 |
-0.87 |
0.1305 |
17.85 |
-3.87 |
-69.0795 |
Тогда искомая ковариация:
Применим формулу из 1) пункта:
Искомая корреляция равна -0.7132. Если коэффициент корреляции отрицательный, это означает наличие противоположной связи: чем выше значение одной переменной, тем ниже значение другой.
Расчет доверительных интервалов
Доверительный интервал - термин, используемый в математической статистике при интервальной оценке статистических параметров, что предпочтительнее при небольшом объёме выборки.
Доверительный интервал для математического ожидания
Найдем доверительный интервал для математического ожидания при условии, что дисперсия генеральной величины неизвестна, а доверительная вероятность равна 1 – α.
Для расчета доверительного интервала применим формулу:
x – среднее значение величины
–квантиль распределения Стьюдента с степенью свободы
–несмещенное выборочное стандартное отклонение
–объем выборки
Определим квантиль распределения Стьюдента, для этого воспользуемся стандартной таблицей:
возьмем равным 0,05.
Выберем значение = 2,571
Найдем S:
10.15
2.94
Подставим все известные значения в формулу из пункта 1):
Для M[X]:
Для M[Y]: