![](/user_photo/2706_HbeT2.jpg)
- •Основные элементы матстатистики
- •§32. Вариационный и статистический ряд
- •§33. Выборочные характеристики вариационного ряда
- •§34. Доверительный интервал
- •§35. Выборочный коэффициент корреляции
- •§36. Ранговая корреляция
- •§37. Статистические гипотезы
- •§38. Критерии Пирсона и Стьюдента
- •Алгоритм применения -критерия Стьюдента для сравнения оценки средних величин двух выборок
- •§19. Нормальный закон распределения
§33. Выборочные характеристики вариационного ряда
Пусть выборка задана вариационным рядом
|
|
|
. . . |
|
|
|
|
|
. . . |
|
, где
|
Выборочным средним называется
величина
Выборочная дисперсия
а
корень квадратный из выборочной
дисперсии называется выборочным
средним квадратическим отклонением
Выборочные начальные и центральные
моменты порядка
определяются
соответственно формулами:
Модой
называется
вариант, наиболее часто встречающийся
в данном вариационном ряду.
Медианой
называется
вариант
такой,
что
и
Медиана
обладает тем свойством, что сумма
абсолютных величин отклонений вариантов
от медианы меньше, чем от любой другой
величины (в том числе и от выборочной
средней).
Важность эмпирических характеристик заключается в том, что они близки (при достаточно большом ) к соответствующим теоретическим значениям. Поскольку выборочные характеристики являются случайными величинами, а теоретические - числа, то близость понимается в смысле сходимости по вероятностям.
Допустим, что все значения количественного признака разбиты на групп. Рассматривая каждую группу как самостоятельную совокупность, можно найти групповые средние и дисперсии.
Внутригрупповой дисперсией называют среднюю арифметическую дисперсий, взвешенную по объемам групп:
-
объем группы
,
.
Межгрупповой дисперсией называют дисперсию групповых средних относительно общей средней:
.
§34. Доверительный интервал
Доверительным называется интервал,
который с заданной надежностью
покрывает
оцениваемый параметр.
Для оценки математического ожидания
случайной
величины
,
распределенной по нормальному закону,
при известном среднем квадратическом
отклонении
служит
доверительный интервал
где
-
точность оценки,
-
объем выборки,
-
выборочное среднее,
-
аргумент функции Лапласа, при котором
Если среднее квадратическое отклонение
неизвестно,
то для оценки
служит
доверительный интервал
где
находится
в приложении 4 по заданным
и
,
а вместо
часто
бывает возможно подставить любую из
оценок
- исправленное среднеквадратическое,
статистическое среднеквадратическое
отклонения соответственно. При увеличении
обе
оценки
и
будут
различаться сколь угодно мало и будут
сходиться по вероятностям к одной и той
же величине
.
§35. Выборочный коэффициент корреляции
Понятие корреляции является одним из основных понятий теории вероятностей и математической статистики, оно было введено Гальтоном и Пирсоном.
Закон природы или общественного развития может быть представлен описанием совокупности взаимосвязей. Если эти зависимости стохастичны, а анализ осуществляется по выборке из генеральной совокупности, то данная область исследования относится к задачам стохастического исследования зависимостей, которые включают в себя корреляционный, регрессионный, дисперсионный и ковариационный анализы. В данном разделе рассмотрена теснота статистической связи между анализируемыми переменными, т.е. задачи корреляционного анализа.
В качестве измерителей степени тесноты парных связей между количественными переменными используются коэффициент корреляции (или то же самое "коэффициент корреляции Пирсона") и корреляционное отношение.
Пусть при проведении некоторого опыта
наблюдаются две случайные величины
и
,
причем одно и то же значение
встречается
раз,
раз,
одна и та же пара чисел (
наблюдается
раз.
Все данные записываются в виде таблицы,
которую называют корреляционной.
Выборочная ковариация
величин
и
определяется
формулой
где
,
а
,
-
выборочные средние величин
и
.
При небольшом количестве экспериментальных
данных
удобно
находить как полный вес ковариационного
графа:
Рис. 101
Выборочный коэффициент корреляции находится по формуле
где
-
выборочные средние квадратические
отклонения величин
и
.
Выборочный коэффициент корреляции
показывает
тесноту линейной связи между
и
:
чем ближе
к
единице, тем сильнее линейная связь
между
и
.
Корреляционной зависимостью
от
называют
функциональную зависимость условной
средней
от
.
представляет
уравнение регрессии
на
,
а
-
уравнение регрессии
на
.
Корреляционная зависимость может быть линейной и криволинейной. В случае линейной корреляционной зависимости выборочное уравнение прямой линии регрессии на имеет вид:
Параметры
и
уравнения прямой
линии
регрессии
на
можно
находить по методу наименьших квадратов
из системы уравнений
Для оценки тесноты нелинейной корреляционной связи вводят выборочные корреляционные отношения. Выборочным корреляционным отношением к называют отношение межгруппового среднего квадратического отклонения к общему среднему квадратическому отклонению признака :
,
или в других обозначениях
и если
,
то признак
c
признаком
корреляционной
зависимостью не связан, а если
,
то признак
связан
c признаком
функциональной
зависимостью.