Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Основные элементы матстатистики.doc
Скачиваний:
1
Добавлен:
23.08.2019
Размер:
482.82 Кб
Скачать

§33. Выборочные характеристики вариационного ряда

Пусть выборка задана вариационным рядом

. . .

. . .

 , где

Выборочным средним называется величина

Выборочная дисперсия а корень квадратный из выборочной дисперсии называется выборочным средним квадратическим отклонением

Выборочные начальные и центральные моменты порядка определяются соответственно формулами:

Модой называется вариант, наиболее часто встречающийся в данном вариационном ряду.

Медианой называется вариант такой, что и Медиана обладает тем свойством, что сумма абсолютных величин отклонений вариантов от медианы меньше, чем от любой другой величины (в том числе и от выборочной средней).

Важность эмпирических характеристик заключается в том, что они близки (при достаточно большом ) к соответствующим теоретическим значениям. Поскольку выборочные характеристики являются случайными величинами, а теоретические - числа, то близость понимается в смысле сходимости по вероятностям.

Допустим, что все значения количественного признака разбиты на групп. Рассматривая каждую группу как самостоятельную совокупность, можно найти групповые средние и дисперсии.

Внутригрупповой дисперсией называют среднюю арифметическую дисперсий, взвешенную по объемам групп:

- объем группы , .

Межгрупповой дисперсией называют дисперсию групповых средних относительно общей средней:

.

§34. Доверительный интервал

Доверительным называется интервал, который с заданной надежностью покрывает оцениваемый параметр.

Для оценки математического ожидания случайной величины , распределенной по нормальному закону, при известном среднем квадратическом отклонении служит доверительный интервал

где - точность оценки, - объем выборки, - выборочное среднее, - аргумент функции Лапласа, при котором

Если среднее квадратическое отклонение неизвестно, то для оценки служит доверительный интервал

где находится в приложении 4 по заданным и , а вместо часто бывает возможно подставить любую из оценок

- исправленное среднеквадратическое, статистическое среднеквадратическое отклонения соответственно. При увеличении обе оценки и будут различаться сколь угодно мало и будут сходиться по вероятностям к одной и той же величине .

§35. Выборочный коэффициент корреляции

Понятие корреляции является одним из основных понятий теории вероятностей и математической статистики, оно было введено Гальтоном и Пирсоном.

Закон природы или общественного развития может быть представлен описанием совокупности взаимосвязей. Если эти зависимости стохастичны, а анализ осуществляется по выборке из генеральной совокупности, то данная область исследования относится к задачам стохастического исследования зависимостей, которые включают в себя корреляционный, регрессионный, дисперсионный и ковариационный анализы. В данном разделе рассмотрена теснота статистической связи между анализируемыми переменными, т.е. задачи корреляционного анализа.

В качестве измерителей степени тесноты парных связей между количественными переменными используются коэффициент корреляции (или то же самое "коэффициент корреляции Пирсона") и корреляционное отношение.

Пусть при проведении некоторого опыта наблюдаются две случайные величины и , причем одно и то же значение встречается раз, раз, одна и та же пара чисел ( наблюдается раз. Все данные записываются в виде таблицы, которую называют корреляционной.

Выборочная ковариация величин и определяется формулой

где , а , - выборочные средние величин и . При небольшом количестве экспериментальных данных удобно находить как полный вес ковариационного графа:

Рис. 101

Выборочный коэффициент корреляции находится по формуле

где - выборочные средние квадратические отклонения величин и .

Выборочный коэффициент корреляции показывает тесноту линейной связи между и : чем ближе к единице, тем сильнее линейная связь между и .

Корреляционной зависимостью от называют функциональную зависимость условной средней от .

представляет уравнение регрессии на , а - уравнение регрессии на .

Корреляционная зависимость может быть линейной и криволинейной. В случае линейной корреляционной зависимости выборочное уравнение прямой линии регрессии на имеет вид:

Параметры и уравнения прямой линии регрессии на можно находить по методу наименьших квадратов из системы уравнений

Для оценки тесноты нелинейной корреляционной связи вводят выборочные корреляционные отношения. Выборочным корреляционным отношением к называют отношение межгруппового среднего квадратического отклонения к общему среднему квадратическому отклонению признака :

, или в других обозначениях

и если , то признак c признаком корреляционной зависимостью не связан, а если , то признак связан c признаком функциональной зависимостью.