Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Математическая статистика.doc
Скачиваний:
10
Добавлен:
24.04.2019
Размер:
291.33 Кб
Скачать

1.4. Эмпирическая функция распределения

Выборочной (эмпирической) функцией распределения называют функцию F*(x), определяющую для каждого значения х относительную частоту события X < x. Таким образом, , где пх – число вариант, меньших х, п – объем выборки.

Из определения эмпирической функции распределения видно, что ее свойства совпадают со свойствами F(x), а именно:

1) 0 ≤ F*(x) ≤ 1.

2) F*(x) – неубывающая функция.

3) Если х1 – наименьшая варианта, то F*(x) = 0 при хх1; если хк – наибольшая варианта, то  F*(x)  = 1 при х > хк .

Пример

1

4

6

10

15

25

n=50

При

При , наблюдается 10 раз

При , наблюдается 25 раз

§2 Статистические оценки параметров распределения

2.1. Статистические оценки

Пусть требуется изучить количественный признак генеральной совокупности. Допустим теоретически удалось установить, какое именно распределение имеет признак. Возникает задача оценки параметров, которыми определяется это распределение.

Точечной называют статистическую оценку, которая определяется одним числом , где - результаты наблюдений над количественным признаком (выборка).

Несмещенной называют статистическую оценку , математическое ожидание которой равно оцениваемому параметру при любом объеме выборки, т. е. М( )=

Смещенной называют оценку, математическое ожидание которой не равно оцениваемому параметру.

Эффективной называют статистическую оценку, которая (при заданном объеме выборки n) имеет наименьшую  возможную дисперсию.

При рассмотрении выборок большого объема (n велико!) к статистическим оценкам предъявляется требование состоятельности.

Однако несмещенность не является достаточным условием хорошего приближения к истин-ному значению оцениваемого параметра. Если при этом возможные значения Θ* могут значительно отклоняться от среднего значения, то есть дисперсия Θ* велика, то значение, найденное по данным одной выборки, может значительно отличаться от оцениваемого параметра. Следовательно, требуется наложить ограничения на дисперсию.

Состоятельной называется статистическая оценка, которая при п→∞ стремится по вероятности к оцениваемому параметру (если эта оценка несмещенная, то она будет состоятельной, если при п→∞ ее дисперсия стремится к 0).

2.2.Точечные оценки выборки

Генеральная средняя.

Пусть изучается генеральная совокупность относительно количественного признака Х.

Генеральной средней называют среднее арифметическое значений признака генеральной совокупности.

Если все значения признака различны, то

Если значения признака имеют частоты N1, N2, …, Nk, где N1 +N2+…+Nk= N, то

Выборочная средняя.

Пусть для изучения генеральной совокупности относительно количественного признака Х извлечена выборка объема n.

Выборочной средней называют среднее арифметическое значение признака выборочной совокупности.

Если все значения признака выборки различны, то

если же все значения имеют частоты n1, n2,…,nk, то

Выборочная средняя является несмещенной и состоятельной  оценкой генеральной средней.

Замечание: Если выборка представлена интервальным вариационным рядом, то за xi принимают середины частичных интервалов.

 

Генеральная дисперсия.

Для того чтобы охарактеризовать рассеяние значений количественного признака Х генеральной совокупности вокруг своего среднего значения, вводят сводную характеристику — генеральную дисперсию.

Генеральной дисперсией Dг называют среднее арифметическое квадратов отклонений значений признака генеральной совокупности от их среднего значения.

Если все значения признака генеральной совокупности объема N различны, то

Если же значения признака имеют соответственно частоты N1, N2, …, Nk, где N1 +N2+…+Nk= N, то

Кроме дисперсии для характеристики рассеяния зна­чений признака генеральной совокупности вокруг своего среднего значения пользуются сводной характеристикой— средним квадратическим отклонением.

Генеральным средним квадратическим отклонением (стандартом) называют квадратный корень из генеральной дисперсии:

Выборочная дисперсия.

Для того, чтобы наблюдать рассеяние количественного признака значений выборки вокруг своего среднего значения, вводят сводную характеристику - выборочную дисперсию.

Выборочной дисперсией называют среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения .

Если все значения признака выборки различны, то

 если же все значения имеют частоты n1, n2,…,nk, то

Для характеристики рассеивания значений признака выборки вокруг своего среднего значения пользуются сводной характеристикой - средним квадратическим отклонением.

Выборочным средним квадратическим отклоненим называют квадратный корень из выборочной дисперсии:

Так же, как в теории случайных величин, можно доказать, что справедлива следующая формула для вычисления выборочной дисперсии: .

Пример 1. Найдем числовые характеристики выборки, заданной статистическим рядом

xi

2

5

7

8

ni

3

8

7

2

Вычисление дисперсии - выборочной или генеральной, можно упростить, используя формулу:

Замечание: если выборка представлена интервальным вариационным рядом, то за xi принимают середины частичных интервалов.

Исправленная дисперсия.

Выборочная дисперсия является смещенной оценкой генеральной дисперсии, т.е. математическое ожидание выборочной дисперсии не равно оцениваемой генеральной дисперсии, а равно

,

где DГ – истинное значение дисперсии генеральной совокупности.

Для исправления выборочной дисперсии достаточно умножить ее на дробь

В качестве оценки генеральной дисперсии принимают исправленную дисперсию s², вычисляемую по формуле

.

Такая оценка будет являться несмещенной. Ей соответствует исправленное среднее квадратическое отклонение

.

Для оценки среднего квадратического генеральной совокупности используют исправленное среднее квадратическое отклонение

Замечание: формулы для вычисления выборочной дисперсии и исправленной дисперсии отличаются только знаменателями. При достаточно больших n выборочная и исправленная дисперсии мало отличаются, поэтому на практике исправленной дисперсией пользуются, если n<30.

Пример

xi

1

2

3

4

n1

20

15

10

5

Коэффициент вариации применяют для сравнения вариации признаков сильно отличающихся по величине, или имеющих разные единицы измерения (разные наименования).

На практике считают, что если   33 % , то совокупность однородная.

Модой M0 называют варианту, которая имеет наиболь­шую частоту.

варианта

1

4

7

9

частота

5

1

20

6

мода равна 7.

Медианой тe называют варианту, которая делит ва­риационный ряд на две части, равные по числу вариант. Если число вариант нечетно, т. е. , то , при четном п=2k медиана

Например, для ряда 2 3 5 6 7 медиана равна 5; для ряда2 3 5 6 7 9

медиана равна