Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Маленькая шпора.docx
Скачиваний:
34
Добавлен:
26.09.2019
Размер:
1.03 Mб
Скачать
  1. Понятие генеральной совокупности и выборки. Эмпирические аналоги параметров генеральной совокупности. Два взгляда на выборку. Вероятностные свойства выборочных характеристик.

Генеральная совокупность – множество всех мыслимых наблюдений, которые могут быть сделаны при данном комплексе условий. Комплекс условий определяет вариацию признака в определенных пределах. Ген. Совокупность – конечная и бесконечная

Выборочная совокупность - это мн-во случайно отобранных из ген. совокупности объектов. Выборка должна быть репрезентативной – правильно отображать пропорции ген. сов.т.е каждый элемент ген. сов. имеет равные шансы попасть в выборку.

Аналоги: Распределение случайной величины Х в генеральной совокупности носит теоретический, идеальный характер, а ее выборочный аналог является эмпирическим распределением. Эмпирическим распределением называется распределение, которое каждому элементу выборки х1,…,хn ставит в соответствие p=1/n. - аналог мат. Ожид

- аналог диспр, аналог p, - аналог сред.квадр. откл

2 взгляда на выборку: выборка - х1,…,хn  - n-наблюденных значений СВ, т.е. т чисел. Используется для расчета , , S,

выборка - х1,…,хn – n-независимых одинаково распределённых СВ, ЗР которых совпадает с распределением ген. сов. , то для любых i=1…n

, то для любых i=1…n

Вероятностные свойства выборочных характеристик. Все выборочные характеристики ( , , S, ) являются СВ, как функции от СВ . Параметры ген. совокупности , , , p - неслучайные величины и могут быть оценены по выборке.

  1. Выборочные моменты. Вывести формулы, устанавливающие связь между центральными и начальными выборочными моментами для

Выборочные моменты — это оценка теоретических моментов распределения на основе выборки.

Выборочный момент порядка  — это СВ, Центральный момент к-порядка:

Связи:

  1. Характеристики ряда распределения. Мода и медиана вариационного ряда. Вывести соотношения между выборочными коэффициентами асимметрии ( и ), эксцесса ( и ) и вариации ( и ) случайных величин Х и Y , полученных по выборке объёма n, если известно, что , где a и b – константы.

Медиана – значение признака ряда, относительно которого ряд делится на 2 равные по числу признаков части.

1.при нечетном числе наблюдений n=2l-1 - значению признака Х, приходящегося на середину ранжированного ряда наблюдений: 2.при четном числе наблюдений n=2l –средней арифметической двух значений, расположенных в середине ранжированного ряда Для интервального ряда медиана вычисляется по формуле:

Где h – длина интервала, n – объем выборки

Мода – значение признака, которому соответствуют наибольшая частота. Для одномодального интервального ряда вычисление моды производится по формуле

Коэффициент асимметрии – показатель асимметричности распределения, определяющий степень скошенности кривой по сравнению с нормальным распределением, и вычисляемый по формуле: Для симметричных В.Р. Ас=0, для правосторонней асимметрии – Ас >0, левосторонней – Ас<0. Если |Ас|>0,5, то асимметрия существенна. Коэффициент эксцесса – показатель, служащий мерой крутости (плосковершинности или островершинности) графику В.Р. в сравнении с кривой нормального распределения, определяемый по формуле: Если Ек>0, то график островершинный, Ек<0 – плосковершинный. Коэффициент вариации – безразмерный показатель меры рассеяния значений изучаемого признака и равный процентному отношению среднего квадратического отклонения к средней арифметической: , соотношения для Y=aX+b

Х и У: , и :

и :

и :

и :

  1. Точечные оценки и их свойства. Проверить оценки математического ожидания и дисперсии нормальной генеральной совокупности ( , S2 и Ŝ2), полученные по выборке , на несмещенность и состоятельность.

Существует 2 вида оценивания численных значений параметров ген. сов. – интервальное и точечное. Точечной оценкой параметра θ называют функцию от результатов наблюдений (х1, х2,… хn), значение которой принимают за наилучшее приближение к оцениваемому параметру θ.

Свойства:

Статистическая оценка параметра н-ся несмещенной, если при любой объеме выборки n её математическое ожидание равно оцениваемому параметру: .Если оценка является смещенной, то смещение определяется как . Требование несмещенности является минимальным требованием, т.к. зная величину смещения, оценку можно всегда скорректировать.

Статистическая оценка параметра называется состоятельной, если она удовлетворяет закону больших чисел, т.е. при сходится по вероятности к оцениваемому параметру: или . >0. Свойство состоятельности – одно из главных, т.к. в только в этом случае имеет смысл увеличивать объем выборки для повышения точности.

С татистическая оценка параметра н-ся эффективной, если при заданном объеме выборки она имеет наименьшую возможную дисперсию среди всех возможных несмещенных оценок. Эффективность оценки характеризует средний квадрат отклонения оценки от оцениваемого параметра . ( - При этом, согласно неравенству Рао-Камера, дисперсия любой несмещенной оценки параметра ограничена снизу: ,где - плотность. Эффективность оценки определяется отношением )=

Статистическая оценка параметра называется достаточной, если условное распределение не зависит от для всех возможных значений , содержит всю информацию об оцениваемом параметре. Достаточность определяют с помощью критерия факторизации, когда функция правдоподобия L(Х1,…,Хn/ ) может быть представлена в виде произведений двух сомножителей: 1-й зависит от и ,а 2-й от результатов наблюдения . То есть L(Х1,…,Хn/ ) = G ( ; ) * Н(Х1,…,Хn). Эффективная оценка является и достаточной.

, несмещенная оценка , Bn=0 => оценка несмещенная

оценка состоятельности:

1)Bn=0,

5. Эффективность и асимптотическая эффективность точечной оценки. Неравенство Рао-Крамера. Доказать, что средняя арифметическая , полученная по результатам выборки из генеральной совокупности, имеющей экспоненциальный закон распределения с плотностью:

является эффективной оценкой параметра λ.

Точечная оценка – некоторая ф-ия результатов наблюдений (х1…хn), значение которой принимают за наилучшее приближение в данных условиях к значению параметра Q ген. Совокупности Х.Статистическая оценка параметра н-ся эффективной, если при заданном объеме выборки она имеет наименьшую возможную дисперсию среди всех возможных несмещенных оценок. Эффективность оценки характеризует средний квадрат отклонения оценки от оцениваемого параметра . ( - .

Неравенство Рао-Крамера ограничивает дисперсию любой несмещенной оценки параметра Q снизу:

.

Количество информации Фишера о параметре Q,содержащейся в единичном наблюдении

= . Эффективность параметра определяется соотношением . Если совпадает с нижней границей, то оценка эффективна.Однако существование эффективной оценки это довольно сильное требование на задачу. Более слабым является условие асимптотической эффективности, которое означает, что отношение дисперсии несмещенной оценки к нижней границе Крамера-Рао стремится к единице при ,т.е. Решение =x ср

=> несмещенная , => состоятельная = = = , I = M ( ) =M ( ) = M(x- ) = = = .

т.к. ,то оценка эффективна. Эффективная оценка является и достаточной