Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
теория вероятности.doc
Скачиваний:
156
Добавлен:
24.02.2016
Размер:
1.17 Mб
Скачать

18. Основные распределения в статистике. Распределение хи-квадрат. Распределение Стьюдента. Распределение Фишера.

Распределение ²

Пусть независимые случ.величины ξi где распределены по нормальному закону распределения, причемM[ξi]=0, а средн.квадратич. отклонение=1, тогда величина ξi распределена по закону ² с n степенями свободы.

ξi распределено по норм.закону-это значит,что:

-гамма функция

m-положительна Г(m+1)=Г(m)

m-целое Г(m)=(m-1)!

Распределение ² опред.одним параметром - числом степеней свободы n

f(x) - называется графиком Пирснона

Они ассиметричны и начинаются с n>2, имею один максимум в значении x=n-2

Характериситческая ф-ция

Распределение Стьюдента:

Пусть V не зависит от Z и V распределена по закону ², и есть n степеней свободы, тогда вводим величину

, тогда величина T имеет распределение Стьюдента t с n-степенями свободы.

Плотность распределения:

Графики fT(x) наз.кривыми Стьюдента, симметрична при всех n = 1,2,... относительно оси ординат.

С возрастанием числа степеней свободы распр-е Стьюдента быстро приближается к нормальному.

Распределение Фишера:

-независимые случ.величины, распределены по нормальному закону ² с n и m степенями свободы,

тогда

распределение Фишера с n и m степенями свободы.

Плотность этого распределения:

где

Распределение Фишера определяется 2-мя параметрами – числами степеней свободы.

19. Статистические оценки. Точечные оценки. Метод максимального правдоподобия. Метод наименьших квадратов. Интервальные оценки.

Стат.оценкой неизвестного параметра теоретического распределения нзв ф-цию от наблюдаемых случайных величин.

Несмещенной нзв стат.оценку, мат.ожид.к-рой равно оцениваемому параметру  при любом объеме выборки, т.е. M[*]=.

Смещенной нзв оценку, мат.ожид.к-рой не равно оцениваемому параметру.

Эффективной нзв оценку, к-рая (при заданном объеме выборки n) имеет наименьшую возможную дисперсию.

Состоятельной нзв оценку, к-рая при n∞ стремится по вероятности к оцениваемому параметру. Например, если дисперсия несмещенной оценки при n∞ стремится к 0, то такая оценка оказывается и состоятельной.

Точечные оценки

Точечной нзв оценку, к-рая опред-ся одним числом, например: генеральная средняя, выборочная средняя, групповая и общая средние, генеральная дисперсия, выборочная дисперсия и др.

xi – значения выборки

При выборке малого объема точечная оценка может знач.отличаться от оцениваемого параметра, т.е. приводить к грубым ошибкам. По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками.

Несмещенной оценкой генеральной средней (мат ожидания) служит выборочная средняя

,где xi –варианта выборки, ni-частота

варианты xi, -объем выборки.

Замечание1.Если первоначальные варианты xi-большие числа,то для упрощения расчета из каждой варианты одно и то же число С,т.е. перейти к условным вариантам ui=xi-C, тогда .

Смещенной оценкой генеральной дисперсии служит выборочная дисперсия

,эта оценка является смещенной, т к

Замечание2.Если первоначальные варианты xi-большие числа, то целесообразно вычесть из всех вариант одно и то же число C,равное выборочной средней или близкое к ней,т.е. перейти к условным вариантам ui=xi-C (дисперсия при этом не изменится).

Тогда

Замечание 3. Если первоначальные варианты являются десятичными дробями с k десятичными знаками после запятой, то, чтобы избежать действий с дробями,умножают первоначальные варианты на постоянное число C=10k,т.е. переходят к условным вариантам ui=Cxi . При этом дисперсия увеличится в C2 раз. Поэтому, найдя дисперсию условных вариант, надо разделить ее на C2:

Несмещенной оценкой генеральной дисперсии служит исправленная выборочная дисперсия

В условных вариантах она имеет вид

Причем если ui=xi-C,то s2x=; еслиui=Cxi , то s2x=,то s2x=/C2.

Примечание 4. При большом числе данных используют метод произведений или метод сумм.

Метод максимального правдоподобия.

Метод м.п. точечной оценки неизвестных параметров заданного распределения сводится к отысканию максимума ф-ции одного или нескольких оцениваемых параметров.

А) Дискретные случ величины. Пусть Х-дискретная случ величина,кот в результате n опытов приняла возможные значения х12..хn.Допустим,что вид закона распределения случ велич Х задан,но неизвестен параметр ,которым определяется этот закон;требуется найти его точечную оценку *=*( х12..хn).

Обозначим вероятность того,что в результате испытания величина Х примет значение хi через p(xn; ).

Функцией правдоподобия дискретной случайной величины Х назыв ф-цию аргумента :

L(х12..хn; )=p(x1; )* p(x2; )… p(xn; ) .

Оценкой наибольшего правдоподобия параметра  назыв такое его значение *,при кот ф-ция правдоподобия достигает максимума.Функции L и lnL достигают максимума при одном и том же значении ,поэтому вместо отыскания максимума ф-ции L ищут,что удобнее,максимум ф-ции lnL.

Логарифмической ф-цией правдоподобия назыв ф-цию lnL.Точку максимума ф-ции lnL аргумента  можно искать,например,так:

1.найти производную

2.приравнять производную 0 и найти критич точку *-корень получ ур-ия (ур-ия правдоподобия)

3.найти вторую производную ,если вторая производная при=* отрицательна,то *-точка максимума. Найденную точку максимума * принимают в качестве оценки наибольшего правдоподобия параметра .

Б) Непрерывные случайные величины. Пусть Х-непрерывн случ велич,которая в результате n испытаний приняла значения х12..хn. Допустим,что вид плотности распределения-ф-ции f(x) – задан,но неизвестен параметр θ,которым определяется эта ф-ция. Ф-ией правдоподобия непрерывной случ величины Х назыв ф-цию аргумента :

L(х12..хn; )=f(x1; )* f(x2; )… f(xn; ).

Оценку наибольшего правдоподобия неизвестного параметра распределения непрерывной случ величины ищут также,как в случае дискретной случ величины.

Если плотность распределения f(x) непрерывной случ величины определяется двумя неизвестными параметрами 1и 2,то ф-ция правдоподобия есть ф-ция двух независ аргументов 1и 2:

L= f(x1; 1, 2)* f(x2; 1, 2)… f(xn; 1, 2). Далее находят логарифмическую ф-цию правдоподобия и для отыскания ее максимума составл и решают систему

Метод наименьших квадратов

а0, а1,…,an

(m+1) уравнений

y=ax+b

(x1, y1), (x2, y2)…

Интервальные оценки

Интервальной нзв оценку, к-рая определяется двумя числами – концами интервала. Инт.оценки позволяют установить точность и надежность оценок.

Надежностью (доверительной вероятностью) оценки  по * нзв вер-ть γ, с к-рой осуществл.нерав-во | - *|<δ. Заменив нерав-во | - *|<δ равносильным ему двойным нерав-вом -δ< - *<δ или *-δ<<δ+* имеем

Доверительным нзв интервал (*-δ, *+δ), к-рый покрывает неизвестный параметр с заданной надежностью γ.

1.Интервальной оценкой (с надежностью γ) математического ожидания а нормально распределенного количественного признака X по выборочной средней при известном среднем квадратическом отклонении σ генеральной совокупности служит доверительный интервал

Где - точность оценки,n-объем выборки, t-значение аргумента ф-ции Лапласа Ф(t),при котором Ф(t)=γ/2; при неизвестном σ (и объеме выборки n<30)

где s-«исправленное» выборочное среднее квадратическое отклонение, tγ находят по таблице по заданным n и γ.

2. Интервальной оценкой (с надежностью γ) среднего квадратического отклонения σ нормально распределенного количественного признака X по «исправленному» выборочному среднему квадратическому отклонению s служит довер. инт-л

(при q<1)

(при q>1)

Где q находят по таблице по заданным n и γ

3. Интервальной оценкой (с надежностью γ) неизвестной вер-ти p биноминального распред-я по относ. частоте ω служит довер.инт-л (с приближ. концами p1 и p2)

где

Где n-общее число испытаний; m-число появлений событий; ω-относ.частота, равная отношению m/n;t-значение аргумента ф-ции Лапласа, при к-ром Ф(t)=γ/2(γ-заданная надежность).

Замечание. При больших значениях n (порядка сотен) можно принять в кач-ве приближ.границ довер.инт-ла

20. Статистическая проверка гипотез. Основные понятия. Статистический критерий, ошибки 1-го и 2-го родов, уровень значимости и мощность критерия. Критерий согласия Пирсона. Проверка гипотезы о значении параметров нормального распределения. Проверка гипотезы о законе распределения случайной величины.

Статистическая проверка гипотез. Основные понятия. Уровень значимости и мощности критерия

Статистической гипотезой наз всякое непротиворечивое множество утверждений относительно закона распределения случайной величины.

Статистикой нзв произвольная функция Z = φ(Zn) выборки Zn, для значений к-рой известны условные плотности распределения f(z|H0) и f(z|H1) относительно проверяемой гипотезы H0 и конкурирующей с ней альтернативной гипотезы H1. Из опред следует, что Z есть СВ. Практическое применение мат. статистики состоит в проверке соответствия результатов экспериментов предполагаемой гипотезе. С этой целью строится процедура (правило) проверки гипотезы. Критерием согласия называется правило, в соответствии с которым по реализации статистики Z, вычисленной на основании апостериорной выборки zn, гипотеза H0 принимается или отвергается. Критической областью G называется область реализаций z статистики Z, при которых гипотеза H0 отвергается. Доверительной областью G называется область значений z статистики Z, при которых гипотеза H0 принимается. Уровнем значимости α критерия согласия называется вероятность события, стоящего в том, что гипотеза H0 отвергается, когда она верна, т.е.

α =P{ZG|H0}

где вероятность P соответствует условной плотности распределения f(z|H0). Мощностью γ критерия согласия называется вероятность события, состоящего в том, что гипотеза H0 отвергается, когда она неверна, т.е.

γ=P{ZG|H1}

где вероятность P соответствует условной плотности f(z|H1). Критической точкой zβ называется точка на оси Oz, являющаяся квантилем уровня

β=1 – α

распределения F(z|H0), соответствующего плотности распределения f(z|H0). На рис. показана графическая интерпретация введенных понятий, где β + α = 1, δ + γ = 1.

Статистический критерий, ошибки 1-го и 2-го родов

Ошибка 1-го рода состоит в отклонении гипотезы, если она верна (пропуск цели).

Вероятность совершения ошибки 1-го рода обозначается α и наз. Уровнем значимости.

Ошибка 2-го рода – гипотеза принимается, если она неверна – β (ложное срабатывание).

Вероятность не совершить ошибку 2-го рода (1-β) наз. ложностью критерия.

Критерием (статистическим критерием) наз. случайная величина , которая позволяет принять или отклонить нулевую гипотезу.

Проверка гипотез о законе распределения случайной величины. Критерий согласия Пирсона.

Пусть имеется апостериорная выборка zn и требуется проверить гипотезу H0, состоящую в том, что непрерывная СВ X имеет определенный закон распределения f(x) (например, нормальный, равномерный и т.д.). Истинный закон распределения f(x) неизвестен. Для проверки такой гипотезы обычно используют критерий согласия хи-квадрат χ² (критерий Пирсона).

Критерием согласия называется критерий, использованный для проверки гипотез о предполагаемом законе распределения.

Проверка состоит в следующем:

1)Строится интервал - статистический ряд и гистограмма

2) По виду гистограммы

3) На основе выборки находим точечные оценки

4) Интервал возможных значений разбиваем на m непересекаемых интервалов. В каждом из них фиксируем число показаний

5) Вычисляем вероятность показаний ξ в каждом интервале

6) Строим критерий χ²

Аналитическое выражение плотности ²- сложное, поэтому задаем уровень значимости α; k; находим

Проверка гипотезы о значении параметров нормального распределения.

Пусть известно, что СВ X имеет нормальное распределение. Требуется проверить гипотезу H0, состоящую в том, что mX = m (m - некоторое фиксированное число), используя апостериорную выборку zn. Возможны два случая: дисперсия (σX)2 известна или неизвестна.

1) Дисперсия известна

2) Дисперсия неизвестна

В качестве оценки вводим выборочную дисперсию

В качестве статистики:

Гипотезы о значении дисперсии