- •9.Повторение испытаний, формула Бернулли.
- •10. Случайные величины, дискретные и непрерывные случайные величины.
- •11.Закон распределения дискретной случайной величины. Примеры.
- •16.Дисперсия появления события а в одном и нескольких независимых испытаниях.
- •17.Мат.Ожидание, дисперсия и среднее квадратичное отклонение среднего арифметического одинаково распределенных взаимно независимых случайных величин.
- •23. Нормальная кривая, ее вид при различных значениях параметров.
- •29. Критические точки и критические области распределения
- •30. Генеральная и выборочная совокупности.
- •32Точечные оценки параметров распределения.
- •36.Статистическое распределение двумерной величины (корреляционная таблица). Среднее значение и среднее квадратичное отклонение составляющих.
23. Нормальная кривая, ее вид при различных значениях параметров.
График плотности нормального распределения называют нормальной кривой (кривой Гаусса).Исследуем функцию у= 1.Очевидно,функция определена на всей оси х;2 При всех значениях х функция принимает положительные значения ;3. Предел функции при неограниченном возростании х равен нулю ;4.Исследуем функцию на экстремиум.Найдем производную : у =- Видно,что уˈ=0 при х=а,уˈ>0 при х<а,уˈ<0 при х>а.Следовательно ,при х=а функция имеет максимум равный 1\( 5. Разность х-а содержится в анлитическом выражении функции в квадрате .6. При х=а+ и х= вторая производная равна нулю,а при переходе через эти точки она меняет знак. Известно,что графики функций f(x) f (x- имеют одинаковую форму; сдвинув график f(x) в положительном направлении оси х на а единиц масштаба при а >0 или в отраправленицательном направлении при а<0,получим график f(x-a)Отсюда следует,что изменение величины параметра а не изменяет формы нормальной кривой,п приводит лишь к ее сдвигу вдоль оси Ох :вправо,если а возрастает, и влево,если а убывает. По-иному обстоит дело,если изменяется параметр . С возростанием максимальная ордината нормальной кривой убываент ,а сама кривая становится более пологой,она сжимается к ос Ох ; при убывании нормальная кривая становится более «островершинной» и растягивается в положительном направлении оси Оу.
24. Если предполагается нормальное распределение признака в генеральной совокупности, то получить ответ на этот вопрос очень просто. Как говорилось ранее, вероятность попадания нормально распределенной случайной величины в заданный интервал можно определить по функции распределения: или с помощью функции плотности вероятностей: P(x1<X<x2)= Итак, вероятность попадания с.в. U-->N(0;1) в заданный интервал: ,где Ф — принятое обозначение для функции нормированного нормального распределения которое имеет следующий вид:
, при этом .Часто представляет интерес вероятность попадания с.в. U-->N(0;1) в симметричный интервал. Тогда Учитывая свойства функции Лапласа, получаем. Интеграл, входящий в выражение, не выражается в элементарных функциях, поэтому для вычисления функции Ф(u) используют вспомогательную функцию — функцию Лапласа (интеграл вероятностей): который табулируется. Функция Лапласа является нечетной, т.е. Ф0(-u)=–Ф0(u).В книгах по теории вероятности приведена либо таблица значений функции Лапласа , либо .Чтобы найти вероятность попадания нормально распределенной случайной величины в заданный интервал с помощью функции Лапласа, сначала с.в. Х нормализуется, а затем используется следующая формула: Преобразуя формулу Лапласа-нечётную (P( )=2Ф( )), положив . Получим P(|X-a|< t)=2Ф(t) Правило 3-х сигм : если случайная величина распределена нормально,то абсолютная величина ее отклонения от мат ожидания не превосходит утроенного среднего квадратичного отклонения. На практике правило трех сигм применяется так: если распределние изучаемой величины неизвестно,но условие,указанное в приведенном правиле,выполняется,то есть основание предпологать,что изучаемая величина распределена нормально ; в противном случае она не распределена нормально.
25. Понятие о центральной предельной теоремеЦентральная предельная теорема была открыта русским математиком А. М. Ляпуновым. «Если случайная величина Х представляем собой сумму очень большого числа взаимно независимых случайных величин, влияние каждой их которых на всю сумму ничтожно мало, то Х имеет распределение, близкое к нормальному» Пускай Х1, Х2,…,Хn…-последовательность независимых случайных величин, каждая из которых имеет конечные математическое ожидание и дисперсию: M(Xk) =ak. D(Xk)=bk2. Введем обозначения: Обозначим функцию распределения нормированной суммы через . Говорят, что к последовательности Х1, Х2,… применима центральная предельная теорема, если при любом х функция распределения нормированной суммы при n стремится к нормальной функции распределения: В частности, если все случайные велечины Х1, Х2,…одинаково распределены, то к этой последовательности применима центральная предельная теорема, если дисперсии всех величин Хі(і=1,2,…)конечны и отличны от нуля. А. М. Ляпунов доказал, что если для >0 при n отношение Ляпунова стремится к нулю, то к последовательности Х1, Х2,…применима центральная предельная теорема. Сущность условия Ляпунова состоит в требовании, чтобы каждое слагаемое суммы оказывало на сумму ничтожное влияние.
26. Асимптотические формулы Лапласа Локальная теорема Муавра-Лапласа. Если npq > 9, то для расчетов используют приближение Муавра-Лапласа , где 0 < p < 1 , величина ограничена при n . Требование ограниченности величины xk означает, что при n величина k тоже должна расти вместе с величиной n. Точность формулы
растет, как с ростом величин n и k, так и по мере приближения к 0.5 величин p и q.Исследуем точность асимптотической формулы Муавра-Лапласа на следующем примере.ПРИМЕР 2. Точность формулы Муавра-Лапласа.Вычислим вероятность того, что случайная величина, имеющая биномиальное распределение, принимает значение, равное n/2 . Выполним вычисления для n = 10, 20, 50. Сравним результаты вычислений по формуле Бернулли и по приближенной формуле Муавра-Лапласа. Интегральная теорема Муавра-Лапласа. При n для схемы Бернулли при любых a и b справедлива формула
Отсюда следует, что вероятность того, что число успехов в n испытаниях Бернулли заключено между k1 и k2, можно вычислить по формуле
,где , , - функция Лапласа.Точность этой приближенной формулы растет с ростом n. Если значение npq сравнительно невелико, то лучшее приближение дает формула
,и для вычисления вероятности того, что число успехов в n испытаниях Бернулли заключено между k1 и k2, можно использовать формулу
, где , ПРИМЕР 3. Точность интегральных формул Муавра-Лапласа.Вероятность рождения мальчика p = 0.51, а девочки - q = 1 - p = 0.49. Найдем вероятность того, что среди 10 000новорожденных мальчиков будет не менее 4 000 и не более 5000. Вычисления проведем по формуле Бернулли и по приближенным интегральным формулам Муавра-Лапласа.
27. Теорема Пуассона. При большом количестве испытаний вычисления по формуле Бернулли становятся затруднительными. Однако в ряде случаев их можно заменить более простыми асимптотическими формулами. Одна из них основана на теореме Пуассона. Если число испытаний n и p 0 так, что np , > 0, то при любых k = 0, 1, 2, … . Это означает, что при больших n и малых p вместо вычислений по точной формуле можно воспользоваться приближенной формулой .На практике пуассоновским приближением пользуются при npq= np(1-p) < 9. Исследуем точность асимптотической формулы Пуассона на следующем примере.ПРИМЕР 1. Точность формулы Пуассона.В здании 1000 лампочек. Вероятность выхода из строя одной лампочки в течение года p =0.003. Найдем вероятность того, что в течение одного года выйдет из строя более трех ламп. Выполним вычисления используя формулу Бернулли и по теореме Пуассона. Для вычисления вероятности по формуле Бернулли используем формулу P( > 3) = 1- P( 3) = 1- F (3), где F (x) - функция распределения для биномиального распределения. Для вычисления вероятности по теореме Пуассона используем формулу P( > 3) = 1- P( 3) = 1- F (3), где F (x) - функция распределения Пуассона с параметром = np = 3. Выполним те же вычисления для p = 0.3 и n = 10 ( = np =3).
28. Стьюдента распределение с f степенями свободы, распределение отношения Т = X/Y независимых случайных величин Х и Y, где Х подчиняется нормальному распределению с математическим ожиданием EX = 0 и дисперсией DX = 1, а fY2 имеет «Хи-квадрат» распределение с f степенями свободы. Функция распределения Стьюдента выражается интегралом .Если X1,..., Xn — независимые случайные величины, одинаково нормально распределённые, причём EXi = a и DXi= s2 (i = 1,..., n), то при любых действительных значениях а и s > 0 отношение подчиняется Стьюдента распределение с f = п-1 степенями свободы (здесь и ). Это свойство было впервые (1908) использовано для решения важной задачи классической теории ошибок У. Госсетом (Англия), писавшим под псевдонимом Стьюдент (Student). Суть этой задачи заключается в проверке гипотезы а = a0 (a0 = заданное число, дисперсия s2 предполагается неизвестной). Гипотезу а =a0 считают не противоречащей результатам наблюдений X1,..., Xn, если справедливо неравенство , в противном случае гипотеза а = а0 отвергается (так называемый критерий Стьюдента). Критическое значение t = tn-1(a) представляет собой решение уравнения Sn-1(t) = 1 – , a — заданный значимости уровень (0 < a < ). Если проверяемая гипотеза а = а0 верна, то критерий Стьюдента, соответствующий критическому значению tn–1(a), может её ошибочно отвергнуть с вероятностью а.Стьюдента распределение используется для решения множества др. задач математической статистики (см. Малые выборки, Ошибок теория, Наименьших квадратов метод)Критерий Пирсона
|
|
|
|
Нормальный закон распределения характеризуется плотностью вероятности вида где M{X}, ____ — соответственно математическое ожидание и дисперсия случайной величины. согласованности изучаемого распределения с нормальным
Для проверки гипотезы о соответствии, экспериментального закона распределения случайной величины нормальному применяют критерий Пирсона или, как его иначе называют, критерий X2 (хи-квадрат),так как принятие и отклонение гипотезы основаны на X2 -распределении.
Использование критерия Пирсона основано на сравнении эмпирических (наблюдаемых) ___ и теоретических (вычисленных в предположении нормального распределения) _____ частот. Обычно ____ и _____ различны.
Возможно, что расхождение случайно (незначимо) и объясняется малым числом наблюдений, способом их группировки Или другими причинами. Возможно, что расхождение частот неслучайно (значимо) и объясняется тем, что теоретические частоты вычислены, исходя из неверной гипотезы о нормальном распределении генеральной совокупности.Критерий Пирсона отвечает на поставленный ранее вопрос. Однако, как и любой статистический критерий, он не доказывает справедливость гипотезы, а лишь устанавливает при принятом уровне значимости q ее согласие или несогласие с данными наблюдений.Пусть по выборке объема ___ получено эмпирическое распределение.
Допустим, в предположении нормального распределения генеральной совокупности, вычислены теоретические частоты _____. При уровне значимости q требуется проверить нулевую гипотезу: генеральная совокупность распределена нормально.В качестве критерия проверки нулевой гипотезы принимается случайная величина илигде К- число интервалов (вариант).Эта величина случайная, так как в различая опытах она принимает различные, заранее неизвестные значения. Чем меньше различаются эмпирические и теоретические частоты, тем меньше значение критерия (1.9) и, следовательно, он в известной мере характеризует близость эмпирического и теоретического распределений. Возведением в квадрат разностей частот устраняется возможность взаимного погашения положительных и отрицательных разностей.При неограниченном возрастании объема выборки ( _________ ) закон распределения случайной величины (1.9), независимо от того, какому закону распределения подчинена генеральная совокупность, стремится к закону распределения X2 с f степенями свободы. Поэтому случайная величина (1.9) обозначена X2, а сам критерий называют критерием согласия "хи квадрат".
Число степеней свободы находят по равенству f=K-1-l где l- число параметров предполагаемого распределения, которые оценены по данным выборки, а l вызвана тем, что имеется дополнительное ограничение:т.е.- Теоретическое число элементов совокупности должно быть равно фактическому числу элементов.
Поскольку в данном случае, предполагаемое распределение является нормальным, nо оценивают два параметра (математическое ожидание и среднеквадратическое отклонение), поэтому l=2 , и число степеней свободы Если расчетное (наблюдаемое) значение критерия (1.9).оказалось меньше критического _____ которое находят по таблицам, для соответствующего уровня значимости q и числа степеней свободы , т.е. если то нет оснований отвергнуть нулевую гипотезу о нормальности распределения. В противном случае (при ___________ ) нулевая гипотеза отвергается.
При проверке гипотезы о нормальности распределения существует правило, согласно которому общее количество элементов выборки должно быть а число элементов, попавших в любой i-и интервал (т.е. значения эмпирических частот ____),должно быть ___________________________
Если в крайние интервалы попадает меньшее число элементов, то они объединяются с соседними интервалами. Внутренние интервалы объединять запрещается. Общее число интервалов К , оставшихся после объединения, должно удовлетворять условию _____________ Иначе число степеней, свободы f окажется равным нулю, и гипотезу невозможно будет проверить.В целях контроля вычислений формулу целесообразно преобразовать к виду приведен пример расчета наблюдаемого значения критерия ____ по известным эмпирическим и теоретическим частотам. Если _________ , то нет оснований отвергнуть нулевую гипотезу. Т.е., расхождение эмпирических и теоретических частот незначимо. Следовательно, данные наблюдений согласуются с гипотезой о нормальном распределении генеральной совокупности.