- •Классическое определение вероятности.
- •2 Основные правила и формулы комбинаторики: перестановки, размещения, сочетания.
- •Выборки элементов с повторениями
- •3 Случайные события и алгебра событий. Непосредственное вычисление вероятностей
- •4 Основные теоремы теории вероятностей.
- •Случайные величины (дискретные и непрерывные). Закон распределения дискретной случайной величины.
- •Пространство элементарных событий
- •Алгебра событий
- •Вероятность
- •Определение случайной величины
- •Классификация
- •Методы описания
- •Функция распределения вероятностей случайной величины. Плотность распределения.
- •Законы равномерного и нормального распределений
- •Свойства
- •Моделирование нормальных случайных величин
- •Центральная предельная теорема
- •I b Законы равномерного распределений
- •II b Равномерный закон распределения.
- •Вероятность попадания в заданный интервал нормальной случайной величины
- •Числовые характеристики случайных величин.
- •10 Схема повторных испытаний. Формула Бернулли. Предельные теоремы в схеме Бернулли (Пуассона, Муавра-Лапласа).
- •Предмет и основные задачи математической статистики.
- •Классификация статистической информации.
- •Классификация статистических методов
- •Понятия “генеральная совокупность”, “выборочная совокупность” и “репрезентативная совокупность ”. Способы выбора из генеральной совокупности.
- •Статистическое распределение выборки. Эмпирическая функция распределения. Графическое изображение статистического распределения.
- •Числовые характеристики распределений: мода, медиана, среднее.
- •Числовые характеристики распределений: генеральная средняя и дисперсия; выборочная средняя и дисперсия.
- •1.2.Выборочная средняя.
- •1.3. Генеральная дисперсия.
- •1.4.Выборочная дисперсия.
- •Функциональная, статистическая и корреляционная зависимости. Выборочное уравнение регрессии. Отыскание параметров выборочного уравнения прямой линии среднеквадратичной регрессии.
- •Элементы теории корреляции. Коэффициент корреляции Пирсона.
- •9 Элементы теории корреляции. Коэффициент ранговой корреляции Спирмена.
- •В каких случаях можно обойтись без ранжирования
- •10 Точечные оценки параметров распределенияи методы их нахождения. Метод моментов.
- •4.1. Точечная оценка параметров распределения
- •Преимущества и недостатки метода
- •11 Точечные оценки параметров распределения и методы их нахождения. Понятие о методе наименьших квадратов. Метод наименьших квадратов (расчёт коэффициентов)
- •Интервальные оценки. Построение доверительного интервала для оценки математического ожидания при известной дисперсии.
Интервальные оценки. Построение доверительного интервала для оценки математического ожидания при известной дисперсии.
Сущность задачи интервального оценивания параметров
Интервальный метод оценивания параметров распределения случайных величин заключается в определении интервала (а не единичного значения), в котором с заданной степенью достоверности будет заключено значение оцениваемого параметра. Интервальная оценка характеризуется двумя числами – концами интервала, внутри которого предположительно находится истинное значение параметра. Иначе говоря, вместо отдельной точки для оцениваемого параметра можно установить интервал значений, одна из точек которого является своего рода "лучшей" оценкой. Интервальные оценки являются более полными и надежными по сравнению с точечными, они применяются как для больших, так и для малых выборок. Совокупность методов определения промежутка, в котором лежит значение параметра Т, получила название методов интервального оценивания. К их числу принадлежит метод Неймана.
Доверительный интервал для математического ожидания
Пусть по выборке достаточно большого объема, n > 30, и при заданной доверительной вероятности 1– необходимо определить доверительный интервал для математического ожидания m1, в качестве оценки которого используется среднее арифметическое .
Закон распределения оценки математического ожидания близок к нормальному (распределение суммы независимых случайных величин с конечной дисперсией асимптотически нормально). Если потребовать абсолютную надежность оценки математического ожидания, то границы доверительного интервала будут бесконечными [– , ]. Выбор любых более узких границ связан с риском ошибки, вероятность которой определяется уровнем значимости . Интерес представляет максимальная точность оценки, т.е. наименьшее значение интервала. Для симметричных функций минимальный интервал тоже будет симметричным относительно оценки 1. В этом случае выражение для доверительной вероятности имеет вид P(| 1 – m1 | Е) = 1– , где Е – абсолютная погрешность оценивания.
Нормальный закон полностью определяется двумя параметрами – математическим ожиданием и дисперсией. Величина 1 является несмещенной, состоятельной и эффективной оценкой математического ожидания, поэтому ее значение принимаем за значение математического ожидания. Определим оценку дисперсии случайного параметра 1, учитывая, что этот параметр равен среднему арифметическому одинаково распределенных случайных величин xi (следовательно, их дисперсии D(xi) одинаковы и равны 2)
.
Итак, случайная величина 1 распределена по нормальному закону с параметрами 1 и 2 / n. Для установления необходимых соотношений целесообразно перейти к центрированным и нормированным величинам. Выражение 1 – m1 можно трактовать как центрирование случайной величины 1. Нормирование осуществляется делением на величину среднеквадратического отклонения оценки 1
.
Для стандартизованной величины вероятность соблюдения неравенства определяется по функции нормального распределения
= Ф( ) – Ф(– ) = –1+ 2Ф( )=1– ,
где . Значение равно квантили u1– /2 стандартного нормального распределения уровня 1– /2. В частности, уровням надежности 0,9, 0,95 и 0,99 соответствуют значения допустимого отклонения u1– /2 величины z, равные 1,64, 1,96 и 2,58 соответственно. Окончательно можно записать
u 21– /2 = nЕ2/ 2 .
Нетрудно заметить, что это выражение аналогично по своему содержанию формуле, полученной с использованием общего метода построения доверительного интервала.
При фиксированном объеме выборки из (4.3) следует, что чем больше доверительная вероятность 1– , тем шире границы доверительного интервала (тем больше ошибка в оценке математического ожидания). Это равенство позволяет определить необходимый объем выборки для получения оценки математического ожидания с заданной надежностью и требуемой точностью (погрешностью): n= 2 u21– /2/Е 2. Если перейти к относительной погрешности = Е/ 1, то
n = 2 u21– /2 /( 2 12).
Таким образом, чтобы снизить относительную погрешность на порядок, необходимо увеличить объем выборки на два порядка. Приведенная формула часто используется в статистическом моделировании для определения необходимого количества испытаний модели.
Во многих случаях предположение о нормальном распределении случайной величины 1 становится приемлемым при n > 4 и вполне хорошо оправдывается при n >10. Оценка 1 вполне пригодна для применения вместо m1. Но не так обстоит дело с дисперсией, правомочность ее замены на 2 не обоснована даже в указанных случаях. При небольшом объеме выборки, n < 30, закон распределения оценки дисперсии 2 принимать за нормальный неоправданно. Ее распределение следует аппроксимировать распределением хи-квадрат как суммы квадратов центрированных величин (хи-квадрат распределение сходится к нормальному при количестве слагаемых, превышающем 30). Но это утверждение обосновано только для случая, когда случайная величина Х распределена нормально.
С учетом сделанных допущений величина z будет подчиняться закону распределения Стьюдента с n–1 степенями свободы (одна степень свободы использована для определения оценки дисперсии). Распределение Стьюдента симметричное, поэтому полученное соотношение между точностью, надежностью оценки и объемом выборки сохраняется, меняются только значения квантилей. Вместо квантили нормального распределения u1– /2 следует взять квантиль t1– /2(n–1) распределения Стьюдента с (n–1) степенями свободы. Значения критических точек распределения Стьюдента для некоторых вероятностей и различных степеней свободы, представлены в табл. П.4. Как можно видеть из табл. П.4, квантили распределения Стьюдента больше квантилей нормального распределения того же уровня надежности при малом n. Иначе говоря, применение нормального распределения при небольшом объеме выборки ЭД приводит к неоправданному завышению точности оценки.