- •1. Что изучает теория вероятностей
- •2. Испытание. Событие. Классификация событий
- •3. Понятие вероятности события. Классическое определение вероятности
- •4. Относительная частота события. Статистическое определение вероятности
- •5. Понятие комбинаторики. Основные правила комбинаторики
- •6. Основные комбинаторные соединения
- •7. Алгебра событий
- •8. Условная вероятность. Теоремы умножения вероятностей
- •9. Теоремы сложения вероятностей. Вероятность появления хотя бы одного события
- •10. Формула полной вероятности
- •11. Вероятность гипотез. Формула Байеса
- •12. Формула Бернулли
- •13. Формула Пуассона
- •14. Наивероятнейшее число появления события
- •15. Понятие и виды случайных величин
- •16. Закон распределения вероятностей дсв. Способы задания
- •17. Биноминальное распределение
- •18. Пуассоновское распределение
- •19. Геометрическое распределение
- •20. Гипергеометрическое распределение
- •21. Математическое ожидание дсв и его свойства
- •22. Дисперсия дсв и её свойства. Формула для вычисления дисперсии. Среднее квадратическое отклонение
- •23. Функция распределения вероятностей и её свойства
- •24. Плотность распределения вероятностей и её свойства
- •25. Числовые характеристики нсв
- •26. Равномерное распределение и его свойства
- •27. Показательное распределение и его свойства
- •28. Нормальное распределение и его свойства
- •29. Правило трёх сигм. Центральная предельная теорема Ляпунова
- •30. Закон больших чисел
- •31. Задачи математической статистики
- •32. Выборочный метод
- •33. Типы выборок и способы отбора
- •34. Вариационные ряды
- •35. Эмпирическая функция распределения
- •36. Полигон и гистограмма
- •37. Точечные оценки параметров распределения
- •38. Генеральная и выборочная средние
- •39. Генеральная и выборочная дисперсии
- •40. Оценка генеральной средней по выборочной средней
- •41. Оценка генеральной дисперсии по исправленной выборочной дисперсии
- •42. Метод моментов для точечной оценки параметров распределения
- •43. Метод наибольшего правдоподобия для точечной оценки параметров распределения
- •44. Интервальные оценки параметров распределения
- •45. Доверительные интервалы для параметров нормального распределения
- •46. Виды зависимостей между случайными величинами
- •47. Выборочные уравнения регрессии
- •48. Коэффициент корреляции
- •49. Линейная корреляция
- •50. Статистическая гипотеза
- •51. Виды ошибок
- •52. Статистический критерий. Критическая область
- •53. Сравнение выборочной средней с математическим ожиданием
- •54. Сравнение двух дисперсий нормальных генеральных совокупностей
34. Вариационные ряды
Вариационный ряд — упорядоченная по величине последовательность выборочных значений наблюдаемой случайной величины
X1<=…<=Xn равные между собой элементы выборки нумеруются в произвольном порядке; элементы вариационного ряда называются порядковыми (ранговыми) статистиками; число лm = m / n называется рангом порядковой статистики Xmn. Вариационный ряд используется для построения эмпирической функции распределения.
35. Эмпирическая функция распределения
Эмпирическая функция распределения (выборочная функция распределения) — естественное приближение теоретической функции распределения данной случайной величины, построенное по выборке.
Пусть задана случайная выборка наблюдений Построим по выборке ступенчатую функцию Fm(x), возрастающую скачками величины 1/m в точках x(i). Построенная функция называется эмпирической функцией распределения. Для задания значений в точках разрыва формально определим её так: Замечание: при этом эмпирическая функция непрерывна справа.
На рисунке представлена функция стандартного нормального распределения и эмпирическая функция распределения, построенная по выборке из 10 случайных наблюдений из стандартного нормального закона.
36. Полигон и гистограмма
Для наглядности строят различные графики статистического распределения, в частности, полигон и гистограмму.
Полигоном частот называют ломаную линию, отрезки которой соединяют точки . Для построения полигона частот на оси абсцисс откладывают варианты xi, а на оси ординат – соответствующие им частоты niи соединяют точки (wi;ni)отрезками прямых.
Полигон относительных частот строится аналогично, за исключением того, что на оси ординат откладываются относительные частоты wi.
В случае непрерывного признака строится гистограмма, для чего интервал, в котором заключены все наблюдаемые значения признака, разбивают на несколько частичных интервалов длиной h и находят для каждого частичного интервала ni– сумму частот вариант, попавших в i–й интервал.
Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которой служат частичные интервалы длиною h, а высоты равны отношению ni/h. Для построения гистограммы частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии (высоте) ni/h. Площадь i–го прямоугольника равна – сумме частот вариант i–о интервала, поэтому площадь гистограммы частот равна сумме всех частот, т.е. объему выборки.
В случае гистограммы относительных частот по оси ординат откладываются относительные частоты wi, на оси абсцисс – частичные интервалы, над ними проводят отрезки, параллельные оси абсцисс на высоте Wi/h. Площадь i–го прямоугольника равна относительной частоте вариант Wi, попавших в i–й интервал. Поэтому площадь гистограммы относительных частот равна сумме всех относительных частот, то есть единице.
37. Точечные оценки параметров распределения
Задача оценивания параметров распределения генеральной – одна из основных задач математической статистики. На содержательном уровне задача оценивания параметров распределения формулируется так: располагая выборкой реализаций случайной величины Х, необходимо получить оценку неизвестного параметра генеральной совокупности а и ее статистические свойства.
Оценивание параметров распределения осуществляется в два этапа. На первом этапе, на основании выборки х1, х2, ... , ,хn ,строится статистика, значение которой при данной выборке х1, х2, ... , ,хn принимают за приближенное значение оцениваемого параметра а :
Так как параметр генеральной совокупности оценивается числом, которое на числовой оси изображается точкой, то оценку называют точечной.
Для получения точечной оценки существует много статистик, которые могут быть использованы в качестве оценок. Поэтому второй этап оценивания состоит в выборе наилучшей оценки, что требует введения критерия качества получаемых оценок. Задача усложняется тем, что ввиду малого объема выборки требуется статистический подход к качеству оценки
По опытным данным (выборке) путем построения гистограммы или с помощью других средств можно попытаться выбрать вероятностную модель (определить закон распределения генеральной совокупности). При этом выборочные данные позволяют уточнить детали вероятностной модели. Знание вероятностной модели дает возможность прогнозировать будущие события, что важно для принятия решений. В приложениях обычно задаются определенным типом закона распределения генеральной совокупности (плотностью распределения)
f = f(x; a1, a2, ..., am)
и по данным случайной выборки х1, х2, ..., хn оценивают неизвестные параметры a1, a2, ..., am . Чаще всего параметрами являются генеральное среднее и дисперсия, а качестве оценки тогда используют выборочные характеристики: выборочное среднее и выборочную дисперсию.
Рассмотрим следующую задачу. Пусть имеется случайная величина Х и нам известен ее закон распределения f = f(x, a), который содержит один неизвестный параметр а. Требуется на основании выборочных данных х1, х2, ..., хn найти подходящую оценку параметра а. Для решения этой задачи построим следующую математическую модель. Пусть Х1, Х2, ..., Хn – независимые случайные величины, которые принимают соответствующие выборочные значения (для данной выборки значения х1, х2, ..., хn) и пусть случайная величина получена на основе случайных величин Х1, Х2, ..., Хn, то есть Будем считать, как и ранее, что случайные величины Х1, Х2, ..., Хn имеют один и тот же закон распределения с плотностью распределения величины Х (генеральной совокупности) f(x). Тогда является случайной величиной, закон распределения которой зависит от n и от f(x). Для того чтобы оценка имела практическую ценность она должна обладать следующими свойствами.
1. Несмещенность оценки. Оценка называется несмещенной, если ее математическое ожидание равно оцениваемому параметру генеральной совокупности:
В противном случае оценка называется смещенной и допускает систематическую ошибку. Так, рассмотренное ранее среднее выборочное является несмещенной оценкой среднего генерального. В то же время выборочная дисперсия - является смещенной оценкой генеральной дисперсии.
2. Состоятельность оценки. Оценка называется состоятельной, если она по вероятности с увеличением объема выборки п стремится к параметру генеральной совокупности:
3. Эффективность оценки. Если составлять множество несмещенных и состоятельных оценок, то эти оценки будут иметь разные дисперсии. Ясно, что, чем меньше будет дисперсия, тем меньше будет вероятность грубой ошибки при определении приближенного параметра генеральной совокупности.