- •1. Понятие двумерной (n-мерной) случайной величины. Примеры.
- •2. Функция распределения и плотность вероятности 2-мерной случайной величины, их свойства, примеры.
- •3.Числовые характеристики 2-мерной случайной величины и свойства этих характеристик. Примеры.
- •4. Зависимые и независимые случайные величины. Ковариация и коэффициент корреляции случайных величин. Связь между некоррелированностью и независимостью случайных величин.
- •5. Вариационный ряд, его разновидности. Средняя арифметическая и дисперсия ряда. Эмпирическая функция распределения. Полигон и гистограмма.
- •6. Генеральная совокупность. Выборки и способы их получения. Репрезентативная выборка.
- •7. Точечные статистические оценки неизвестных параметров генеральной совокупности и их свойства: несмещенность, состоятельность, эффективность.
- •8. Метод наибольшего (максимального) правдоподобия, алгоритм нахождения точечной оценки с его помощью.
- •9. Выборочная средняя как точечная оценка генеральной средней, ее несмещенность и состоятельность.
- •10. Выборочная дисперсия как точечная оценка генеральной дисперсии, ее смещенность и состоятельность. Несмещенная оценка генеральной дисперсии.
- •12. Интервальная оценка мат. Ожидания нормально распределенного признака при известном среднем квадратическом отклонении.
- •13. Определение необходимого объёма повторной и бесповторной выборок при оценке генеральной средней.
- •14. Статистическая проверка статистических гипотез. Виды гипотез, ошибки первого и второго рода. Критическая область и область принятия гипотезы, определения, примеры.
- •Сравнение двух дисперсий нормальных генеральных совокупностей
- •16. Сравнение исправленной выборочной дисперсии с гипотетической дисперсией нормальной совокупности (распределение «хи-квадрат»).
- •17. Сравнение двух средних нормальных генеральных совокупностей, дисперсии которых неизвестны и одинаковы.
- •18. Функциональная, статистическая и корреляционная зависимости. Различия между ними. Основные задачи теории корреляции.
- •19. Линейная парная регрессия. Система нормальных уравнений для определения параметров прямых регрессий. Выборочная ковариация.
- •20. Оценка тесноты связи. Выборочный коэффициент корреляции и его свойства.
13. Определение необходимого объёма повторной и бесповторной выборок при оценке генеральной средней.
Таблица 9.4 Необходимый объем (n) выборки для разных видов организации выборочного наблюдения
При планировании выборочного наблюдения с заранее заданным значением допустимой ошибки выборки необходимо правильно оценить требуемый объем выборки. Этот объем может быть определен на основе допустимой ошибки при выборочном наблюдении исходя из заданной вероятности , гарантирующей допустимую величину уровня ошибки (с учетом способа организации наблюдения). Формулы для определения необходимой численности выборки n легко получить непосредственно из формул предельной ошибки выборки. Так, из выражения для предельной ошибки:
непосредственно определяется объем выборки n:
Эта формула показывает, что с уменьшением предельной ошибки выборки Δсущественно увеличивается требуемый объем выборки , который пропорционален дисперсии и квадрату критерия Стьюдента .
Для конкретного способа организации наблюдения требуемый объем выборки вычисляется согласно формулам, приведенным в табл. 9.4.
14. Статистическая проверка статистических гипотез. Виды гипотез, ошибки первого и второго рода. Критическая область и область принятия гипотезы, определения, примеры.
Статистическая гипотеза – любое предположение, касающееся неизвестного распределения случайных величин (элементов), соответствующее некоторым представлениям об изучаемом явлении. В частном случае это может быть утверждение о значениях параметров распределения генеральной совокупности.
Различают нулевую и альтернативную гипотезы. Нулевая гипотеза – гипотеза, подлежащая проверке. Альтернативная гипотеза – каждая допустимая гипотеза, отличная от нулевой. Нулевую гипотезу обозначают Н0, альтернативную – Н1.
Конкретная задача проверки статистической гипотезы полностью описана, если заданы нулевая и альтернативная гипотезы. При обработке реальных данных большое значение имеет правильный выбор гипотез. Принимаемые предположения, например, нормальность распределения, должны быть тщательно обоснованы, в частности, статистическими методами. Необходимо помнить, что в подавляющем большинстве конкретных прикладных задач распределение результатов наблюдений в той или иной степени отлично от нормального.
При проверке статистической гипотезы возможны ошибки. Есть два рода ошибок.
Ошибка первого рода заключается в том, что отвергают нулевую гипотезу, в то время как в действительности эта гипотеза верна. Вероятность ошибки первого рода называется уровнем значимости и обозначается α.
Ошибка второго рода состоит в том, что принимают нулевую гипотезу, в то время как в действительности эта гипотеза неверна.
Обычно используют не вероятность ошибки второго рода, а ее дополнение до 1. Эта величина носит название мощности критерия. Итак, мощность критерия – это вероятность того, что нулевая гипотеза будет отвергнута, когда альтернативная гипотеза верна.
Понятия уровня значимости и мощности критерия объединяются в понятии функции мощности критерия – функции, определяющей вероятность того, что нулевая гипотеза будет отвергнута.
После выбора определенного критерия множество всех его возможных значений разбивают на два непересекающихся подмножества, одно из которых содержит значения критерия, при которых нулевая гипотеза отвергается, а другое – при которых она принимается.
Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают.
Областью принятия гипотезы (областью допустимых значений) называют совокупность значений критерия, при которых гипотезу принимают.
Основной принцип проверки статистических гипотез можно сформулировать так: если наблюдаемое значение критерия принадлежит критической области – гипотезу отвергают, если области принятия гипотезы – гипотезу принимают.
Так как критерий K – одномерная случайная величина, то все ее возможные значения принадлежат некоторому интервалу и, соответственно, должны существовать точки, разделяющие критическую область и область принятия гипотезы. Такие точки называются критическими точками.
Различают одностороннюю (правостороннюю и левостороннюю) и двустороннюю критические области.
Правосторонней называют критическую область, определяемую неравенством , где– положительное число.
Левосторонней называют критическую область, определяемую неравенством , где– отрицательное число.
Двусторонней называют критическую область, определяемую неравенствами , где. В частности, если критические точки симметричны относительно нуля, двусторонняя критическая область определяется неравенствамиили равносильным неравенством. Различия между вариантами критических областей иллюстрирует следующий рисунок.
Резюмируя, сформулируем этапы проверки статистической гипотезы:
Формулируется нулевая гипотеза ; Определяется критерий K, по значениям которого можно будет принять или отвергнутьи выбирается уровень значимости; По уровню значимости определяется критическая область; По выборке вычисляется значение критерия K, определяется, принадлежит ли оно критической области и на основании этого принимаетсяили.