Вопрос 2
Корреляционная матрица
Начальный этап многомерного корреляционного анализа количественных признаков состоит в оценке (приближении) на основе выборочных данных матрицы
,
элементы которой
- парные коэффициенты корреляции переменных
.
Выборочная корреляционная матрица.
В качестве статистического аналога
корреляционной матрицы
принимается матрица
,
десь
- выборочные парные коэффициенты корреляции переменных
.
Свойство корреляционных матриц
Матрицы , qh симметричны относительно главной диагонали.
Вся имеющаяся для анализа статистическая информация о зависимостях между случайными величинами содержится в выборочной корреляционной матрице .
Однако раскрытие многообразия взаимосвязей данных переменных непосредственно по их парным коэффициентам корреляции невозможно. Для проведения исследования при решении указанных типовых задач необходимо вычислять также частные и множественные коэффициенты корреляции, представляющие собой определенные действительные функции матрицы .
Билет 24
Теоремы сложения и умножения вероятностей
Суммой двух событий А и В называется событие С, состоящее в появлении хотя бы одного из событий А или В.
Теорема сложения вероятностей
Вероятность суммы двух несовместимых событий равна сумме вероятностей этих событий:
Р (А + В) = Р (А) + Р (В).
В случае, когда события А и В совместны, вер-ть их суммы выражается формулой
Р (А +В) = Р (А) + Р (В) – Р (АВ),
где АВ – произведение событий А и В.
Два события называются зависимыми, если вероятность одного из них зависит от наступления или не наступления другого. в случае зависимых событий вводится понятие условной вероятности события.
Условной вероятностью Р(А/В) события А называется вероятность события А, вычисленная при условии, что событие В произошло. Аналогично через Р(В/А) обозначается условная вероятность события В при условии, что событие А наступило.
Произведением двух событий А и В называется событие С, состоящее в совместном появлении события А и события В.
Теорема умножения вероятностей
Вероятность произведения двух событий равна вер-ти одного из них, умноженной на условную вероятность другого при наличии первого:
Р (АВ) = Р(А) · Р(В/А), или Р (АВ) = Р(В) · Р(А/В).
Следствие. Вероятность совместного наступления двух независимых событий А и В равна произведению вероятностей этих событий:
Р (АВ) = Р(А) · Р(В).
Следствие. При производимых n одинаковых независимых испытаниях, в каждом из которых событияА появляется с вероятностью р, вероятность появления события А хотя бы один раз равна 1 - (1 - р)n
Билет24. Критерий согласия (х-квадрат)
Критерий согласия разработан лучше других критериев и чаще других используется. Он основан на сравнении эмпирических частот интервалов группировки с теоретическими (ожидаемыми) частотами, рассчитываемыми по формулам нормального распределения.
Условия применения: объем выборки n ≥ 40, выборочные данные сгруппированы в интервальный вариационный ряд с числом интервалов не менее 7, ожидаемые (теоретические) частоты интервалов не должны быть меньше 5.
Гипотеза Н0: это плотность распределения fx генеральной совокупности, из которой взята выборка, соответствует теоретической модели нормального распределения.
Альтернатива Н1: .
Уровень значимости: a.
Порядок, применения:
1. Формулируется гипотеза, выбирается уровень значимости a.
2. Получается выборка объема n≥40 независимых наблюдений и представляется эмпирическое распределение в виде интервального вариационного ряда.
3. Рассчитываются выборочные характеристики и S. Их используют в качестве генеральных параметров µ и σ нормального распределения, с которым предстоит сравнить эмпирическое распределение.
4. Вычисляются значения теоретических частот попадания в i-й интервал группировки. Для этого необходимо вычислить:
(6.4)
где Ф0(u) — функции Лапласа, xвi и хнi — верхняя и нижняя границы i-го интервала группировки.
Если окажется, что вычисленные ожидаемые частоты некоторых интервалов группировки меньше 5, то соседние интервалы объединяются так, чтобы сумма их ожидаемых частот была больше или равна 5. Соответственно складываются и эмпирические частоты объединяемых интервалов.
5. Значение -критерия рассчитывается по формуле:
(6.5)
где ni — эмпирические частоты; – ожидаемые (теоретические) частоты; k — число интервалов группировки после объединения.
6. Из таблиц распределения находится критическое значение критерия для уровня значимости а и числа степеней свободы n=n–3.
7.Вывод:если тоэмпирическое распределение не соответствует нормальному распределению на уровне значимости a, в противном случае нет оснований отрицать это соответствие.