- •Многомерные статистические методы (для специальности 06.18.00 «Математические методы в экономике»)
- •Содержание
- •9.Методы многомерного анализа 26
- •1.О статистических методах в экономике
- •2.Статистические методы
- •3. Многомерные статистические методы: свойства недетерминированных объектов
- •4.Методы многомерного анализа
- •Дисперсионный анализ;
- •Регрессионный анализ;
- •5.Система случайных величин
- •6.Многомерный нормальный закон распределения
- •7.Статистические выводы и оценивание
- •7.Критерии оценивания в больших выборках
- •8.Метод наименьших квадратов
- •9.Методы многомерного анализа
- •10.Дисперсионный анализ
- •11.Статистическая обработка результатов дисперсионного анализа
- •12.Основная схема дисперсионного анализа
- •13.Применение мнк для дисперсионного анализа
- •14.Планы дисперсионного анализа для изучения источников рассеивания
- •15.Дисперсионный анализ при многосторонней классификации
- •16.Планы многоступенчатой классификации
- •17. Регрессионный анализ
- •18.Задача идентификации в регрессионном анализе
- •19.Оценка результатов регрессионного анализа
- •20.Проверка воспроизводимости
- •21.Проверка значимости
- •22.Проверка адекватности
- •23.Метод гребневой регрессии в регрессионном анализе
- •24.Метод главных компонент
- •25.Факторный анализ
- •26.Корреляционный анализ
- •27.Планирование эксперимента в задачах идентификации
- •28.Общие критерии оптимальности планов эксперимента
- •29.Ортогональный план эксперимента
- •30.Построение матрицы планирования полного факторного эксперимента
- •31.Дробный факторный эксперимент
- •32.Анализ подбираемых моделей при ортогональном планировании
6.Многомерный нормальный закон распределения
Т.е. матрица ковариаций симметрична относительно диагонали, на которой находятся дисперсии СВ.
Таким образом, многомерное нормальное распределение в качестве числовых характеристик имеет:
коэффициенты парной ковариации;
математические ожидания и дисперсии маргинальных распределений.
Это означает, что многомерный нормальный закон распределения адекватно задается с помощью моментов распределения не выше 2-го порядка.
Если распределение имеет асимметрию или эксцесс по отношению к нормальному, то моментов 2-го порядка не достаточно для его изучения.
Таким образом, если объект характеризуется многомерным нормальным законом распределения, то его изучение более просто по сравнению с другими законами.
В большинстве случаев при исследовании объектов можно выделить множество пар, которые слабо взаимодействуют (слабо коррелируют). Их можно не анализировать.
Матрица ковариации одновременно определяет и рассеивание, и связь системы СВ. Определитель матрицы является обобщающей её дисперсией. Это скаляр (число). Геометрически обобщающая дисперсия характеризует объем многомерного эллипсоида рассеивания.
След матрицы – алгебраическая сумма диагональных элементов. След матрицы ковариаций характеризует среднюю дисперсию рассеивания многомерной СВ, она равна сумме дисперсий.
Если СВ в системе независимы, то матрица ковариаций является диагональной, т.е. все элементы кроме диагональных равны нулю. Обратное утверждение не является верным, т.е. если матрица ковариаций диагональная, то это не значит, что СВ независимы. То, что cov{X,Y}=0 значит, что между данными СВ нет линейной связи, но может быть и нелинейная.
В общем случае, регрессия понимается как совокупность статистических методов, позволяющих прогнозировать значение Y по измеренным значениям x. Иногда говорят, что регрессия – отображение x на прошлые значения Y.
Пример. Пусть существует система СВ X,Y.
- коэффициенты регрессии
- уравнение регрессии.
- коэффициенты обратной регрессии.
В общем случае, прямая и обратная регрессии не совпадают:
Аналогично регрессии существует условная дисперсия:
- вклад СВ Х в рассеивание условной СВ.
Геометрическая интерпретация регрессии для двумерного нормального распределения:
В каждом сечении присутствует эллипс. Рассмотрим его:
Если СВ сильно коррелированны, то прямая и обратная регрессии совпадают и стремятся к линейно детерминированной зависимости Y от X. Если , то регрессии ортогональны, т.е. СВ независимы, и невозможно установить их линейную связь.
7.Статистические выводы и оценивание
Теория статистических выводов, в т.ч. и в многомерном анализе, рассматривает вопросы оценивания и проверки статистических гипотез. В многомерном случае структура моделей может существенно усложняться в виду того, что исследователь-статистик должен учитывать при выработке гипотез не одну, а несколько СВ. Вместе с тем, общая теория статистических выводов и оценок справедлива для многомерного случая и имеет иногда существенное обобщение.
В разделе оценивания производится вычисление оценок параметров моделей. Модели могут быть различными, но необходимыми являются следующие этапы их подбора:
выбор наилучших оценок;
определение точности оценок (основная задача). В разделе проверки гипотез исследуются критерии проверки гипотез о различимости параметров модели (на сколько значимо отличаются от нуля статистические параметры);
пригодность подобранных моделей (соответствует ли данная модель объекту);
проверка гипотезы о различие (дискриминации) модели.
Статистическая задача может быть поставлена следующим образом: даны две модели (одна описана линейным уравнением, другая - нелинейным). Проверяется гипотеза о том, различны ли эти модели по отношению к данному объекту. Причем один и тот же объект может быть описан различными моделями (в многомерном случае такие задачи часто встречаются). Для решения таких задач используют в основном два метода – выборочных распределений и правдоподобия. Кроме них существуют байесовский подход, непараметрические методы и др.