Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МСМ _студ конспект лекций_.doc
Скачиваний:
15
Добавлен:
16.04.2019
Размер:
16.65 Mб
Скачать

6.Многомерный нормальный закон распределения

Т.е. матрица ковариаций симметрична относительно диагонали, на которой находятся дисперсии СВ.

Таким образом, многомерное нормальное распределение в качестве числовых характеристик имеет:

коэффициенты парной ковариации;

математические ожидания и дисперсии маргинальных распределений.

Это означает, что многомерный нормальный закон распределения адекватно задается с помощью моментов распределения не выше 2-го порядка.

Если распределение имеет асимметрию или эксцесс по отношению к нормальному, то моментов 2-го порядка не достаточно для его изучения.

Таким образом, если объект характеризуется многомерным нормальным законом распределения, то его изучение более просто по сравнению с другими законами.

В большинстве случаев при исследовании объектов можно выделить множество пар, которые слабо взаимодействуют (слабо коррелируют). Их можно не анализировать.

Матрица ковариации одновременно определяет и рассеивание, и связь системы СВ. Определитель матрицы является обобщающей её дисперсией. Это скаляр (число). Геометрически обобщающая дисперсия характеризует объем многомерного эллипсоида рассеивания.

След матрицы – алгебраическая сумма диагональных элементов. След матрицы ковариаций характеризует среднюю дисперсию рассеивания многомерной СВ, она равна сумме дисперсий.

Если СВ в системе независимы, то матрица ковариаций является диагональной, т.е. все элементы кроме диагональных равны нулю. Обратное утверждение не является верным, т.е. если матрица ковариаций диагональная, то это не значит, что СВ независимы. То, что cov{X,Y}=0 значит, что между данными СВ нет линейной связи, но может быть и нелинейная.

В общем случае, регрессия понимается как совокупность статистических методов, позволяющих прогнозировать значение Y по измеренным значениям x. Иногда говорят, что регрессия – отображение x на прошлые значения Y.

Пример. Пусть существует система СВ X,Y.

- коэффициенты регрессии

- уравнение регрессии.

- коэффициенты обратной регрессии.

В общем случае, прямая и обратная регрессии не совпадают:

Аналогично регрессии существует условная дисперсия:

- вклад СВ Х в рассеивание условной СВ.

Геометрическая интерпретация регрессии для двумерного нормального распределения:

В каждом сечении присутствует эллипс. Рассмотрим его:

Если СВ сильно коррелированны, то прямая и обратная регрессии совпадают и стремятся к линейно детерминированной зависимости Y от X. Если , то регрессии ортогональны, т.е. СВ независимы, и невозможно установить их линейную связь.

7.Статистические выводы и оценивание

Теория статистических выводов, в т.ч. и в многомерном анализе, рассматривает вопросы оценивания и проверки статистических гипотез. В многомерном случае структура моделей может существенно усложняться в виду того, что исследователь-статистик должен учитывать при выработке гипотез не одну, а несколько СВ. Вместе с тем, общая теория статистических выводов и оценок справедлива для многомерного случая и имеет иногда существенное обобщение.

В разделе оценивания производится вычисление оценок параметров моделей. Модели могут быть различными, но необходимыми являются следующие этапы их подбора:

  1. выбор наилучших оценок;

  2. определение точности оценок (основная задача). В разделе проверки гипотез исследуются критерии проверки гипотез о различимости параметров модели (на сколько значимо отличаются от нуля статистические параметры);

  3. пригодность подобранных моделей (соответствует ли данная модель объекту);

  4. проверка гипотезы о различие (дискриминации) модели.

Статистическая задача может быть поставлена следующим образом: даны две модели (одна описана линейным уравнением, другая - нелинейным). Проверяется гипотеза о том, различны ли эти модели по отношению к данному объекту. Причем один и тот же объект может быть описан различными моделями (в многомерном случае такие задачи часто встречаются). Для решения таких задач используют в основном два метода – выборочных распределений и правдоподобия. Кроме них существуют байесовский подход, непараметрические методы и др.