Скачиваний:
119
Добавлен:
01.05.2014
Размер:
415.74 Кб
Скачать

2. Основы анализа связей

2.1. Предположение о природе связи

Различные методы обработки эмпирических данных направлены на выявление закономерностей, которым подчиняется изучаемое явление. Это означает, что предполагается следующее: если изучаемое явление подвергнуть новому обследованию и получить в результате нового эксперимента, вообще говоря, другую матрицу данных, то после ее обработки теми же методами будут получены совпадающие в некотором смысле результаты.

Естественно, что такое предположение следует обосновать. Обоснование состоит в том, что предполагается справедливой некоторая гипотеза порождения различных матриц данных. Наиболее распространенной из таких гипотез является статистическая гипотеза, согласно которой матрица данных порождается некоторым случайным образом в соответствии с некоторой вероятностной закономерностью.

Простейшая статистическая гипотеза состоит в том. что в n-мерном пространстве признаков существует некоторое распределение вероятностей, и каждая строка исходной матрицы данных порождается в соответствии с этим распределением независимо от других строк.

Справедливость такой гипотезы часто подтверждается на практике, если учесть, что на проявление свойств каждого из признаков влияет большее число случайных воздействий. В таких случаях предполагается, что признаки, измеряемые в ходе эксперимента, образуют систему случайных величин и полностью характеризуются некоторым многомерным законом распределения. Поэтому широко эксплуатируется гипотеза о многомерном, нормальном законе распределения. Во многих случаях (но не во всех) многомерное, нормальное распределение является хорошим приближением реальных распределений. Это его свойство основано на центральной предельной теореме, согласно которой сумма очень большого числа взаимно независимых случайных величин, влияние каждой из которых ничтожно мало, имеет распределение, близкое к нормальному.

2.2. Нормальное распределение

Многомерное нормальное распределение часто обозначается N(), где - вектор средних, - ковариационная матрица. Закон распределения записывается как многомерная плотность вероятности

f(x/,)=

где det-определитель ковариационной матрицы .

30

Кратко напомним основные свойства многомерного нормального распределения на примере двухмерного. Это полезно сделать, так как позволит подробнее рассмотреть структуру ковариационной матрицы и потом использовать при геометрической интерпретации ее свойств.

Рассмотрим коэффициент корреляции rij между признаками Xi и Xj исходной матрицы данных X:

Отсюда ij= ijrij ;ii = i. Ковариационная матрица двухмерного нормального распределения имеет вид

Определитель матрицы неотрицателен, так как

det  =

Найдем обратную матрицу . В невырожденных случаях, когда |r|<1, определитель det > 0. В этом случае квадратная матрица является невырожденной (неособенной) и имеет обратную матрицу. Из линейной алгебры известно, что квадратная матрица А-1 называется обратной к матрице А, если А А-1 = А-1А = Е. где Е - единичная матрица. Обратная матрица вычисляется как А-1 =, где - присоединенная матрица, элементами которой являются алгебраические дополнения Аij каждого элемента aij матрицы А.

Напомним, что при вычеркивании в матрице А(n х n) строки i и столбца j для элемента aij оставшиеся строки и столбцы образуют минор Mij порядка п-1. Алгебраическим дополнением элемента aij называется его минор со знаком Aij= Mij(-1)i+j . Тогда

Вектор средних выражается как =. Преобразуем показатель степени:

Соседние файлы в папке Основы обработки данных