Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЛР1.docx
Скачиваний:
8
Добавлен:
13.11.2019
Размер:
1.16 Mб
Скачать
  1. Варианты решения проблемы

Корреляционным анализом называется совокупность методов обнаружения корреляционной зависимости между случайными величинами или признаками по их абсолютным значениям. Формула расчета коэффициента корреляции построена таким образом, что если связь между признаками имеет линейный характер, коэффициент Пирсона точно устанавливает тесноту этой связи. Поэтому он называется также коэффициентом линейной корреляции Пирсона.

В общем виде формула для подсчета коэффициента корреляции такова:

Для практических расчетов коэффициента корреляции удобнее использовать не канониче­скую формулу Пирсона, а ее аналог:

Совокупность коэффициентов корреляции между всеми возможными парами признаков при­нято представлять в виде корреляционной матрицы r(ху, хк): j= 1,2…m: k= 1,2,…m которая служит основным «сырьем» для работы многих алгоритмов многомерной статистики. Матрица симметрична относительно главной диагонали, поскольку r(xj, xk) = r(xk, xj), а члены матрицы, стоящие на этой диагонали, равны 1.

Для анализа корреляционной матрицы используется ряд эвристик. Например, Гопкинс опубликовал методику выделения групп положительно коррелируемых признаков, которые он назвал «основными единицами». Для этого в качестве центров групп выделяются виды, имею­щие отрицательные сопряженности, а затем к этим центрам добавляются виды, положительно коррелируемые с ними. В дальнейшем проводится объединение двух или нескольких групп, со­держащих общие виды.

На анализе знаков коэффициентов корреляции основана также технология «концепту­ального моделирования». Если у любых трех значимо коррелируемых признаков имеется только одна отрицательная связь или все три связи отрицательны, то в этом случае нарушен знаковый баланс и эмпирические данные образуют «треугольник противоречий», что говорит о нецелост­ности системы и возможности ее членения на части. При всей внешней привлекательности кон­цепции треугольника непротиворечивых корреляций как простейшего элемента структуры, вряд ли знаковый баланс является универсальным свойством промышленных экосистем, а чрезвы­чайная лабильность статистических связей не позволят сводить анализ поведения производ­ственных комплексов исключительно к треугольникам противоречий.

Построение полного дендрита начинается с выбора двух наиболее сопряженных признаков, для чего в матрице коэффициентов корреляции определяется максимальное значение rij, i?j. Признаки i и j образуют две первые вершины графа. Далее в строках / и j находится следующий наиболее сопряженный признак (для определенности – rjk, где к? j,i), образующий новую третью вершину, соединенную с вершиной. Далее ищется максимальное значение связи в строках k и j, кроме тех, что уже выбраны. Эта процедура повторяется до тех пор. пока не будут задействова­ны все признаки. При желании, задавшись пороговым значением го, можно полученный полный граф максимального корреляционного пути разбить на подграфы (плеяды), проводя разрыв меж­ду теми признаками, которые вошли в первоначальный граф со значением сопряженности мень­шем r0.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]