Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Уч_пособиядлямагистров по ОНИОТД / Основы научн. исслед. ОТД новая2 - копия.docx
Скачиваний:
546
Добавлен:
03.03.2016
Размер:
30.28 Mб
Скачать

9.1 Коэффициент корреляции

Если линейное изменение среднего значения одной случайной величины ведет к линейному изменению среднего значения другой случайной величины, то такая корреляционная связь называется линейной.

Для того чтобы объективно оценить, насколько сильна линейная корреляционная связь между случайными величинами, необходимо ввести некоторый количественный показатель.

(3.1)

Если имеется выборка из n пар значений хi, yi где i=1,2,..., n двух случайных величин х и у. то степень линейной связи между ними может быть определена коэффициентом корреляции r:

(9.3)

где - средние значения переменных х и у;

S(x), S(y) - оценки их среднеквадратических отклонений;

n - число пар точек.

Коэффициент линейной корреляции r по абсолютной величине не может быть больше единицы:

-1r1. (9.4)

При положительном r мы вправе предполагать, что одна из случайных величин в среднем возрастает, когда возрастает другая, и убывает, когда убывает другая. Если r отрицателен, то при возрастании одной величины другая величина будет в среднем убывать. Значение r = 0 указывает на отсутствие корреляции между случайными величинами. Значение же r = ±1 указывает на строгую функциональную положительную или отрицательную линейную связь. И вообще, большая близость |r| к единице указывает на большую степень, линейной связанности между случайными величинами.

9.2 Проверка гипотезы об отсутствии корреляционной связи между случайными величинами

Часто исследователю требуется решить вопрос: существует ли между двумя случайными величинами х и у какая-либо корреляционная зависимость? В случае отсутствия корреляционной зависимости можно утверждать, что изменение в среднем одной величины не повлечет за собой изменения в среднем другой. Если у - некоторая величина, которую требуется оптимизировать, ах- одна из переменных управления, то, установив отсутствие корреляционной связи между у их, можно исключить х из числа варьируемых факторов. Тем самым облегчается процесс оптимизации.

Близость коэффициента корреляции r к нулю говорит о слабой корреляционной зависимости между случайными величинами. Однако, как всякий статистический параметр, коэффициент корреляции, полученный выборочным данным, является лишь оценкой теоретического коэффициента корреляции р. Значение р можно получить, устремив число п пар случайных величин к бесконечности. Так как исследователь всегда имеет ряд с ограниченным числом п, выборочный коэффициент корреляции r является случайной величиной. Эта случайная величина с определенной вероятностью отклоняется на некоторое значение от истинного коэффициента корреляции р. Поэтому, получив значение r, близкое к нулю (например 0,2), исследователь должен решить, является ли для данного числа п пар случайных величин и данного уровня значимости q отклонение коэффициента r от 0 существенным (значимым) или это отклонение обусловлено случайными причинами.

Для ответа на вопрос, будет ли найденное значение коэффициента r указывать на какую-либо корреляцию между случайными величинами, применяется t-распределение Стьюдента.

Сначала мы делаем предположение (выдвигаем гипотезу), что случайные величины у их являются некоррелированными. Затем по формуле (9.3) находим значение tрасч:

(9.3)

Если полученное по формуле (9.3) значение tрасч будет превосходить найденное из табл. 2 Приложения для данного числа степеней свободы f= п - 2 и уровня значимости q,то сделанное предположение о некоррелированности случайных величии является необоснованным.

Пусть, например, на основании выбранной совокупности из n = 18 пар значений случайных чисел получен коэффициент корреляции r = 0,5. По формуле (9.3) находим значение:

Зададимся уровнем значимости q = 0,05 и по табл. 2 Приложения найдем значение tтaбл для числа степеней свободы f = 18 - 2 = 16. Имеем tтaбл = 2,12. Так как tрасч>tтaбл, то предположение о некоррелированности случайных величин следует признать необоснованным.

До сих пор мы рассматривали корреляционную зависимость между двумя величинами х и у. Однако при изучении сложных явлений необходимо принимать во внимание более двух случайных величин.

Для решения вопроса о существовании корреляционной зависимости между тремя и более случайными величинами используются методы множественной корреляции и частной корреляции.

Если исследуются три случайные величины x1, х2, х3, то можно рассчитать множественный коэффициент корреляции r1.23, который характеризует степень тесноты линейной связи случайной величины x1 с двумя другими величинами х2 и х3. Аналогично можно рассчитать коэффициент r2.13, характеризующий линейную связь х2 и x1, х3 и т. д.

Частный коэффициент корреляции r1.23 характеризует степень линейной связи случайной величины х1 с величиной х2 при фиксированном значении х3.