Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЭМС Корреляционный анализ.doc
Скачиваний:
15
Добавлен:
10.11.2018
Размер:
1.26 Mб
Скачать

Тема 4. Корреляционный анализ § 4.1. Статистическая зависимость

В естествознании и технике определено понятие функциональной зависимости, сущность которой заключается в том, что какая-либо физическая величина определяется как однозначная функция одной или нескольких величин. Например, из физики известна формула

,

отражающая функциональную зависимость давления газа на стенки сосуда (Р) от температуры (Т), объема сосуда (V), постоянной величины R; из математики известна формула площади круга , где S является функцией радиуса r.

Между случайными величинами может существовать связь и другого рода, а именно, одна из случайных величин реагирует на изменение другой случайной величины изменением своего закона распределения. Такая связь называется стохастической (вероятностной, статистической). Стохастическая связь между двумя случайными величинами появляется обычно тогда, когда имеются общие факторы, влияющие как на одну, так и на другую случайную величину. В частности, статистическая зависимость проявляется в том, что при изменении одной из величин изменяется среднее значение другой. В этом случае статистическая зависимость называется корреляционной.

Пример. Пусть Y – урожай зерна, Х – количество удобрений. С одинаковых по площади участков земли при равном количестве внесенных удобрений снимают различный урожай, т.е. между Y и Х не существует функциональной зависимости. Это объясняется тем, что на урожай, кроме количества удобрений, влияют другие (случайные) факторы, такие, как осадки, температура воздуха, расположение участка и др. Вместе с тем, как показывает опыт, средний урожай является функцией количества удобрений, т.е. Y связана с Х корреляционной зависимостью.

Известно, что в экономике многие явления происходят в обстановке воздействия многочисленных факторов, влияние каждого из факторов незначительно, но число этих факторов бывает велико, так что учесть влияние всех их практически невозможно. Поэтому возникает задача изучения корреляционной зависимости, для характеристики которой может служить коэффициент корреляции xy (см. [7]).

В корреляционном анализе ставятся две задачи:

1. Определение существования линейной зависимости между двумя переменными.

2. Оценка по выборке тесноты линейной зависимости между двумя переменными с учетом влияния других переменных (парная корреляция), без учета влияния других переменных (частная корреляция) и между одной (результирующей) переменной и несколькими (более двух) другими переменными (множественная корреляция).

Корреляция может быть обусловлена:

а) непосредственной причинно-следственной зависимостью между переменными, например, между себестоимостью продукции и затратами на ее производство (наши идеи о причине должны приходить извне статистики, в конечном счете из некоторой другой теории);

б) общей зависимостью от других факторов (см. частная корреляция);

в) неоднородностью статистических данных, которая проявляется, если изобразить статистические данные в виде диаграммы рассеяния (рис. 4.1) несколькими отдельными сгущениями («облачками»).

Если не обращать внимание на неоднородность, т.е. на два или более отдельных «облачков», то можем получить коэффициент корреляции по всем данным, значительно отклоняющимся от нуля, в то время как коэффициент корреляции по отдельным «облачкам» мал. Например [2], пусть Х – содержание гемоглобина в крови, Y – размеры кровяных шариков. Вычислив коэффициент корреляции отдельно для мужчин (М), детей (Д) и женщин (Ж), получим: . Если статистические данные объединить, то .

Примеры статистической зависимости в экономике: зависимость объемов производства от размера основных фондов, их возраста, числа производственного персонала; зависимость спроса от уровня дохода, цен на товары; зависимость себестоимости продукции от зарплаты, производительности труда и т.д.

Опознание причинной корреляции осуществляется путем исключения других возможностей. На практике можно воспользоваться следующей схемой: