Решение:
1. Для построения графика необходимо первоначально определиться, какой из двух предложенных факторов является независимой переменной (х) и изображается по оси абсцисс, а какой - зависимой переменной (у) и изображается по оси ординат. В данном примере наполняемость гостиницы зависит от ее расстояния до пляжа, поэтому наполняемость, % – у, а расстояние, км. – х. Далее в координатной плоскости откладываются точки.
Полученная совокупность точек, не соединенных между собой, называется полем корреляции или корреляционным облаком. По форме облака можно предварительно судить о тесноте и направлении связи.
2. Количественно тесноту и направление связи между двумя коррелируемыми признаками (в случае наличия между ними линейной зависимости) характеризует линейный коэффициент корреляции Пирсона. Это безразмерная величина, которая изменяется в интервале от -1 до +1.
Необходимые расчеты оформляются в виде вспомогательной таблицы:
х |
у |
ху |
х² |
у² |
0,1 |
92 |
9,2 |
0,01 |
8464 |
0,1 |
95 |
9,5 |
0,01 |
9025 |
0,2 |
96 |
19,2 |
0,04 |
9216 |
0,3 |
90 |
27,0 |
0,09 |
8100 |
0,4 |
89 |
35,6 |
0,16 |
7921 |
0,4 |
86 |
34,4 |
0,16 |
7396 |
0,5 |
90 |
45,0 |
0,25 |
8100 |
0,6 |
83 |
49,8 |
0,36 |
6889 |
0,7 |
85 |
59,5 |
0,49 |
7225 |
0,7 |
80 |
56,0 |
0,49 |
6400 |
0,8 |
78 |
62,4 |
0,64 |
6084 |
0,8 |
76 |
60,8 |
0,64 |
5776 |
0,9 |
72 |
64,8 |
0,81 |
5184 |
0,9 |
75 |
67,5 |
0,81 |
5625 |
Σх=7,4 |
Σу=1187 |
Σху=600,7 |
Σх²=4,96 |
Σу²=101405 |
По направлению выделяют связь прямую и обратную. При прямой связи (коэффициент корреляции больше нуля) с увеличением факторного признака увеличивается и результативный, и наоборот, с уменьшением факторного признака уменьшается и результативный признак; при обратной (коэффициент корреляции меньше нуля) увеличение факторного признака приводит к уменьшению результативного.
В данном примере связь обратная тесная, т.е. увеличение расстояния от гостиницы до пляжа в 94 случаях из 100 приведет к снижению наполняемости гостиницы.
3. Значимость коэффициента корреляции можно проверить по общему правилу проверки статистических гипотез:
- если tр tкр, нулевую гипотезу о том, что между Х и Y отсутствует корреляционная связь (то есть r = 0), нельзя отклонить на заданном уровне значимости .
- если tр tкр, нулевая гипотеза отклоняется в пользу альтернативной о том, что коэффициент корреляции значимо отличается от нуля (r 0), то есть между X и Y существует линейная корреляционная зависимость.
Расчетное значение критерия tр подчиняется закону распределения Стьюдента с (n - 2) степенями свободы:
.
Критическое значение определяется по таблице распределения Стьюдента по уровню значимости и числу степеней свободы k = n – 2. По условию задачи уровень значимости 0,05 и число степеней свободы 14-2=12, в этом случае = 2,18. Таким образом, , следовательно, определенно можно сказать, что между наполняемостью гостиницы и расстоянием от нее до пляжа существует связь.
4. В случае, если коэффициент корреляции является значимым, можно построить уравнение регрессии, которое позволяет определить, каким в среднем будет значение результативного признака Y при том или ином значении факторного признака X, если остальные факторы, влияющие на Y и не связанные с X, рассматривались неизменными. Уравнение регрессии имеет вид:
Коэффициент регрессии () показывает, на сколько единиц изменится следствие (у ) при изменении причины (х) на одну единицу.
При увеличении расстояния до пляжа на 1 км. наполняемость гостиницы снизится на 25,5%. Свободный член уравнения регрессии:
Уравнение регрессии:
5. По уравнению регрессии можно спрогнозировать, какова будет наполняемость гостиницы, если расстояние от нее до пляжа 1 км.
Для этого необходимо подставить известное значение независимой переменой х (х=1) и вычислить соответствующее значение у.
Если расстояние от гостиницы до пляжа будет 1 км., то среднегодовая наполняемость номеров в гостинице составит 72,8%.
Задача. Компания недавно провела рекламную кампанию в магазинах с демонстрацией антисептических качеств своего нового моющего средства. Через 10 недель компания решила проанализировать эффективности нового вида рекламы, сопоставив еженедельные объемы продаж с расходами на рекламу (тыс. руб.)
Объем продаж, тыс.руб |
72 |
76 |
78 |
70 |
68 |
80 |
82 |
65 |
62 |
90 |
Расходы на рекламу, тыс.руб |
5 |
8 |
6 |
5 |
3 |
9 |
12 |
4 |
3 |
10 |
Постройте график исходных данных и определите по нему характер зависимости.
Рис. 1: Корелляционное поле взаимосвязи объемов продаж от расходов на рекламу.
Вывод: График «Корелляционное поле» показывает что между расходами на рекламу и объемом продаж в данной компании существует прямая взаимосвязь, то есть чем больше расходы, тем больше объем продаж.
Рассчитайте выборочный коэффициент линейной корреляции Пирсона, проверьте его значимость при = 0,05.
Линейный коэффициент корреляции Пирсона |
|
Характеризует тесноту и направление связи между двумя признаками. Это безразмерная величина, изменяется в интервале от -1 до +1. |
Коэффициент детерминации |
dx(y) = 100%
|
Показывает, какая часть колеблемости результативного признака объясняется колеблемостью факторного |
Табл.1: Расчетные данные.
X |
Y |
X*Y |
X2 |
Y2 |
5 |
72 |
360 |
25 |
5184 |
8 |
76 |
608 |
64 |
5776 |
6 |
78 |
468 |
36 |
6084 |
5 |
70 |
350 |
25 |
4900 |
3 |
68 |
204 |
9 |
4624 |
9 |
80 |
720 |
81 |
6400 |
12 |
82 |
984 |
144 |
6724 |
4 |
65 |
260 |
16 |
4225 |
3 |
62 |
186 |
9 |
3844 |
10 |
90 |
900 |
100 |
8100 |
65 |
743 |
5040 |
509 |
55861 |
dx(y) = 100%=95
Между рекламными расходами и объемами продаж тесная взаимосвязь, так как коэффициент корреляции приближён к единице. Рекламные расходы влияют на объем продаж на 95% остальные 5% характеризуют влияние других факторов причин.
Постройте уравнение регрессии и дайте интерпретацию полученных результатов.
Уравнение регрессии |
yx = a0 + a1x |
Служит для прогнозирования неизвестного значения Y по известному значению X, и наоборот |
Коэффициент регрессии |
nxy - xy a1 = nx²- (x)² |
Показывает, на сколько единиц изменится в среднем Y при изменении X на 1 единицу. |
Свободный член уравнения регрессии |
_ _ a0 = y - a1x |
Его интерпретация зависит от того, какой смысл имеют изучаемые признаки. |
Вычисления:
A0=
Yx=58,7+2,4*x
Вывод: Объем продаж составляет7,4 тысяч рублей, если рекламные расходы увеличатся на 1000 рублей то объем продаж увеличится на 2,4 тысячи рублей. Например: если рекламные расходы фирмы увеличатся до 15 тысячи рублей, то объем продаж составит yx=58,7+2,4*15=94,7
1. Составить уравнение регрессии, выражающее связь между расходами на рекламу и объемом продаж нового моющего средства. Произвести оценку существенности коэффициента регрессии, т. е. установить, что зависимость между изучаемыми признаками не случайна, а статистически значима и существенно отличается от нуля.
2. Построить поле корреляции и прямую регрессии.
3.Вычислить линейный коэффициент парной корреляции.
4.Провести оценку достоверности коэффициента корреляции (tкр = 2,31).
5.Вычислить коэффициент детерминации.
6.Сделайте выводы.
Контрольные задания к теме «Анализ взаимосвязей»
Вариант 5
Имеются выборочные данные о стаже работы и выработке одного рабочего за смену:
Стаж работы, лет |
1 |
3 |
4 |
5 |
6 |
7 |
Выработка рабочего за смену, шт. |
14 |
15 |
18 |
20 |
22 |
25 |
Постройте график исходных данных и определите вид зависимости. Рассчитайте коэффициент линейной корреляции Пирсона, проверьте его значимость при =0,05. Постройте уравнение регрессии и объясните смысл полученных результатов.