Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Компьютерный практикум по статистике

.pdf
Скачиваний:
160
Добавлен:
01.04.2015
Размер:
2.27 Mб
Скачать

 

 

b

 

 

 

0,04

 

 

0,04

 

 

b =1- P χ2n1

> c2α;n1

0

 

=1- P χ502

> c0,05;502

 

 

=1- P χ502

> 67,50

 

 

=

b1

0,045

0,045

 

 

 

 

 

 

 

 

 

 

=1 – 0,16 = 0,84.

5.По данным за последние n = 12 месяцев найдена средняя доходность по некоторой акции x = 65% и соответствующее выборочное среднее квадратичное отклонение ˆs = 7%. Считая, что доходность акции распределе-

на по нормальному закону, требуется проверить на уровне значимости

α= 0,05 гипотезы о том, что в генеральной совокупности средняя доходность

равна a0 = 60%, а дисперсия равна b0 = 50(%)2, и определить вероятности не-

правильных выводов.

Решение. Проверим на 5%-ном уровне значимости гипотезу Н0: а = = а0 = 60% при альтернативной гипотезе Н1: а ¹ а0.

Поскольку модуль наблюдаемого значения статистики

 

=

(

 

 

- a0)

n

 

 

=

 

 

(

 

- a0)

n -1

 

T

X

X

 

 

 

 

 

 

 

 

 

 

ˆs

n 1

 

 

 

 

s

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

оказался равен

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(65 - 60)

11

 

= 2,37,

 

 

 

 

 

7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

а критическая точка t0,05;11 = 2,20, есть основания отвергнуть нулевую гипо-

тезу на 5%-ном уровне значимости (при этом возможно с вероятностью 0,05 допустить ошибку первого рода).

Теперь на 5%-ном уровне значимости проверим гипотезу Н0: s2 = b0 = 50 при альтернативной гипотезе Н1: s2 = b1 ¹ b0.

Наблюдаемое значение статистики

χ2n1 = (n -1)s2 = nˆs2 , b0 b0

равное

12×49 =11,76 ,

50

попадает в интервал между нижней критической точкой c120,05/2;11 = 3,82 и верхней критической точкой c20,05/2;11 = 21,92, поэтому на 5%-ном уровне зна-

чимости нет оснований отвергнуть нулевую гипотезу. При этом вероят-

ность ошибки второго рода (при b = 72

= 49) равна

 

 

 

 

1

 

 

 

b = P χ2n1

> c12−α/2;n1

b0

- P χ2n1

> c2α/2;n1

b0

= 0,97 - 0,02 = 0,95.

b1

b1

 

 

 

 

 

 

6. По данным за десять кварталов требуется проверить, имеется ли существенное различие между доходностями Q(1) и Q(2) двух акций:

41

q(1)

 

1,6

0,2

1,2

0,1

3,4

3,7

0,8

0,0

2,0

0,7

i

 

 

 

 

 

 

 

 

 

 

q(2)

1,9

0,8

1,1

0,1

0,1

4,4

5,5

1,6

4,6

3,4

i

 

 

 

 

 

 

 

 

 

 

Решение. Рассчитаем выборочные средние и исправленные выборочные дисперсии доходностей двух акций:

q(1) = 0,75, s12 = 3,20, q(2) = 2,33, s22 = 4,01.

Будем исходить из предположения, что доходность акции распределена по нормальному закону. Прежде чем проверять гипотезу о равенстве генеральных средних доходностей акций, проверим гипотезу о равенстве генеральных дисперсий (при альтернативной гипотезе о том, что дисперсии не равны). Наблюдаемое значение статистики

= s2

Fn 1;n 1 2

2 1 s12

оказалось равно

4,0093,201 = 1,25,

что меньше критической точки fα/2; n2 1; n1 1 = f0,025;9;9 = 4,03, поэтому на 5%-ном

уровне значимости нет оснований отвергнуть гипотезу о равенстве генеральных дисперсий, что позволяет применить известную статистику для проверки гипотезы о равенстве генеральных средних (при альтернативной гипотезе о том, что генеральные средние не равны).

Модуль наблюдаемого значения статистики

Tn1+n2

 

 

=

 

 

 

Q(1)

-

Q(2)

 

 

 

 

 

 

 

 

 

,

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(n1 -1)s12 + (n2 -1)s22

 

 

 

 

 

 

 

 

 

 

 

1

+

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n1 + n2 -2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n1

 

n2

равный

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,75 - 2,33

 

 

 

 

 

 

 

 

=1,86,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

9×3,20 + 9×4,01

1

+

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

9 +

 

 

9

9

 

 

 

 

 

 

 

 

 

 

 

 

9 - 2

 

 

 

 

 

 

 

 

 

 

 

 

оказался меньше критической точки tα;n1 +n2 2 = t0,05;16 = 2,12, поэтому на 5%-

ном уровне значимости можно принять гипотезу о равенстве генеральных средних доходностей двух различных акций; делаем вывод о несущественном различии доходностей акций.

Заметим, что на 10%-ном уровне значимости гипотеза о равенстве генеральных средних должна быть отвергнута, поскольку Tn1 +n2 2 =1,86

больше критической точки t0,1;16 = 1,7459. Иными словами, если мы готовы

довольствоваться 90%-ной надежностью выводов, то можно признать, что доходности акций различаются, если же нам нужна надежность не менее

42

95%, то оснований утверждать, что между доходностями двух акций есть различия, у нас нет. Вычисляя P = P{ Tn1 +n2 2 > 1,86} (например, с помощью

функции СТЬЮДРАСПОБР), получим, что P = P{ Tn1 +n2 2 > 1,86} = 0,08 — это

число называется P-значением соответствующего критерия, оно равно вероятности ошибиться, отвергнув гипотезу H0.

Теперь проверим те же гипотезы с использованием средств надстройки «Анализ данных» пакета Microsoft Excel. Введем данные в рабочий лист, как

показано на рис. 3.3.2.

A B

1Q(1) Q(2)

2

0,7

1,9

3

 

–1,6

0,8

4

 

–0,2

1,1

5

 

–1,2

0,1

6

 

–0,1

7

 

3,4

4,4

8

 

3,7

5,5

9

 

0,8

1,6

10

 

0,0

4,6

11

2,0

3,4

Рис. 3.3.2. Числовые данные для программ «Двухвыборочный F-тест для дисперсии»

и «Двухвыборочный t-тест с одинаковыми дисперсиями»

Воспользуемся программой «Двухвыборочный F-тест для дисперсии». Для этого выберем соответствующий пункт меню надстройки «Анализ данных». В появившемся окне ввода данных (рис. 3.3.3) укажем интервал переменной 1 B1:B11 и интервал переменной 2 A1:A11 (в которых находятся ис-

ходные данные — обратим внимание, что первой переменной должна быть та, которая обладает большей выборочной дисперсией, в данном случае Q(2) ). Отметим флажок «Метки», поскольку первые строки интервалов пе-

ременных содержат названия этих переменных.

Рис. 3.3.3. Окно ввода данных программы «Двухвыборочный F-тест для дисперсии»

43

Особенно отметим, что в случае проверки гипотезы H : DX(1)

= DX(2) о

0

 

 

равенстве генеральных дисперсий п р и а л ь т е р н а т и в н о й

 

г и п о -

т е з е H : DX(1) > DX(2), в поле «Альфа» нужно вводить уровень значимости

1

 

 

гипотезы, а в случае, к о г д а а л ь т е р н а т и в н а я г и п о т е з а

и м е -

е т в и д H0: DX(1) ¹ DX(2), в поле «Альфа» следует вводить половину уровня значимости. В данном случае в поле «Альфа» введем a/2 = 0,025.

Укажем, что результаты работы программы необходимо вывести на новый рабочий лист. Результаты работы программы представлены на рис. 3.3.4.

Двухвыборочный F-тест для дисперсии

 

Q(2)

Q(1)

Среднее

2,33

0,75

Дисперсия

4,01

3,20

Наблюдения

10

10

df

9

9

F

1,253

 

P(F<=f) одностороннее

0,371

 

F критическое одностороннее

4,026

 

Рис. 3.3.4. Результаты работы программы «Двухвыборочный F-тест для дисперсии»

Теперь воспользуемся программой «Двухвыборочный t-тест с одинаковыми дисперсиями». Для этого выберем соответствующий пункт меню надстройки «Анализ данных». В появившемся окне ввода данных (рис. 3.3.5) укажем интервал переменной 1 A1:A12 и интервал переменной 2 B1:B12 (в кото-

рых находятся исходные данные). Укажем гипотетическую среднюю разность, равную нулю, отметим флажок «Метки», поскольку первые строки ин-

тервалов переменных содержат названия этих переменных. Зададим уровень значимости «Альфа» (по условию a = 0,05). Укажем, что результаты работы программы необходимо вывести на новый рабочий лист. Результаты работы

программы представлены на рис. 3.3.6.

Рис. 3.3.5. Окно ввода данных программы «Двухвыборочный t-тест с одинаковыми дисперсиями»

44

Двухвыборочный t-тест с одинаковыми дисперсиями

 

Q(1)

Q(2)

Среднее

0,75

2,33

Дисперсия

3,20

4,01

Наблюдения

10

10

Объединенная дисперсия

3,60

 

Гипотетическая разность средних

0

 

df

18

 

t-статистика

–1,86

 

P(T<=t) одностороннее

0,04

 

t критическое одностороннее

1,73

 

P(T<=t) двухстороннее

0,08

 

t критическое двухстороннее

2,10

 

Рис. 3.3.6. Результаты работы программы «Двухвыборочный t-тест с одинаковыми дисперсиями»

Замечаем, что результаты компьютерных и ручных вычислений совпали (интерпретация результатов работы программ «Двухвыборочный F- тест для дисперсии» и «Двухвыборочный t-тест с одинаковыми дисперсиями»

очевидна).

В общем случае гипотезу H0: MX(1) = MX(2) (при неизвестных, но одинако-

вых дисперсиях) можно проверять, основываясь на рассчитанном уровне значимости (P-значении), т. е. на вероятности того, что статистика Tn1 +n2 2

окажется больше модуля наблюдаемого числового значения этой статистики («P(T <= t) одностороннее»), которая используется при проверке гипотезы H0 при односторонних альтернативных гипотезах) или вероятности того, что модуль статистики Tn1 +n2 2 окажется больше наблюдаемого числового

значения этой статистики («P(T <= t) двустороннее»), которая используется при проверке гипотезы H0 при двусторонней альтернативе).

Если соответствующее типу альтернативной гипотезы P-значение оказывается не меньше принятого уровня значимости α, то гипотезу H0 следует отвергнуть.

3.4. П а р н а я к о р р е л я ц и я и р е г р е с с и я

Исследуется связь между расходами дилеров некоторой компании на рекламу продукции (X, тыс. ден. ед.) и их объемами продаж (Y, млн. ден. ед.) и зависимость объема продаж Y от величины расходов на рекламу X. Сведения

по 60 случайно отобранным дилерам сгруппированы в корреляционную таблицу (табл. 3.4.1).

1. а) Данные об объемах продаж сгруппируем по пяти интервалам вложенных в рекламу средств и введем в рабочий лист Microsoft Excel,

отождествив каждый интервал с его серединой (рис. 3.4.1).

Воспользуемся программой «Однофакторный дисперсионный анализ». Для этого выберем соответствующий пункт меню надстройки «Анализ данных». В появившемся окне ввода данных (рис. 3.4.2) укажем входной интервал A1:E26, в

который мы ввели исходные данные (с заголовками столбцов — серединами

45

интервалов X, поэтому отметим флажок «Метки в первой строке»). Зададим уровень значимости «Альфа» (по условию α = 0,05). Укажем, что данные сгруппированы по столбцам, а результаты работы программы необходимо вывести на новый рабочий лист. Результаты работы программы представлены на рис. 3.4.3.

 

 

 

 

 

 

Т а б л и ц а

3.4.1

X

 

 

[0,05;1,40)

[1,40;2,75)

[2,75;4,10)

[4,10;5,45)

[5,45;6,80)

 

Y

 

 

 

 

 

 

 

 

 

 

 

 

 

x

0,725

2,075

3,425

4,775

6,125

ny

 

y

 

 

 

 

 

 

 

 

 

[0,00; 0,26)

0,13

 

6

1

1

 

 

8

[0,26; 0,52)

0,39

5

 

 

 

5

 

2

 

 

 

12

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

[0,52; 0,78)

0,65

3

 

 

 

13

 

1

 

 

 

17

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

[0,78; 1,04)

0,91

 

 

 

 

 

6

 

5

4

2

17

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

[1,04; 1,30)

1,17

 

 

 

 

 

 

 

 

 

 

 

 

3

3

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

nx

14

 

 

 

25

 

9

7

5

60

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A

 

 

B

C

 

D

 

E

 

 

 

 

 

 

1

0,725

 

2,075

3,425

4,7756,125

 

 

 

 

 

 

2

0,13

 

0,13

0,13

0,91

 

0,91

 

 

 

 

 

 

3

0,13

 

0,39

0,39

0,91

 

0,91

 

 

 

 

 

 

4

0,13

 

0,39

0,39

0,91

 

1,17

 

 

 

 

 

 

5

0,13

 

0,39

0,65

0,91

 

1,17

 

 

 

 

 

 

6

0,13

 

0,39

0,91

1,17

 

1,17

 

 

 

 

 

 

7

0,13

 

0,39

0,91

1,17

 

 

 

 

 

 

 

 

8

0,39

 

0,65

0,91

1,17

 

 

 

 

 

 

 

 

9

0,39

 

0,65

0,91

 

 

 

 

 

 

 

 

 

 

10

0,39

 

0,65

0,91

 

 

 

 

 

 

 

 

 

 

11

0,39

 

0,65

 

 

 

 

 

 

 

 

 

 

 

 

0,39

 

0,65

 

 

 

 

 

 

 

 

 

 

 

12

 

 

 

 

 

 

 

 

 

 

 

 

 

0,65

 

0,65

 

 

 

 

 

 

 

 

 

 

 

13

 

 

 

 

 

 

 

 

 

 

 

 

14

0,65

 

0,65

 

 

 

 

 

 

 

 

 

 

 

 

0,65

 

0,65

 

 

 

 

 

 

 

 

 

 

 

15

 

 

 

 

 

 

 

 

 

 

 

 

16

 

 

 

 

0,65

 

 

 

 

 

 

 

 

 

 

 

17

 

 

 

 

0,65

 

 

 

 

 

 

 

 

 

 

 

18

 

 

 

 

0,65

 

 

 

 

 

 

 

 

 

 

 

19

 

 

 

 

0,65

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,65

 

 

 

 

 

 

 

 

 

 

 

20

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,91

 

 

 

 

 

 

 

 

 

 

 

21

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

22

 

 

 

 

0,91

 

 

 

 

 

 

 

 

 

 

 

23

 

 

 

 

0,91

 

 

 

 

 

 

 

 

 

 

 

24

 

 

 

 

0,91

 

 

 

 

 

 

 

 

 

 

 

25

 

 

 

 

0,91

 

 

 

 

 

 

 

 

 

 

 

26

 

 

 

 

0,91

 

 

 

 

 

 

 

 

 

Рис. 3.4.1. Числовые данные для программы

 

 

 

«Однофакторный дисперсионный анализ»

 

 

Групповые средние

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ynxy

 

 

 

 

 

 

 

 

 

 

=

y

 

 

 

 

 

 

 

 

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

nx

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

средние объемы продаж для каждого интервала вложенных средств (nxy — количество наблюдений (X; Y), у которых x принадлежит интервалу X, а y принадлежит интервалу Y) рассчитаны программой («Средние»). Построим на

46

рис. 3.4.4 поле корреляции — прямоугольную сетку, в каждом прямоугольнике которой проставляется nxy точек. Здесь же построим линию групповых средних, т. е. ломаную, отрезки которой соединяют точки с координатами (x; yx).

Рис. 3.4.2. Окно ввода данных программы «Однофакторный дисперсионный анализ»

 

 

Однофакторный дисперсионный анализ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ИТОГИ

 

 

 

 

 

 

 

 

 

 

 

 

 

Группы

 

Счет

Сумма

 

Среднее

Дисперсия

 

 

 

 

 

 

 

0,725

 

14

4,68

 

0,334

0,0435

 

 

 

 

 

 

 

2,075

 

25

15,99

 

0,640

0,0421

 

 

 

 

 

 

 

3,425

 

9

6,11

 

0,679

0,0920

 

 

 

 

 

 

 

4,775

 

7

7,15

 

1,021

0,0193

 

 

 

 

 

 

 

6,125

 

5

5,33

 

1,066

0,0203

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Дисперсионный анализ

 

 

 

 

 

 

 

 

 

 

 

Источник вариации

 

SS

df

 

MS

F

 

P-значение

F критическое

 

 

 

 

 

 

 

 

 

 

 

2E–

 

 

 

 

 

Между группами

 

3,24

4

 

0,81

17,73

 

09

 

2,54

 

 

 

Внутри групп

 

2,51

55

 

0,05

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Итого

 

5,74

59

 

 

 

 

 

 

 

 

 

 

Рис. 3.4.3. Результаты работы программы

 

 

 

 

«Однофакторный дисперсионный анализ»

 

 

б)

Используя

 

с л у ч а й н у ю

м о д е л ь о д н о ф а к т о р н о г о

д и с п е р с и о н н о г о а н а л и з а:

 

 

 

 

 

 

 

 

Y(i) = θ(0) + θ(i) + ε(i);

i = 1, 2, 3, 4, 5;

k = 1, 2,…, n

,

 

 

 

k

 

 

k

 

 

 

 

i

 

 

где θ(i)

= N(0; σθ ), εk(i)

= N(0; σост ), проверим гипотезу H0: σθ = 0 об отсутствии

влияния интервала вложенных в рекламу средств на объем продаж. Расшифровка дисперсионной таблицы, полученной с помощью про-

граммы «Однофакторный дисперсионный анализ», представлена в табл. 3.4.2.

47

Y

 

 

 

 

 

 

 

 

 

 

 

1,3

 

 

 

 

 

 

Поле корреляции

 

 

 

 

 

 

 

 

 

 

 

1,04

 

 

 

 

 

 

Линия групповых средних

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Линия регрессии

 

 

0,78

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Верхняя граница

 

 

0,52

 

 

 

 

 

 

интервального прогноза M(Y|x)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Нижняя граница

 

 

 

 

 

 

 

 

 

интервального прогноза M(Y|x)

 

0,26

 

 

 

 

 

 

Верхняя граница

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

интервального прогноза Y|x

 

 

 

 

 

 

 

Нижняя граница

 

 

0

 

 

 

 

 

 

 

 

0,05

1,40

2,75

4,10

5,45

6,80

интервального прогноза Y|x

 

Рис. 3.4.4. Поле корреляции, линии групповых средних, регрессии,

 

 

интервальный прогноз групповых средних

 

 

 

 

 

 

 

 

 

 

 

Т а б л и ц а

3.4.2

Источник вариации

Показатель

Число степе-

Оценка дис-

Fν−1; n−ν =

 

 

 

 

 

 

 

2

 

 

результативного

вариации (SS)

ней свободы

персии σост

2

2

P-значение fα; ν −1; n−ν

признака Y

 

 

 

(df)

 

 

(MS)

= sX

/sост

 

 

Расходы на рекламу X

SSX =3,24

ν – 1= 4

 

 

sX2 =0,81

17,73

0,000000002

2,54

Остаточные факторы

SSост= 2,51

n ν = 55

 

 

sост2 =0,05

 

 

 

 

Общая вариация

 

SS = 5,74

n – 1 = 59

 

 

 

 

 

 

 

Проверка гипотезы H0 производится на основе анализа статистики Fν−1; n−ν = s2X /sост2 , имеющей (в предположении справедливости H0) распреде-

ление Фишера — Снедекора с ν – 1 = 4 и n ν = 55 степенями свободы (здесь ν = 5 — число интервалов x). В данном случае наблюдаемое значение

этой статистики оказалось равным 17,73 [в результатах работы программы (рис. 3.4.3, табл. 3.4.2) оно приводится в таблице «Дисперсионный анализ» в

столбце «F»], а критическая точка f0,05; 4; 55 = 2,54 (F критическое), откуда следует, что гипотеза H0 об отсутствии влияния вложений в рекламу на объем

продаж отвергается на 5%-ном уровне значимости.

Гипотезу H0 можно проверить и так: если P-значение оказывается не меньше принятого уровня значимости α (в данном случае α = 0,05), гипотезу H0 принимают, а если P-значение оказывается меньше α, гипотезу H0 отвергают. В данном случае P-значение равно P = P{F4; 55 > 2,54} = 0,000000002 [оно

приводится в результатах работы программы (рис. 3.4.3, табл. 3.4.2)], значит, гипотезу H0 следует отвергнуть на 5%-ном уровне значимости.

в) Оценим влияние величины расходов на рекламу на объем продаж

2

SSX

 

3,24

 

с помощью коэффициента детерминации ˆρ (Y | X) =

 

=

 

= 0,56 —

SS

5,74

 

итог

 

 

 

48

 

 

 

 

такова (56%) доля общей вариации (дисперсии, разброса, различий) объема продаж Y, обусловленная влиянием на него расходов на рекламу X. Корре-

ляционное отношение ˆr(Y | X) = ˆr2(Y | X) = 0,75.

Нетрудно убедиться в том, что

ˆˆ

 

 

 

 

 

ˆ

(

ˆ

)

 

2

2

(Y

|

X),

 

 

 

2

 

2

 

,

SSX = nsYr

SSост = nsY

1- r (Y | X)

а статистика

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

sX

 

 

 

 

ˆ

 

 

 

 

 

 

 

 

 

 

 

=

 

 

r

(Y | X) (n -1)

 

.

 

 

 

 

2

 

(

 

2

 

)

 

 

 

 

 

 

sост

ˆ

(n

- n)

 

 

 

 

1- r

(Y | X)

 

 

 

2. а) Наблюдения, сгруппированные в табл. 3.4.1, представим в обычной форме: пару (0,725; 0,13) выпишем 6 раз, пару (0,725; 0,39) — 5 раз и т. д. Введем эти данные в рабочий лист Microsoft Excel (рис. 3.4.5).

 

A

B

1

X

Y

2

0,725

0,1

3

0,725

0,1

4

0,725

0,1

5

0,725

0,1

6

0,725

0,1

7

0,725

0,1

8

0,725

0,3

9

0,725

0,3

10

0,725

0,3

11

0,725

0,3

12

0,725

0,3

13

0,725

0,6

14

0,725

0,6

15

0,725

0,6

16

2,075

0,1

17

2,075

0,3

18

2,075

0,3

19

2,075

0,3

20

2,075

0,3

21

2,075

0,3

22

2,075

0,6

23

 

 

Рис. 3.4.5. Числовые данные для программ «Корреляция» и «Регрессия»

Воспользуемся программой «Корреляция». Для этого выберем соответствующий пункт меню надстройки «Анализ данных». В появившемся окне ввода данных (рис. 3.4.6) укажем входной интервал A1:B61, в который мы ввели

исходные данные (с заголовками столбцов — названиями признаков, поэтому отметим флажок «Метки в первой строке»). Укажем, что данные сгруппированы по столбцам, а результаты работы программы необходимо вывести на новый рабочий лист. Результаты работы программы представлены на рис. 3.4.7.

В результате работы этой программы рассчитана оценка ˆr(X; Y) = 0,72 коэффициента корреляции r(X, Y). Проверим на 5%-ном уровне значимости гипотезу H0: r(X, Y) = 0 при альтернативной гипотезе H1: r(X, Y) ¹ 0.

Наблюдаемое числовое значение статистики

49

Yi = N(a0 + a1xi ;σELR ),

Tn2 =

 

 

ˆr

 

 

 

 

 

2

 

 

 

 

 

 

(1ˆr )/(n 2)

равно

 

 

 

 

 

 

 

0,72

= 7,9 .

 

 

 

 

 

 

 

 

(1

0,722)/58

 

 

 

Рис. 3.4.6. Окно ввода данных программы «Корреляция»

 

X

 

Y

X

 

1

 

Y

 

0,72

1

Рис. 3.4.7. Результаты работы программы «Корреляция»

При α = 0,05 значение критической точки tα; n2 = t0,05;58 = 2,00. Поскольку |7,9| > t0,05; 99 , есть основания отвергнуть проверяемую гипотезу H0. При

2

2

=

этом оценка коэффициента л и н е й н о й детерминации ˆr (X, Y) = 0,72

= 0,52 означает, что 52% общей вариации объема продаж Y обусловлены л и н е й н ы м влиянием на него расходов на рекламу X (сравним это значение с коэффициентом детерминации ˆρ2(Y | X) = 0,56 — долей вариации

объема продаж, связанной с влиянием расходов на рекламу). П о л о ж и - т е л ь н о е и б л и з к о е к е д и н и ц е значение оценки коэффициента корреляции означает, что наблюдается п о л о ж и т е л ь н а я и д о с т а - т о ч н о т е с н а я корреляционная связь между X и Y.

б) Предположив, что корреляционная зависимость Y от x линейна (функция регрессии Y на x линейна), оценим степень близости связи между Y и x к линейной функциональной.

М о д е л ь п а р н о г о л и н е й н о г о р е г р е с с и о н н о г о а н а - л и з а признака Y записывается следующим образом:

Yi = a0 + a1xi + εi ; i = 1, 2,…, n (n = 60) ,

где все случайные величины εi (случайные эффекты влияния на результатив-

ный признак неконтролируемых факторов) независимы и имеют одинаковое нормальное распределение εi = N(0;σELR ) или, иначе, все наблюдения Yi неза-

висимы и имеют нормальное распределение

50