Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

statistika_проц_22

.pdf
Скачиваний:
863
Добавлен:
11.04.2015
Размер:
2.41 Mб
Скачать

ставленными в Приложениях 5 и 6. Находим, что коэффициенту корреляции 0,94 соответствует z =1,74.

Находим

σz

=

1

= 0,58.

 

 

 

6 − 3

Отношение z к средней квадратической ошибке равно 3. Таким образом, мы можем полагать действительное наличие связи между величиной выпуска продукции и расходом электроэнергии для всей совокупности предприятий.

Наглядное представление об оценке достоверности (значимости) коэффициента корреляции дает таблица 6.8.

Таблица 6.8

Оценка достоверности (значимости) коэффициента корреляции

Характеристики

Средняя

Вывод о значимости

 

коэффициента

квадратическая

коэффициента корреляции

корреляции

 

ошибка

 

 

 

 

 

 

 

делается, если:

 

 

 

Большое число наблю-

σ r =

1 − r

2

 

 

 

 

 

 

 

 

r

 

≥ 3

 

 

 

 

 

дений, распределение

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n −1

 

 

 

 

 

σ r

 

 

 

 

 

приближенно нормаль-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

íîå, r < 0,9

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Малое число наблюде-

σr

=

 

 

1

− r2

 

 

 

 

 

tðàñ÷. > tòàáë. , ãäå

 

 

 

íèé (n < 30), распреде-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n − 2

 

 

 

 

 

 

 

 

r

 

 

 

 

r

 

n 2

ление далеко от нор-

 

 

 

 

 

 

 

 

 

tðàñ÷. =

 

 

 

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

мального, r < 0,9

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σr

 

 

1r2

 

 

 

 

 

 

 

 

 

 

 

 

tòàáë. находится по таблице рас-

 

 

 

 

 

 

 

 

 

пределения Стьюдента с пара-

 

 

 

 

 

 

 

 

 

метрами α;k = n − 2

 

 

 

Малое число наблюде-

σz

=

 

 

 

1

 

 

 

 

z

 

 

≥ 3 , ãäå

 

z =

1

 

1 + r

 

 

 

 

 

 

 

 

 

 

 

 

íèé (n < 30), распреде-

 

 

 

 

 

 

 

 

 

 

 

ln

 

 

n − 3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 − r

ление далеко от нор-

 

 

 

 

σz

 

 

 

 

2

 

 

 

 

 

 

 

 

 

z преобразование Фишера

мального, r > 0,9

 

 

 

 

 

 

 

 

201

6.9. Коэффициент корреляции рангов

Методы корреляционного и дисперсионного анализа не универсальны: их можно применять, если все изучаемые признаки являются количественными. При использовании этих методов нельзя обойтись без вычисления основных параметров распределения (средних величин, дисперсий), поэтому они получили название параметри- ческих методов.

Между тем в статистической практике изучения общественноэкономических явлений и процессов приходится сталкиваться с зада- чами измерения связи между качественными признаками, к которым параметрические методы анализа в их обычном виде неприменимы. Статистической наукой разработаны методы, с помощью которых можно измерить связь между явлениями, не используя при этом количественные значения признака, а значит, и параметры распределения. Такие методы получили название непараметрических.

В анализе социально-экономических явлений широко используются ранговые коэффициенты корреляции (коэффициенты корреляции рангов), когда коррелируют не непосредственные значения x и y, а их ранги, т. е. номера их мест, занимаемых в каждом ряду значений по возрастанию или убыванию. К таким непараметрическим коэффициентам относятся коэффициенты рангов Спирмена и Кендэлла.

Если n вариантов ряда расположены в соответствии с возрастанием или убыванием признака х, то говорят, что объекты ранжированы по этому признаку. Ранг для хi указывает место, которое занимает i-е значение признака среди других n значений признака

õ (i =1, 2, ...n).

Например, при исследовании рынка можно задаться целью выяснения предпочтений потребителей при выборе товара (при покупке акций, мороженого, водки и т.п.), таким образом, чтобы они распределили товар в порядке возрастания (или убывания) своих потребительских предпочтений. Если имеется два набора ранжированных данных, то можно установить степень линейной зависимости между ними.

Пример 6.7. Предположим имеется 5 продуктов, которые ранжированы по порядку предпочтений от 1 до 5 в соответствии с двумя характеристиками А и В.

202

Характеристики

 

Продукты

 

 

для ранжирования

V

W

X

Y

Z

A

2

5

1

3

4

B

1

3

2

4

5

Решение

Использование для определения интенсивности связи между признаками коэффициента К. Пирсона будет неверным, так как этот коэффициент применяется для признаков, измеряемых на количе- ственных шкалах. Так, например, при измерении взаимосвязи между ростом и весом, мы измеряет рост в сантиметрах, а вес в килограммах, при этом есть возможность точно определить на шкале измерений разницу в значении этих признаков для любого человека (или говоря другими словами, расстояние между ними на шкале измерений). Возьмем простейшую ранговую шкалу — экзаменационная оценка. Значит ли, что у получившего двойку студента знаний в два раза меньше, чем у того, кто получил четверку? Или двое студентов, получивших тройки имеют абсолютно одинаковый набор знаний? Ответ — нет, просто преподаватель упорядочивает их уровень знаний в определенной последовательности, в соответствии с критериями оценки знаний по конкретному предмету, но расстояние между значениями признаков на такой шкале не является строго фиксированным.

Для определения наличия взаимосвязи между ранговыми оценками используется коэффициент ранговой корреляции Спирмена.

Его расчет основан на различиях между рангами.

Для данных примера 6.8 обозначим D = ранг A – ранг B. Коэффициент Спирмена равен:

6D2

 

ρ = 1 − n(n2 −1) ,

(6.41)

где n — число пар ранжированных наблюдений.

В примере имеем пять пар рангов, следовательно, n = 5. Cумма D2 равна: (2 – 1)2 + (5 – 3)2 + (1 – 2)2 + (3 – 4)2 + (4 – 5)2 = 1 + 4 + + 1 + 1 + 1 = 8.

Коэффициент Спирмена равен:

ρ = 1

 

6 ×8

 

= 1 −

 

48

= 0,6.

 

×(25 −1)

120

 

5

 

 

203

Коэффициент Спирмена изменяется в интервале от [–1; 1] и интерпретируется так же, как и коэффициент Пирсона. Разница лишь в том, что он вычисляется для ранжированных данных. То есть мы нашли достаточно сильную линейную связь

Значимость коэффициента Спирмена проверяется на основе t-критерия Стьюдента по формуле:

t

= ρ

n −1

.

(6.42)

 

ðàñ÷.

 

1 − ρ2

Значение коэффициента считается существенным, если tðàñ÷. > têðèò.

(α; k = n – 2).

Коэффицент корреляции рангов (при условии, что ранги не повторяются) может быть рассчитан и по формуле, предложенной английским статистиком М. Кендаллом:

τ =

 

S

,

 

 

 

 

 

 

 

 

(6.43)

1

n(n −1)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

где S — фактическая сумма рангов;

1

n(n −1)

— максимальная

 

 

 

 

 

 

2

 

сумма рангов.

Этот коэффициент изменяется в интервале от [–1; 1] — и интерпретируется так же, как и коэффициент Пирсона, но он дает

более строгую оценку связи, чем коэффициент Спирмена ρ 32τ . Это соотношение выполняется при большом числе наблюдений,

n > 30, и слабых, либо умеренно тесных связях.

При расчете коэффициента Кендалла соблюдается следующая последовательность действий:

1.Значения x ранжируются в порядке возрастания или убывания.

2.Значения y располагаются в порядке, соответствующем значе- ниям x.

3.Для каждого ранга y определяется число следующих за ним значений рангов, превышающих его величину. Результат записывается в столбец «+», суммируется и обозначается Р.

4.Для каждого ранга y определяется число следующих за ним меньших значений рангов. Результат записывается в столбец «–», суммируется и обозначается Q.

5.Определяется общая сумма S = P + Q.

204

Значимость коэффициента корреляции рангов Кендалла проверяется по формуле:

τ

2(2n −5)

 

> tα 9n(n −1),

(6.44)

ãäå tá — коэффициент, определяемый по таблице нормального распределения для выбранного уровня значимости б при больших n.

Пример 6.8. Рассчитаем коэффициент Кендалла на основании данных примера 6.11.

Решение

Проведем необходимые расчеты в таблице:

x

y

 

1-é øàã

 

2-é øàã

 

3-é øàã

4-é øàã

 

 

 

 

 

 

 

 

 

«+»

«–»

1,5

26

 

1,3

 

 

95

 

 

6

3

2,4

71

 

1,5

 

 

26

 

 

8

0

8,6

45

 

2,4

 

 

71

 

 

6

1

1,3

95

 

3,3

 

 

112

 

 

5

1

3,3

112

 

3,5

 

 

220

 

 

1

4

4,0

130

 

4,0

 

 

130

 

 

3

1

5,1

145

 

5,1

 

 

145

 

 

2

1

6,1

190

 

6,1

 

 

190

 

 

1

1

3,5

220

 

7,1

 

 

231

 

 

0

1

7,1

231

 

8,6

 

 

45

 

 

Итого

 

 

 

 

 

P = 32

Q = –13

5-й шаг: S = P + Q = 32 + (–13) = 19, тогда

 

 

τ =

2S

 

=

2(32 −13)

= 0,42.

 

 

n(n −1)

 

10(10 −1)

 

 

 

 

 

 

 

 

 

Действительно, если полученное значение ô умножить на 1,5, то получим 0,6 — значение коэффициента Спирмена.

6.10. Корреляция альтернативных признаков

Альтернативные признаки — это признаки, принимающие только два возможных значения. Исследования их корреляции основано на показателях, построенных на четырехклеточных таблицах, в которые сводятся значения признаков.

205

a

b

c

d

Пример 6.9. Требуется измерить связь между прививками от гриппа и снижением заболеваемости гриппом в группе слу- чайно выбранных студентов.

 

Заболели

Не заболели

Итого

Привитые

30

20

50

Непривитые

15

5

20

Итого

45

25

70

Существует ли связь между заболеваемостью и прививками?

Решение

Для измерения тесноты взаимосвязи признаков производится расчет коэффициента контингенции по формуле:

Kc =

ad − bc

=

30 5 − 20 15

= −0,14. (6.45)

(a + c)(b + d)(a + b)(c + d)

 

 

 

45 25 50 20

Коэффициент контингенции принимает значения на интервале [–1; 1]. Интерпретация аналогична коэффициенту корреляции. Мы получили слабую отрицательную связь.

Другой метод измерения связи основан на расчете коэффициента ассоциации:

Q =

ad − bc

=

30

5

− 20 15

= −0,33.

(6.46)

ad + bc

30

5

+ 20 15

 

 

 

 

Минус перед коэффициентом говорит об обратном направлении связи, чем больше прививок, тем меньше заболеваний.

Коэффициент контингенции всегда бывает меньше коэффициента ассоциации и дает более корректную оценку тесноты связи.

6.11.Коэффициент взаимной сопряженности

Ê.Пирсона

Для оценки тесноты связи между признаками, принимающими любое число вариантов значений (категориальные, номинальные признаки), применяется коэффициент взаимной сопряженности

206

К. Пирсона. Основой изучения связи между номинальными признаками служит таблица сопряженности — двумерное распределение единиц совокупности по признакам. В этой таблице в измерении связи уча- ствуют не значения признаков. Вся информация о наличии или отсутствии связи содержится в частотах появления сочетаний признаков.

Информация для оценки этой связи группируется в виде таблицы:

Признаки

A

B

C

Итого

D

m11

m 12

m 13

Ó m 1j

E

m 21

m 22

m 23

Ó m 2j

F

m 31

m 32

m 33

Ó m 3j

Итого

Ó m i1

Ó mi2

Ó mi3

Ó m ij

ãäå mij — частоты взаимного сочетания двух атрибутивных признаков; n — число пар наблюдений.

Коэффициент взаимной сопряженности К. Пирсона определяется по формуле:

Ñ =

 

ϕ2

,

(6.47)

 

+ ϕ2

1

 

ãäå ϕ — показатель средней квадратической сопряженности.

 

2

2

 

2

 

ϕ2 =

m11

+

m21

+ ... +

m33

1.

 

 

 

 

m1j mi1

 

m2j mi1

 

 

 

 

m3j mi3

Коэффициент взаимной сопряженности принимает значения в интервале [0; 1] и интерпретируется подобно коэффициенту парной линейной корреляции К. Пирсона.

Пример 6.10. Для изучения влияния условий труда на взаимоотношения в коллективе было проведено выборочное обследование 250 работников предприятия, ответы которых распределились следующим образом:

Условия

 

Взаимоотношения в коллективе

 

 

 

Удовлетво-

Неудовлетво-

Итого

труда

Хорошие

 

 

рительные

рительные

 

 

 

 

 

Соответствуют

30

 

20

10

60

требованиям

 

 

 

 

 

Не полностью

25

 

50

15

90

соответствуют

 

 

 

 

 

Не соответст-

10

 

40

50

100

âóþò

 

 

 

 

 

Итого

65

 

110

75

250

207

Требуется охарактеризовать связь между исследуемыми показателями с помощью коэффициента взаимной сопряженности К.Пирсона.

 

2

 

 

2

 

 

 

2

 

 

 

 

2

 

 

2

 

 

2

 

2

 

ϕ2 =

30

+

 

25

+

 

10

+

20

 

+

50

 

+

40

+

10

+

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

60 65

 

90 65

 

100 65

 

 

60 110

90 110

 

100 110

 

60 75

 

 

 

 

 

2

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+

15

 

+

50

 

 

1

= 1,2003 1 = 0,2003.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

90 75

100 75

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ñ =

 

0,2003

 

=

0,1669 = 0,408.

 

 

 

 

 

 

 

1 + 0,2003

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Полученное значение коэффициента сопряженности свидетельствует, что связь между условиями труда и взаимоотношениями в коллективе весьма заметна.

´Контрольные вопросы к главе 6

1.Чем вызвана необходимость изучения вариации признака?

2.Укажите основные показатели вариации.

3.Какие вам известны способы расчета дисперсии и среднего квадратического отклонения?

4.Как определяется дисперсия альтернативного признака?

5.Что такое коэффициент вариации?

6.Правило сложения дисперсий. Что показывают частная (внутригрупповая), средняя из частных, межгрупповая и общая дисперсии?

7.Как рассчитываются и что характеризуют коэффициент детерминации и эмпирическое корреляционное отношение?

8.Как рассчитывают и что характеризуют коэффициент дифференциации и коэффициент фондов?

9.Показатели концентрации: коэффициенты Джини и Герфиндаля.

10.Какие типы взаимосвязей между явлениями вы знаете?

11.В чем сущность корреляционной связи между явлениями?

12.Что такое «ложная» корреляция?

13.Охарактеризуйте корреляционные связи по направлению и по аналитическому выражению.

14.Какие методы применяют в начальной стадии анализа статистических зависимостей?

208

15.Какие существуют показатели измерения тесноты связи?

16.Как оценивается значимость коэффициента корреляции, рас- считанного по выборочным данным?

17.Что представляют собой коэффициент рангов Спирмена?

18.С помощью каких показателей изучается и измеряется корреляционная зависимость между качественными показателями на основе таблиц взаимной сопряженности?

þТесты для самопроверки к главе 6

1.Варьирующий признак — это признак,

1)характеризующий относительную численность единиц совокупности;

2)характеризующий абсолютную численность единиц совокупности;

3)значения которого отличаются друг от друга;

4)выраженный в долях единицы или в процентах.

2.Атрибутивная вариация — это вариация:

1)дискретного признака;

2)непрерывно варьирующего признака;

3)количественного признака;

4)качественного признака.

3.Абсолютные показатели вариации — это:

1)размах, дисперсия, среднее квадратическое отклонение, коэффициент вариации;

2)размах, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение;

3)коэффициент вариации, коэффициент осцилляции, относительное линейное отклонение;

4)коэффициент вариации.

4.Коэффициент вариации позволяет представить:

1)степень колеблемости в процентах результативного признака в зависимости от степени колеблемости факторного;

2)дисперсию как долю от средней величины;

3)долю усредненного значения абсолютных отклонений вокруг средней величины;

4)меру колеблемости крайних значений признака вокруг средней.

209

5. Общая дисперсия показывает:

1)колеблемость результативного признака за счет всех условий

èпричин, действующих внутри группы;

2)колеблемость результативного признака за счет всех условий

èпричин, действующих в статистической совокупности, за исключением группировочного признака;

3)колеблемость результативного признака за счет всех условий

èпричин, действующих в статистической совокупности;

4)колеблемость результативного признака за счет группировочного.

6. По данной формуле η = η2 =

δ 2

определяется:

 

σ 2

 

1)коэффициент вариации;

2)коэффициент детерминации;

3)эмпирическое корреляционное отношение;

4)коэффициент корреляции.

7.Функциональной (жестко детерминированной) называется:

1) причинно-следственная связь явлений и процессов, когда изменение одного из них — причины ведет к изменению другого — следствия;

2) вид причинной зависимости, при которой определенному зна- чению факторного признака соответствует одно или несколько точно заданных значений результативного признака;

3) вид причинной зависимости, проявляющейся не в каждом отдельном случае, а в общем, в среднем, при большом числе наблюдений;

4) зависимость среднего значения результативного признака от изменения факторного признака.

8.Статистической (стохастически детерминированной) называ-

åòñÿ:

1) причинно-следственная связь явлений и процессов, когда изменение одного из них — причины ведет к изменению другого — следствия;

2) вид причинной зависимости, при которой определенному зна- чению факторного признака соответствует одно или несколько точно заданных значений результативного признака;

210

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]