Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Практикум по статистике_верстка.doc
Скачиваний:
132
Добавлен:
07.06.2015
Размер:
4.23 Mб
Скачать

Раздел7. Статистические показатели связи

7.1. Методические указания и решение типовых задач

При статистическом исследовании корреляционных связей основной задачей является определение на основе регрессионного анализа их формы (математической модели связи) и тесноты связи.

Математическими моделями связи могут быть уравнения регрессии:

линейное – y=a0+a1; (7.1)

степенное – y=a0xa1; (7.2)

квадратичное – y=a0+a1x+a2x2 и др. (7.3)

Для линейной модели её параметры определяются:

; (7.4)

. (7.5)

Здесь параметр a1 показывает изменение результативного признака (у) при изменении факторного признака (х) на единицу.

Теснота связи определяется коэффициентом корреляции r. При линейной форме связи он рассчитывается по формуле

. (7.6)

Показатели тесноты связи, исчисленные по данным сравнительно небольшой статистической совокупности, могут искажаться действием случайных причин. Это вызывает необходимость проверки их существенности.

Для оценки значимости коэффициента корреляции rприменяетсяt-критерий Стьюдента. При этом фактическое значение критерияtr:

(7.7)

Вычисленное по формуле (7.7) значение tr сравнивается с критическим tкр, которое берется из таблицы значений t Стьюдента с учетом заданного уровня значимости α и числа степеней свободы k.

Если tr > tкр, то величина коэффициента корреляции признается существенной.

Для получения выводов о практической значимости синтезированных моделей показателям тесноты связи дается качественная оценка. Это осуществляется на основе шкалы Чеддока, приведенной в табл. 7.1.

Таблица 7.1

Шкала Чеддока

Показатели тесноты связи

Характеристика силы связи

0,1 – 0,3

слабая

0,3 – 0,5

умеренная

0,5 – 0,7

заметная

0,7 – 0,9

высокая

0,9 – 0,99

весьма высокая

Чем сильнее связь, тем сильнее влияние изучаемого фактора на результативный признак у. При слабой связи вариация результативного признака определяется неучтенными факторами.

Часто исследуемые признаки имеют разные единицы измерения. Тогда для оценки влияния факторного признака на результативный применяются коэффициент эластичности (Э):

, (7.8)

где – первая производная уравнения регрессии.

Средний коэффициент эластичности определяется для линейного уравнения по формуле

. (7.9)

Он показывает, на сколько процентов изменяется результативный признак при изменении факторного признака на 1%.

Пример 7.1

Имеются выборочные данные по 10 однородным предприятиям (табл. 7.2).

Таблица 7.2

№ предприятия

1

2

3

4

5

6

7

8

9

10

Электровооруженность труда на 1 рабочего, кВт-ч

2

5

3

7

2

6

4

9

8

4

Выпуск готовой

продукции на одного рабочего, т

3

6

4

6

4

8

6

9

9

5

Постройте однофакторную регрессионную модель и определите тесноту связи.

Решение

Примем, что факторным признаком (х) является электровооруженность труда, а результативным (у) – выпуск готовой продукции. Будем считать, что между ними существует линейная связь y = a0 + a1 x. Для вычисления параметров модели по формулам (7.4) и (7.5) представим в табл. 7.3 исходные данные и необходимые дополнительные расчетные значения.

Таблица 7.3

Расчет сумм для вычисления параметров уравнения прямой

Исходные данные

Расчетные значения

№ предприятия

х

у

ху

х2

у2

1

2

3

2

5

3

3

6

4

6

30

12

4

25

9

9

36

16

Окончание табл. 7.3

Исходные данные

Расчетные значения

№ предприятия

х

у

ху

х2

у2

9

10

8

4

9

5

72

20

64

16

81

25

Итого

50

60

343

304

400

В среднем

5,0

6,0

34,3

30,4

40,0

;

.

Линейная модель будет иметь вид

у = 2,02 + 0,796х.(7.10)

Параметр а1 показывает, что с увеличением электровооруженности труда одного работника на 1 кВт-ч выпуск готовой продукции возрастет на 0,796 т.

Рассчитаем коэффициент корреляции по формуле (7.6):

Значение r показывает, что между энерговооруженностью труда и выпуском продукции существует сильная связь.

Средний коэффициент эластичности по формуле (7.9)

,

т.е. с увеличением электровооруженности труда на 1% выпуск продукции возрастет на 0,66%.

Произведем оценку значимости коэффициента корреляции t по формуле (7.7):

.

С учетом принятых в экономико-статистических исследованиях величин значимости α=0,05 (Рдов=0,95) и числа степеней свободы 10–2=8 табличное значение tкр=2,3.

Сравнивая tрасч. иtкр , имеем, чтоtрасч > tкр., поэтому коэффициент корреляции признается существенным, а синтезированная математическая модель (7.1) может быть использована для практических целей.

Определить, случайно или неслучайно предлагаемое в задачах распределения, т.е. сделать вывод о наличии или отсутствии зависимости между признаками, положенными в основу группировки, можно по критерию Пирсона().

,

- эмпирические частоты в таблицах;

- теоретические частоты.

Пример 7.2

Имеются данные о распределении 600 студентов-вечерников по двум признакам: характеру работы и результатам сдачи экзаменов по специальным дисциплинам:

Характер работы

Сдавшие

сессию

без двоек

Получившие

неудовлетворительные оценки

Всего

студентов

Работающие по профилю

270

50

320

Работающие не по профилю специальности

150

130

280

Теоретические частоты рассчитываются по каждой строке:

;;

,

Число степеней свободы (табл. Пирсона):

,

где ,- число строк и столбцов.

По таблице Пирсона (прилож.П3) определяем табличное (пороговое) значение , допустимое при случайных расхождениях между эмпирическими () и теоретическими () частотами.

Примем или. При числе степеней свободыипо таблице Пирсона (см. Прилож.1) определяем=3,84.

Так как , делаем вывод, что распределение неслучайно, т.е. существует зависимость между характером работы студентов и результатами сдачи ими экзаменов по специальным дисциплинам.

При исследовании степени тесноты связи между качественными признаками, каждый из которых представлен в виде альтернативных признаков, возможно использование так называемых «тетрахорических показателей». Тогда расчетная таблица (табл. 7.4) состоит из четырех ячеек (обозначаемых буквамиa, b, c, d). Каждая из клеток соответствует известной альтернативе того или другого признака.

Таблица 7.4

Да

Нет

Да

a

b

Нет

c

d

Для такого рода таблиц построен ряд показателей: коэффициент ассоциации и коэффициент контингенции.

Коэффициент ассоциации Ка определяется по формуле

. (7.11)

Коэффициент контингенции Кк рассчитывается из выражения

. (7.12)

Связь считается подтвержденной, если Ка > 0,5 или Кк > 0,3.

Пример 7.3

Оцените наличие связи между работниками торговли, распределенными по полу и содержанию работы. Результаты исследования сведены в статистическую таблицу (табл. 7.5).

Таблица 7.5

Распределение работников торговли по полу и оценке содержания работы

Работа

Мужчины

Женщины

Всего

Интересная

300 (а)

201 (b)

501 (a+b)

Неинтересная

130 (c)

252 (d)

381 (c+d)

Итого

430 (a+c)

453 (b+d)

883 (a+b+c+d)

В приведенном примере величина Ка будет равна 0,486.

Величина коэффициента в нашем примере соответствует среднему размеру связи, несмотря на различие мнений о своей работе мужчин и женщин.

Пример 7.4

Исследовалась социально-демографическая характеристика случайных потребителей наркотиков в зависимости от их семейного положения в одном из регионов РФ (тыс. чел.). Результаты обследования характеризуются следующими данными (табл. 7.6).

Таблица 7.6

Группы потребителей наркотиков

Семейное положение

Всего

замужем

(женат)

не замужем

(не женат)

Потреблял

Не потреблял

10,0

2,5

14,5

4,5

24,5

7,0

Итого

12,5

19,0

31,5

Рассчитайте коэффициент ассоциации и контингенции.

Решение

.

Вывод. Так как Ка < 0,5 и Кк < 0,3, то потребление наркотиков случайными потребителями не зависит от их семейного положения.

Для определения тесноты связи как между количественными, так и между качественными признаками при условии, что значения этих признаков могут быть упорядочены или проранжированы по степени убывания или возрастания признака, может быть использован коэффициент Спирмена (коэффициент ранговой корреляции) Р, который рассчитывается по следующей формуле:

, (7.13)

где – квадраты разности рангов связанных величинх и у,

;

N – число наблюдений (число пар рангов).

Ранг – это порядковый номер значений признака, расположенных в порядке возрастания или убывания их величин.

Пример 7.5

Рассмотрим наличие связи между обеспеченностью товарной продукцией ряда предприятий и накладными расходами по реализации (табл. 7.7).

Таблица 7.7

Обеспеченность товарной

продукцией, млн руб.

х

Накладные расходы по реализации,

тыс. руб.

у

Ранжирование

Сравнение рангов

Разность рангов

x

ранг

y

ранг

1

2

3

4

5

6

7

8

9

10

12,0

18,8

11,0

29,0

17,5

23,4

35,6

15,4

26,1

20,7

462

939

506

1108

872

765

1368

1002

998

804

11,0

12,0

15,4

17,5

18,8

20,7

23,4

26,1

29,0

35,0

1

2

3

4

5

6

7

8

9

10

462

506

765

804

872

939

998

1002

1108

1368

1

2

3

4

5

6

7

8

9

10

2

5

1

9

4

7

10

3

8

6

1

6

2

9

5

3

10

8

7

4

-1

-1

-1

0

-1

4

0

-5

1

2

1

1

1

0

1

16

0

25

1

4

Итого

50

По данным табл. 7.7 получим следующие значения коэффициента Спирмена:

Пользуясь определением тесноты связи по шкале Чеддока, можно сказать, что полученная связь заметная.

Для определения тесноты связи между произвольным числом ранжированных признаков применяется множественный коэффициент ранговой корреляции W (или коэффициент конкордации), который вычисляется по формуле

(7.14)

где m – количество факторов;

n – число наблюдений;

S – отклонение суммы квадратов рангов от средней квадратов рангов.

Пример 7.6

Определите тесноту связи между уставным капиталом, числом выставленных акций и числом занятых на предприятиях, выставивших акции на чековые аукционы в 2004 г. (табл. 7.8).

Таблица 7.8

Расчет коэффициента конкордации (данные условия)

Nпредприятия

Уставный капитал, усл. ед. Х

Число

выставленных акций У

Число

занятых на предприятии Z

Сумма рангов

Квадраты сумм

1

2

3

4

5

6

7

8

9

10

2 954

1 605

4 102

2 350

2 625

1 795

2 813

1 751

1 700

2 264

856

930

1563

682

616

495

815

858

467

661

119

125

132

141

150

165

178

181

201

204

9

1

10

6

7

4

8

3

2

5

7

9

10

5

3

2

6

8

1

4

1

2

3

4

5

6

7

8

9

10

17

12

23

15

15

12

21

19

12

19

289

144

529

225

225

144

441

361

144

361

-

-

-

-

-

-

-

165

2 863

Коэффициент конкордации говорит о том, что связь между заданными параметрами слабая.

Среди непараметрических методов оценки тесноты связи определенный интерес представляет коэффициент Фехнера. Он определяется на основе соотношения знаков отклонений значений исследуемых признаков x и y от их средних значений.

Коэффициент Фехнера рассчитывается по формуле

, (7.15)

где а – число совпадений отклонений ипо знаку;

b – число несовпадений отклонений ипо знаку;

(а+ b) – общее количество значений признака.

Чем ближе величина коэффициента Фехнера к единице, тем теснее связь между изучаемыми признаками.

Пример 7.7

У восьми учащихся школы зафиксировано следующее количество баллов, полученных за самостоятельные работы: по математике – Xи гуманитарным дисциплинам –Y(табл. 7.9).

Определите, существует ли между ними корреляция, через коэффициент Фехнера.

Таблица 7.9

Ст-т

X

Y

а

b

А

90

+

75

+

1

Б

60

-

69

+

1

В

46

-

45

-

1

Г

68

-

49

-

1

Д

82

+

58

-

1

Е

71

+

54

-

1

Ж

66

-

59

-

1

З

78

+

70

+

1

Среднее

70,1

59,8

5

3

.

Когда каждый из качественных признаков состоит более чем из двух групп, то для определения тесноты связи возможно применение коэффициентов взаимной сопряженности Пирсона и Чупрова, которые вычисляются по формулам

; (7.16)

, (7.17)

где – показатель взаимной сопряженности, определяется по формуле

(7.18 )

К1 – число значений (групп) первого признака;

К2 – число значений (групп) второго признака.

Чем ближе КпиКчк 1, тем связь теснее.

Пример 7.8

Исследовалась зависимость между оценкой уровня жизни респондентов Москвы и типом предприятия, на котором они работают. Данные, характеризующие опрос, приведены в табл. 7.10. Необходимо определить коэффициенты взаимной сопряженности Пирсона и Чупрова.

Таблица 7.10

Тип

предприятия

Оценка уровня жизни респондентов

Итого

Вполне удовлетворен

Скорее

удовлетворен

Скорее не удовлетворен

Совсем не удовлетворен

Государственное

31

35

35

35

136

Акционерное общество

17

13

14

9

53

Арендованное

4

2

1

1

8

Частное

8

5

4

3

20

Итого

60

55

54

48

217

Решение

По формуле (7.18)

;

;

=.

Вывод. Оценка уровня жизни респондентов не зависит от типа предприятия, на котором они работают.

В статистике существуют модификация коэффициента Пирсона, например через расчет -критерия. Коэффициент сопряженности (Кп) вычисляется по формуле

, (7.19)

где . (7.20)