Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
3 курс / Лекции / Тема 12 стат связь.doc
Скачиваний:
22
Добавлен:
17.04.2015
Размер:
930.82 Кб
Скачать

Методы изучения статистической связи

Наиболее простой способ иллюстрации зависимости между двумя величинами — построение таблиц, показывающих, как при изменении одной величины меняется другая.

Таблица 1

Производство молока оао "Молоко"

Производство молока в год, тыс. тонн.

Выработка продукции на 1 работающего,

тыс. усл. ден. ед.

до 30

34,2

30 — 50

37,3

свыше 50

42,7

Таблица показывает наличие связи, но она не определяет ни тесноту связи, ни форму этой связи.

Один из простых показателей тесноты корреляционной зависимости — показатель корреляции рангов.

Пример 1.

Таблица 2

Товарооборот и суммы издержек обращения по ряду магазинов

№ магазина

Товарооборот,

тыс. усл. ден. ед.

Издержки обращения,

тыс. усл. ден. ед.

1

480

30

2

510

25

3

530

31

4

540

28

5

570

29

6

590

32

7

620

36

8

640

36

9

650

37

10

660

38

Из таблицы видно, что с ростом товарооборота растут и издержки обращения. График также подтверждает это.

Издержки обращения,

тыс. усл. ден. ед.

Товарооборот,

тыс. усл. ден. ед.

Номер магазина

Рис.1. Товарооборот и суммы издержек обращения по ряду магазинов

В ряде случаев увеличение товарооборота ведет и к уменьшению издержек обращения, поскольку, помимо двух названных величин, в реальном процессе торговли участвуют и другие факторы, которые в рассмотрение не включены и носят случайный характер. Поэтому показателю корреляции рангов определяется теснота связи.

Абсолютные величины заменяются на ранги по такому правилу: самое меньшее значение — ранг 1, затем 2 и т.д. Если встречаются одинаковые значения, то каждое из них заменяется средним.

Показатель корреляции рангов :

,

где d – разница между рангами;

n – число значений в ряду.

Коэффициент показывает, как отличается полученная сумма квадратов разностей между рангами от случая отсутствия связи.

Показатель корреляции рангов изменяется от –1 до +1.

Если - связь прямая полная (тесная);

- связь обратная полная (тесная);

- связь отсутствует.

Показатель корреляции рангов для нашего примера:

Таблица 3

Показатели рангов

Товарооборот

Издержки

Разность рангов,

Квадрат разности

рангов,

1

4

-3

9

2

1

1

1

3

5

-2

4

4

2

2

4

5

3

2

4

6

6

0

0

7

7,5

-0,5

0,25

8

7,5

0,5

0,25

9

9

0

0

10

10

0

0

-

-

-

Полученный показатель свидетельствует о достаточно тесной связи между товарооборотом и издержками.

Корреляционный анализ с построением уравнения регрессии, планированием и прогнозированием

Методика проведения корреляционного анализа:

1. Из двух признаков выбирается один факторный признак (признак-причина)хирезультативный(признак, подверженный влиянию факторного признака) у. Например, из двух признаков: товарооборот магазина и численность населения микрорайона, факторным признаком является численность населения, который влияет на результативный признак – товарооборот магазина, но не наоборот.

2. С помощью корреляционного поляустанавливается наличие и форма связи.

Корреляционное поле– это точечный график, на оси абсцисс которого откладываются значения факторного признакахi, на оси ординат – результативногоуi. На пересечении значений наносятся точки по каждой единице наблюдения в отдельности.

Линейная форма связи Парабола

уi . . yi . . . ..

уn. . . .yn.. .. … .

. . . . . . . … . .. . .

. . . . . . . . . . .

у2. . . .y2 . . . . .

у1. .y1. . . .

х1x2…xnxiх1x2…xnxi

Рис.2. Корреляционное поле линейной формы связи и параболической

По совокупности точек делается вывод о форме связи: линейная, параболическая и т.д., предполагаемая линия наносится на график. В спорных случаях необходимо отдавать предпочтение более простым формам связи.

Для удобства и наглядности последующих расчетов необходимо оформить таблицу (для линейной формы связи): см. стр.6, табл. 4.

3. Корреляционная связь записывается в форме уравнения регрессии и вычисляются параметры уравнения:

y = a + b · x – линейная связь.

y = a + b · x + с · x – параболическая связь и т. д.

Для линейной формы связи параметры уравнения:

или

Средние значения ирассчитываются по формуле простой средней арифметической величине:

или

На основании полученных коэффициентов составляется уравнение регрессии:

,

где а – в общем случае начальная точка, может показывать величину результативного признака без применения факторного (не всегда имеет смысл);

b – коэффициент регрессии, показывает на сколько увеличится результативный признак при увеличении факторного признака на единицу.

4. Измеряется теснота связи с помощью коэффициентов корреляции r и детерминации d:

Коэффициент корреляции изменяется от -1 до +1 и показывает тесноту и направление корреляционной связи.

Если r = 1 - связь прямая полная (тесная);

r =-1 - связь обратная полная (тесная);

r = 0 - связь отсутствует.

d = r2

Коэффициент детерминации показывает, на сколько результативный признак изменяется под воздействием факторного.

Делается вывод о тесноте и характере связи.

5. Планирование результативного признака. Определяется, какая величина факторного признака необходима для достижения определенной величины результативного признака.

Задается величина , из уравнения регрессии находится величина х:

,

следовательно величина факторного признака должна быть:

х полученного значения при увеличении результативного признака;

х полученного значения при сокращении результативного признака.

6. Прогнозирование. Определяется значение результативного признака при заданном значении факторного признака. Для этого используется уравнение регрессии с учетом ошибки (погрешности) или точности модели , которая может быть вызвана влиянием прочих факторов:

Погрешность или точность модели:

,

где - расчетное значение результативного признака для каждой единицы совокупности в отдельности, полученное путем подставления в уравнение фактических значенийх;

n – число единиц совокупности;

р – число параметров уравнения.

После необходимых расчетов определяется значение результативного признака с учетом погрешности, т.е. допустимый интервал.

7. Проводится анализ деятельности путем сравнения значений результативного признака с теоретически возможными.

Если этот показатель

= 100% - уровень использования фактора оптимальный;

> 100% - превышение оптимального уровня,

< 100% - уровень ниже оптимального.

Расставляются ранги по величине факторного и результативного признаков: наилучшему показателю признака присваивается высший балл (1), наихудшему- низший (n).

Делается общий вывод.

Корреляционный анализ предыдущего примера (табл.2, пример 1):

1. Из двух признаков: объем товарооборота и издержки обращения, первый является факторным, второй – результативным, поскольку объем товарооборота влияет на величину издержек. Тогда,

х – объем товарооборота, тыс. усл. ден. ед.,

у – издержки, тыс. усл. ден. ед.

2. Строится корреляционное поле.

Издержки обращения, тыс. усл. ден. ед.

Объем товарооборота, тыс. усл. ден. ед.

Рис.3. Корреляционное поле товарооборота и издержек обращения по магазинам

Расположение точек на графике говорит о линейной связи.

Расчетную таблицу 5 см. на стр.10.

3. Уравнение регрессии:

y = a + b · x

Рассчитываются средние величины факторного и результативного признаков:

тыс. усл. ден. ед.

тыс. усл. ден. ед.

Определяются параметры уравнения:

Таким образом, издержки в случае отсутствия товарооборота были бы отрицательными, это не имеет экономического смысла, поэтому в данном случае а – лишь начальная точка.

При увеличении товарооборота на 1 тыс. усл. ден. ед. издержки обращения увеличатся на 0,06 тыс. усл. ден. ед.

4. Коэффициент корреляции:

Связь прямая, тесная.

Коэффициент детерминации:

d = 0,872 = 0,76

Таким образом, 76% изменения издержек обращения объясняется влиянием объема товарооборота, а 24% - влиянием других признаков.

5. Планирование. Допустим, в пятом магазине решили сократить издержки до 25 тыс. усл. ден. ед. Необходимо определить уровень товарооборота, соответствующий данному уровню издержек:

тыс. усл. ден. ед., тогда

тыс. усл. ден. ед.

Таким образом, объем товарооборота должен быть не более 461,7 тыс. усл. ден. ед., чтобы не превысить заданный уровень издержек.

6. Прогнозирование. Допустим, в шестом магазине увеличивают объем товарооборота до 650 тыс. усл. ден. ед. Необходимо знать, какой уровень издержек следует при этом ожидать.

Погрешность модели:

тыс. усл. ден. ед.

Тогда

или

Таким образом, при объеме товарооборота в 650 тыс. усл. ден. ед. величина издержек обращения будет составлять от 33,88 до 38,88 тыс. усл. ден. ед.

7. Анализ деятельности 10-ти магазинов показал: второй магазин сократили издержки (что в целом является благоприятным фактором) на 11%, пятый магазин на 8, четвертый на 6, шестой – на 3%. Сильное сокращение ниже нормы является отрицательным моментом, поскольку это происходит за счет переисользования других факторов.

По первому магазину превышен уровень издержек на 10%, по третьему на 6, по седьмому – на 4%, что также является нежелательным, как и сокращение.

Наиболее благоприятную работу по соотношению объема товарооборота и издержек обращения можно признать за восьмым магазином (100%), девятым (101%) и десятым (102%).

Если сравнивать магазины по соотношению: объем товарооборота выше, издержки обращения – ниже, то наиболее сбалансированными являются показатели по шестому магазину. По товарообороту магазин стоит на 5-м месте, по издержкам – на 6-м. Показатели остальных магазинов не сбалансированы. Например, при самом большом объеме товарооборота первый магазин стоит лишь на девятом месте по уровню издержек, и наоборот, второй магазин стоит на 1-м месте по уровню издержек, но занимает 9-е место по объему товарооборота.

Необходимо обратить внимание, что ранги результативного признака расставлены в прямом порядке, т.е. наименьшему значению издержек соответствует 1, наибольшему значению – 10. Ранги факторного признака расставлены в обратном порядке, т.е. наибольшему значению признака соответствует 1, наименьшему – 10. Это вызвано экономическим значением изучаемых признаков: магазины всегда стремятся увеличить товарооборот и снизить издержки обращения.

В ряде случаев возникает необходимость установления статистической связи между признаками, не имеющими количественного выражения.

Пример2.

На предприятии работает группа станков. В силу организационно-технических причин, периодически возникают простои. Было проведено 133 наблюдения за работой станков на протяжении дня , при этом в 59 случаях были отмечены простои, соответственно в 74 случаях их не было. После рационализаторского предложения, направленного на уменьшение простоев, вновь было проведено наблюдение, но уже за 66 станками. При этом в 27 случаях были отмечены простои, в 39 — нет. Необходимо установить: есть ли связь между сделанным предложением и уменьшением простоев.

В данном случае сопоставляются два альтернативных признака.

1 признак — наличие или отсутствие рационального предложения;

2 признак — наличие или отсутствие простоев.

Признаки нельзя выразить численно. Поэтому необходимо ввести условные обозначения.

Первый признак (х): наличие рационального предложения – (1), отсутствие - (0).

Второй признак (у): отсутствие простоев - (1), наличие простоев - (0).

Наблюдения заносятся в таблицу:

Таблица 6

66

133

199

0

27

74

101

1

39

59

98

y

x

1

0

Для центральной части таблицы вводится специальное обозначение:

c

d

a

b

Тогда коэффициент корреляции (коэффициент ассоциации) raимеет вид:

Коэффициент ассоциации также изменяется от -1 до +1.

Для примера 2:

Очень низкий коэффициент. Показывает, что связь между рациональным предложением и уменьшением числа простоев очень мала. Необходимы другие предложения по уменьшению числа простоев.