- •Изучение статистической связи
- •Методы изучения статистической связи
- •Производство молока оао "Молоко"
- •Товарооборот и суммы издержек обращения по ряду магазинов
- •Показатели рангов
- •Корреляционный анализ с построением уравнения регрессии, планированием и прогнозированием
- •Контрольная работа № 5
- •Положение
- •I. Общие положения
- •II. Государственная статистическая отчетность, порядок ее представления
- •III. Об ответственности за нарушения порядка представления государственной статистической отчетности
Методы изучения статистической связи
Наиболее простой способ иллюстрации зависимости между двумя величинами — построение таблиц, показывающих, как при изменении одной величины меняется другая.
Таблица 1
Производство молока оао "Молоко"
Производство молока в год, тыс. тонн. |
Выработка продукции на 1 работающего, тыс. усл. ден. ед. |
до 30 |
34,2 |
30 — 50 |
37,3 |
свыше 50 |
42,7 |
Таблица показывает наличие связи, но она не определяет ни тесноту связи, ни форму этой связи.
Один из простых показателей тесноты корреляционной зависимости — показатель корреляции рангов.
Пример 1.
Таблица 2
Товарооборот и суммы издержек обращения по ряду магазинов
№ магазина |
Товарооборот, тыс. усл. ден. ед. |
Издержки обращения, тыс. усл. ден. ед. |
1 |
480 |
30 |
2 |
510 |
25 |
3 |
530 |
31 |
4 |
540 |
28 |
5 |
570 |
29 |
6 |
590 |
32 |
7 |
620 |
36 |
8 |
640 |
36 |
9 |
650 |
37 |
10 |
660 |
38 |
Из таблицы видно, что с ростом товарооборота растут и издержки обращения. График также подтверждает это.
Издержки
обращения, тыс.
усл. ден. ед.
Товарооборот,
тыс.
усл. ден. ед.
Номер
магазина
Рис.1. Товарооборот и суммы издержек обращения по ряду магазинов
В ряде случаев увеличение товарооборота ведет и к уменьшению издержек обращения, поскольку, помимо двух названных величин, в реальном процессе торговли участвуют и другие факторы, которые в рассмотрение не включены и носят случайный характер. Поэтому показателю корреляции рангов определяется теснота связи.
Абсолютные величины заменяются на ранги по такому правилу: самое меньшее значение — ранг 1, затем 2 и т.д. Если встречаются одинаковые значения, то каждое из них заменяется средним.
Показатель корреляции рангов :
,
где d – разница между рангами;
n – число значений в ряду.
Коэффициент показывает, как отличается полученная сумма квадратов разностей между рангами от случая отсутствия связи.
Показатель корреляции рангов изменяется от –1 до +1.
Если - связь прямая полная (тесная);
- связь обратная полная (тесная);
- связь отсутствует.
Показатель корреляции рангов для нашего примера:
Таблица 3
Показатели рангов
Товарооборот |
Издержки |
Разность рангов, |
Квадрат разности рангов, |
1 |
4 |
-3 |
9 |
2 |
1 |
1 |
1 |
3 |
5 |
-2 |
4 |
4 |
2 |
2 |
4 |
5 |
3 |
2 |
4 |
6 |
6 |
0 |
0 |
7 |
7,5 |
-0,5 |
0,25 |
8 |
7,5 |
0,5 |
0,25 |
9 |
9 |
0 |
0 |
10 |
10 |
0 |
0 |
- |
- |
- |
|
Полученный показатель свидетельствует о достаточно тесной связи между товарооборотом и издержками.
Корреляционный анализ с построением уравнения регрессии, планированием и прогнозированием
Методика проведения корреляционного анализа:
1. Из двух признаков выбирается один факторный признак (признак-причина)хирезультативный(признак, подверженный влиянию факторного признака) у. Например, из двух признаков: товарооборот магазина и численность населения микрорайона, факторным признаком является численность населения, который влияет на результативный признак – товарооборот магазина, но не наоборот.
2. С помощью корреляционного поляустанавливается наличие и форма связи.
Корреляционное поле– это точечный график, на оси абсцисс которого откладываются значения факторного признакахi, на оси ординат – результативногоуi. На пересечении значений наносятся точки по каждой единице наблюдения в отдельности.
Линейная форма связи Парабола
уi . . yi . . . ..
уn. . . .yn.. .. … .
. . . . . . . … . .. . .
. . . . . . . . . . .
у2. . . .y2 . . . . .
у1. .y1. . . .
х1x2…xnxiх1x2…xnxi
Рис.2. Корреляционное поле линейной формы связи и параболической
По совокупности точек делается вывод о форме связи: линейная, параболическая и т.д., предполагаемая линия наносится на график. В спорных случаях необходимо отдавать предпочтение более простым формам связи.
Для удобства и наглядности последующих расчетов необходимо оформить таблицу (для линейной формы связи): см. стр.6, табл. 4.
3. Корреляционная связь записывается в форме уравнения регрессии и вычисляются параметры уравнения:
y = a + b · x – линейная связь.
y = a + b · x + с · x – параболическая связь и т. д.
Для линейной формы связи параметры уравнения:
или
Средние значения ирассчитываются по формуле простой средней арифметической величине:
или
На основании полученных коэффициентов составляется уравнение регрессии:
,
где а – в общем случае начальная точка, может показывать величину результативного признака без применения факторного (не всегда имеет смысл);
b – коэффициент регрессии, показывает на сколько увеличится результативный признак при увеличении факторного признака на единицу.
4. Измеряется теснота связи с помощью коэффициентов корреляции r и детерминации d:
Коэффициент корреляции изменяется от -1 до +1 и показывает тесноту и направление корреляционной связи.
Если r = 1 - связь прямая полная (тесная);
r =-1 - связь обратная полная (тесная);
r = 0 - связь отсутствует.
d = r2
Коэффициент детерминации показывает, на сколько результативный признак изменяется под воздействием факторного.
Делается вывод о тесноте и характере связи.
5. Планирование результативного признака. Определяется, какая величина факторного признака необходима для достижения определенной величины результативного признака.
Задается величина , из уравнения регрессии находится величина х:
,
следовательно величина факторного признака должна быть:
х полученного значения при увеличении результативного признака;
х полученного значения при сокращении результативного признака.
6. Прогнозирование. Определяется значение результативного признака при заданном значении факторного признака. Для этого используется уравнение регрессии с учетом ошибки (погрешности) или точности модели , которая может быть вызвана влиянием прочих факторов:
Погрешность или точность модели:
,
где - расчетное значение результативного признака для каждой единицы совокупности в отдельности, полученное путем подставления в уравнение фактических значенийх;
n – число единиц совокупности;
р – число параметров уравнения.
После необходимых расчетов определяется значение результативного признака с учетом погрешности, т.е. допустимый интервал.
7. Проводится анализ деятельности путем сравнения значений результативного признака с теоретически возможными.
Если этот показатель
= 100% - уровень использования фактора оптимальный;
> 100% - превышение оптимального уровня,
< 100% - уровень ниже оптимального.
Расставляются ранги по величине факторного и результативного признаков: наилучшему показателю признака присваивается высший балл (1), наихудшему- низший (n).
Делается общий вывод.
Корреляционный анализ предыдущего примера (табл.2, пример 1):
1. Из двух признаков: объем товарооборота и издержки обращения, первый является факторным, второй – результативным, поскольку объем товарооборота влияет на величину издержек. Тогда,
х – объем товарооборота, тыс. усл. ден. ед.,
у – издержки, тыс. усл. ден. ед.
2. Строится корреляционное поле.
Издержки
обращения, тыс. усл. ден. ед.
Объем
товарооборота, тыс. усл. ден. ед.
Рис.3. Корреляционное поле товарооборота и издержек обращения по магазинам
Расположение точек на графике говорит о линейной связи.
Расчетную таблицу 5 см. на стр.10.
3. Уравнение регрессии:
y = a + b · x
Рассчитываются средние величины факторного и результативного признаков:
тыс. усл. ден. ед.
тыс. усл. ден. ед.
Определяются параметры уравнения:
Таким образом, издержки в случае отсутствия товарооборота были бы отрицательными, это не имеет экономического смысла, поэтому в данном случае а – лишь начальная точка.
При увеличении товарооборота на 1 тыс. усл. ден. ед. издержки обращения увеличатся на 0,06 тыс. усл. ден. ед.
4. Коэффициент корреляции:
Связь прямая, тесная.
Коэффициент детерминации:
d = 0,872 = 0,76
Таким образом, 76% изменения издержек обращения объясняется влиянием объема товарооборота, а 24% - влиянием других признаков.
5. Планирование. Допустим, в пятом магазине решили сократить издержки до 25 тыс. усл. ден. ед. Необходимо определить уровень товарооборота, соответствующий данному уровню издержек:
тыс. усл. ден. ед., тогда
тыс. усл. ден. ед.
Таким образом, объем товарооборота должен быть не более 461,7 тыс. усл. ден. ед., чтобы не превысить заданный уровень издержек.
6. Прогнозирование. Допустим, в шестом магазине увеличивают объем товарооборота до 650 тыс. усл. ден. ед. Необходимо знать, какой уровень издержек следует при этом ожидать.
Погрешность модели:
тыс. усл. ден. ед.
Тогда
или
Таким образом, при объеме товарооборота в 650 тыс. усл. ден. ед. величина издержек обращения будет составлять от 33,88 до 38,88 тыс. усл. ден. ед.
7. Анализ деятельности 10-ти магазинов показал: второй магазин сократили издержки (что в целом является благоприятным фактором) на 11%, пятый магазин на 8, четвертый на 6, шестой – на 3%. Сильное сокращение ниже нормы является отрицательным моментом, поскольку это происходит за счет переисользования других факторов.
По первому магазину превышен уровень издержек на 10%, по третьему на 6, по седьмому – на 4%, что также является нежелательным, как и сокращение.
Наиболее благоприятную работу по соотношению объема товарооборота и издержек обращения можно признать за восьмым магазином (100%), девятым (101%) и десятым (102%).
Если сравнивать магазины по соотношению: объем товарооборота выше, издержки обращения – ниже, то наиболее сбалансированными являются показатели по шестому магазину. По товарообороту магазин стоит на 5-м месте, по издержкам – на 6-м. Показатели остальных магазинов не сбалансированы. Например, при самом большом объеме товарооборота первый магазин стоит лишь на девятом месте по уровню издержек, и наоборот, второй магазин стоит на 1-м месте по уровню издержек, но занимает 9-е место по объему товарооборота.
Необходимо обратить внимание, что ранги результативного признака расставлены в прямом порядке, т.е. наименьшему значению издержек соответствует 1, наибольшему значению – 10. Ранги факторного признака расставлены в обратном порядке, т.е. наибольшему значению признака соответствует 1, наименьшему – 10. Это вызвано экономическим значением изучаемых признаков: магазины всегда стремятся увеличить товарооборот и снизить издержки обращения.
В ряде случаев возникает необходимость установления статистической связи между признаками, не имеющими количественного выражения.
Пример2.
На предприятии работает группа станков. В силу организационно-технических причин, периодически возникают простои. Было проведено 133 наблюдения за работой станков на протяжении дня , при этом в 59 случаях были отмечены простои, соответственно в 74 случаях их не было. После рационализаторского предложения, направленного на уменьшение простоев, вновь было проведено наблюдение, но уже за 66 станками. При этом в 27 случаях были отмечены простои, в 39 — нет. Необходимо установить: есть ли связь между сделанным предложением и уменьшением простоев.
В данном случае сопоставляются два альтернативных признака.
1 признак — наличие или отсутствие рационального предложения;
2 признак — наличие или отсутствие простоев.
Признаки нельзя выразить численно. Поэтому необходимо ввести условные обозначения.
Первый признак (х): наличие рационального предложения – (1), отсутствие - (0).
Второй признак (у): отсутствие простоев - (1), наличие простоев - (0).
Наблюдения заносятся в таблицу:
Таблица 6
|
66 |
133 |
199 |
0 |
27 |
74 |
101 |
1 |
39 |
59 |
98 |
y x |
1 |
0 |
|
Для центральной части таблицы вводится специальное обозначение:
c |
d |
a |
b |
Тогда коэффициент корреляции (коэффициент ассоциации) raимеет вид:
Коэффициент ассоциации также изменяется от -1 до +1.
Для примера 2:
Очень низкий коэффициент. Показывает, что связь между рациональным предложением и уменьшением числа простоев очень мала. Необходимы другие предложения по уменьшению числа простоев.