Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Tema_9_Statisticheskie_metody_analiza_vzaimosvyazey

.pdf
Скачиваний:
1
Добавлен:
17.06.2023
Размер:
422.33 Кб
Скачать

12.09.2016

Статистические методы

анализа взаимосвязей

социально-экономических явлений

ТЕМА 9

ЛЕКЦИЯ 17

Виды и формы взаимосвязей между явлениями

Общественная жизнь состоит из

большого количества сложных явлений, которые формируются под влиянием многочисленных, разнообразных и взаимосвязанных факторов Понять и изучить какое-либо явление

можно, исследуя его во взаимосвязи с окружающими признаками В статистике различают:

Факторные признаки

Результативные признаки

(x), обуславливающие

(y), изменяющиеся под

изменения других,

действием факторных

связанных с ними

признаков

признаков

 

 

 

 

 

 

 

КЛАССИФИКАЦИЯ СВЯЗЕЙ ПО СТЕПЕНИ ТЕСНОТЫ

Статистическая (стохастическая) связь - это такая связь между признаками, при которой для каждого значения признака-фактора X признакрезультат Y может в определенных пределах принимать любые значения с некоторыми вероятностями; при этом его статистические (массовые) характеристики (например, среднее значение) изменяются по определенному закону

Рисунок 9.1 - Статистическая связь между признаками X и Y

Формы проявления взаимосвязей весьма разнообразны Классификация связей между явлениями и их признаками

статистическая

 

прямая

(стохастическая)

 

обратная

функциональная

 

 

 

степень

направле-

 

ние

 

тесноты

 

действия

 

 

 

число

 

 

факторов

форма

 

(количество

 

(аналитическ

 

признаков,

 

ое выражение)

 

включенных

 

 

однофакторные

в модель)

линейные

 

многофакторные

 

нелинейные

Статистическая связь обусловлена

влиянием на

 

результативный

 

признак не только

неизбежностью

фактора X, но и

ошибок измерения

других факторов

значений признаков

 

 

(X и Y)

Парная регрессия может дать хороший результат при моделировании, если влиянием других факторов, воздействующих на результат, можно пренебречь

В экономике (в отличие от естественных наук)

невозможно контролировать поведение большинства экономических факторов

Влияние данных факторов нужно учитывать в модели

1

Модель стохастической связи может быть представлена в общем виде уравнением:

Y = f(X, и),

где Y - фактическое значение результативного признака;

f(X) - часть результативного признака, сформировавшаяся под воздействием фактора

X(или множества факторов; f(X1; …; Xm);

и- случайная составляющая, часть результативного признака, возникшая вследствие действия прочих (неучтенных)

факторов, а также ошибок измерения признаков

ЗАДАЧИ АНАЛИЗА МНОГОФАКТОРНОЙ ЗАВИСИМОСТИ:

1) сравнение степени влияния различных факторов на результат

3) выявление существенности

2) выделение прямого

влияния данного фактора

(непосредственного)

(группы факторов) на результат

на фоне других факторов

влияния фактора на

(нельзя ли исключить из модели

результат и косвенного

данный фактор без

(опосредованного) влияния

существенного ухудшения

фактора на результат

описания результирующей

(через другие факторы)

переменной)

 

12.09.2016

Пример. Уровень успеваемости студентов по статистике стохастически связан с целым комплексом факторов: склонностью к точным наукам, временем, затраченным на подготовку к предмету, состоянием здоровья студента и др.

Полный перечень факторов неизвестен

Кроме того, неодинаково действие любого известного фактора на успеваемость каждого студента

Например, при одной и той же успеваемости

разные студенты затрачивают неодинаковое время на подготовку. Кроме того, при одинаковых возможностях наблюдается вариация значений успеваемости студентов

На рисунке графически отображены связи всех

признаков для двухфакторной регрессии: Y= f(X1, X2,

и)

X1

 

 

Неучтенные в

 

 

модели

Y

.

факторы

 

 

 

 

.

 

 

.

 

X2

прямые связи

полные связи

косвенные

(опосредованные)

связи

Рисунок 9.2 - Граф связей модели: Y= f(X1, X2, и)

ЧАСТНЫМ СЛУЧАЕМ СТОХАСТИЧЕСКИХ СВЯЗЕЙ ЯВЛЯЮТСЯ КОРРЕЛЯЦИОННЫЕ СВЯЗИ

Корреляционная

связь

это связь, где воздействие отдельных факторов проявляется только как тенденция (в среднем) при массовом наблюдении фактических данных

В общественных явлениях существуют связи

корреляционные, когда каждому значению аргумента соответствует множество значений функции

Примеры: зависимости между размерами активов банка и суммой прибыли банка, ростом производительности труда и стажем работы сотрудников

КЛАССИФИКАЦИЯ СВЯЗЕЙ ПО СТЕПЕНИ ТЕСНОТЫ

Противоположностью статистической связи является функциональная связь

Функциональная связь - каждому возможному значению признака-фактора X соответствует одно или несколько строго определенных значений результативного признака Y

Она имеет место, когда все факторы, действующие на результативный признак, известны и учтены в модели и ошибки измерения отсутствуют

Рисунок 9.3 - Функциональная связь между признаками X и Y

2

Модель функциональной связи может быть представлена как Y = f(X)

Чаще всего функциональные связи наблюдаются в явлениях, описываемых математикой, физикой и другими точными науками

Функциональные связи имеют место и в социальноэкономических процессах, но довольно редко

Пример функциональной связи в экономике:

связь между показателем фондовооруженности - Y и показателями: стоимости основных производственных фондов – X1, и численностью промышленно-производственного персонала – X2

Для любой организации сферы производства наблюдается следующая зависимость между показателями: Y = X1 /X2.

Классификация связей в зависимости от направления действия

прямые : с увеличением (уменьшением) значений факторного признака происходит увеличение (уменьшение) результативного признака обратные : с увеличением (уменьшением) значений факторного

признака происходит уменьшение (увеличение) результативного

Пример. Чем выше квалификация рабочего, тем выше уровень

признака

производительности его труда (прямая связь).

Чем выше производительность труда, тем ниже себестоимость единицы продукции (обратная связь)

Классификация связей по аналитическому выражению (виду функции f)

прямолинейные: связь явлений развивается по прямой: с возрастанием величины факторного признака происходит равномерное возрастание

(или убывание) величин результативного признака (выражаются

уравнением прямой линии)

криволинейные: с возрастанием величины факторного признака возрастание (или убывание) результативного признака происходит неравномерно или направление его изменения меняется на обратное (выражаются уравнениями кривых линий: гиперболой, параболой, др.)

ЛЕКЦИЯ 18

Методы изучения статистической связи

12.09.2016

ОСОБЕННОСТИ СВЯЗЕЙ

ФУНКЦИОНАЛЬНОЙ КОРРЕЛЯЦИОННОЙ

Каждому значению величины факторного признака соответствует только одно или несколько точно определенных значений результативного признака

Она обычно выражается формулами, что в большей степени присуще точным наукам (математике, физике)

Функциональная зависимость с одинаковой силой проявляется у всех единиц совокупности

Она является полной и точной, так как обычно известны перечень всех факторов и механизм их воздействия на результативный признак в виде уравнения

Средняя величина результативного признака меняется под влиянием изменения многих факторных признаков (ряд из которых может быть неизвестен)

Разнообразие факторов, их взаимосвязи и противоречивые действия вызывают широкое варьирование результативного признака

Корреляционные связи обнаруживаются не в единичных случаях, а в массе и требуют для своего исследования массовых наблюдений

Связь между признаками-факторами

и результативным признаком неполная, а проявляется лишь в общем, среднем

КЛАССИФИКАЦИЯ СВЯЗЕЙ ПО ЧИСЛУ ФАКТОРОВ

парные (однофакторные): связь между одним признаком-фактором и результативным признаком (при абстрагировании влияния других)

множественные (многофакторные) - связь между несколькими факторными признаками и результативным признаком (факторы действуют комплексно, т.е. одновременно и во взаимосвязи)

Порядок изучения статистической связи

1 этап. Качественный (содержательный) анализ связи

определяется состав признаков, связь

производится предварительный анализ

между которыми будет анализироваться

формы связи

 

 

2 этап. Сбор данных (статистическое наблюдение)

3 этап. Количественная оценка тесноты связи по эмпирическим данным

Если оценивается взаимосвязь качественных

Если оценивается взаимосвязь

признаков, то данный этап заключительный

количественных признаков, то следует

переход к этапу 4

 

 

 

 

 

4 этап. Установление аналитической зависимости между

признаками (регрессионный анализ)

 

 

4.3 Оценка

4.4 Оценка надежности

4.1 Выбор формы связи

 

адекватности

уравнения (с

4.2 Оценка параметров

аналитического

использованием

(вида аналитического

уравнения связи

методов теории

уравнения

уравнения связи)

эмпирическим данным

вероятности и

 

 

 

(оценка качества

математической

 

 

уравнения)

статистики)

 

 

 

 

 

 

3

12.09.2016

МЕТОДЫ ИЗУЧЕНИЯ ФУНКЦИОНАЛЬНЫХ СВЯЗЕЙ

 

 

МЕТОДЫ ИЗУЧЕНИЯ КОРРЕЛЯЦИОННЫХ ВЗАИМОСВЯЗЕЙ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Балансовый метод

 

Индексный метод

 

 

Между атрибутивными

 

Между количественно-

 

 

 

 

 

 

варьирующими

 

 

 

 

Тема 7

 

 

признаками

 

признаками

 

 

 

 

 

 

 

 

 

 

Статистический баланс – система

 

 

 

 

метод взаимной

 

метод параллельных

 

 

показателей, состоящая из двух

 

 

 

 

 

 

 

 

 

 

 

сопряженности

 

рядов

 

 

сумм абсолютных величин,

 

 

 

 

 

 

 

связанных знаком равенства:

 

 

 

 

 

 

графический метод

 

 

A + C = D + E

 

 

 

 

 

 

(корреляционного

 

 

Посредством балансов связывают в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

поля)

 

 

единую систему абсолютные

 

 

 

 

 

 

 

 

 

 

 

 

 

 

табличный метод

 

 

величины, характеризующие

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(корреляционной

 

 

движение ресурсов

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

таблицы)

 

 

 

 

 

 

 

 

 

метод аналитических

 

 

 

 

 

 

 

 

 

группировок

 

 

 

 

 

 

 

 

 

корреляционно-

 

 

 

 

 

 

 

 

 

регрессионный анализ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ИЗМЕРЕНИЕ ТЕСНОТЫ СВЯЗЕЙ МЕЖДУ КАЧЕСТВЕННЫМИ (АТРИБУТИВНЫМИ) ПРИЗНАКАМИ

При корреляционной связи невозможно изучить влияние всех факторов, поэтому для ориентировочной оценки тесноты связи между факторными и результативными признаками пользуются

непараметрические методы оценки связи (методы взаимной сопряженности) для изучения связи между качественными признаками

Методика расчета и содержание показателей взаимной сопряженности

Показатель

Методика расчета и содержание показателя

 

 

Коэффициент

 

взаимной

 

сопряженност

где n - число наблюдений.

и Пирсона К.

 

 

Коэффициент изменяется от 0 до 1. Чем он ближе к 1, тем

 

теснее связь между атрибутивными признаками.

 

 

Коэффициент

 

ассоциации

 

где а, b, с, d - частоты «таблицы четырех полей».

Изменяется от -1 до +1. Чем ближе этот показатель к 1 или -1, тем сильнее связаны между собой изучаемые признаки. Если коэффициент ассоциации не ниже 0,3, можно говорить о наличии существенной связи между признаками.

При Кa =0 связь отсутствует.

Методика расчета и содержание показателей взаимной сопряженности

Показатель

Методика расчета и содержание показателя

 

 

 

 

Коэффициент

Применяется для измерения тесноты связи между

взаимной

варьированием двух атрибутивных признаков, когда

сопряженност

это варьирование образует несколько (три и более)

и Чупрова А.

групп

 

или

 

где fi fj - эмпирические частоты в i-й строке j-го столбца;

 

т - число групп по каждому признаку;

 

n - количество наблюдений.

 

Коэффициент изменяется от 0 до 1, но уже при

 

значении 0,3 можно говорить о тесной связи между

 

вариацией изучаемых качественных признаков.

 

Вторая формула применяется, если количество

 

наблюдений невелико

 

 

 

 

 

 

 

 

Методика расчета и содержание показателей взаимной сопряженности

Показатель

Методика расчета и содержание показателя

 

 

Коэффициент

контингенции

Коэффициент применяют в том случае, когда хотя бы одно значение из четырех показателей в «таблице четырех полей» отсутствует.

По абсолютной величине коэффициент контингенции всегда меньше

коэффициента ассоциации. Изменяется от -1 до +1. Чем ближе к 1 или -1, тем сильнее связаны изучаемые признаки

Биссериальный Коэффициент позволяет изучить связь между качественным коэффициент альтернативным и количественным варьирующим признаками

корреляции

где Y2; Y1 - средние ;

σγ - среднее квадратическое отклонение фактических значений признака от среднего уровня

р - доля первой группы в совокупности q - доля второй группы

Z - табличные значения Z-распределения в зависимости от р

4

МЕТОДЫ ИЗМЕРЕНИЕ СВЯЗЕЙ МЕЖДУ КОЛИЧЕСТВЕННЫМИ ПРИЗНАКАМИ

Метод параллельных рядов

Сущность заключается в сопоставлении значений факторного и результативного признаков

Для этого значения факторных признаков располагают в возрастающем или убывающем порядке

Параллельно записывают значения результативных признаков

Путем сопоставления расположенных таким образом рядов значений выявляют существование связи и ее направление

На основе сравнения параллельных рядов могут быть применены элементарные показатели,

характеризующие направление и тесноту связи

ПОКАЗАТЕЛИ, ХАРАКТЕРИЗУЮЩИЕ НАПРАВЛЕНИЕ И ТЕСНОТУ СВЯЗИ

Показатель

Методика расчета и содержание показателя

 

 

 

 

Коэффициент

Вычисляется не по первичным данным, а по рангам (порядковым

Спирмена

номерам), которые присваиваются согласно возрастанию значения

(коэффициент

признака

корреляции

Если встречаются одинаковые значения признака, то для них

рангов)

определяется средний ранг путем деления суммы рангов на число их

 

значений

 

Применяется для анализа связи двух значений (X, Y) и учитывает

 

согласованность рангов, т.е. номеров, которые занимают единицы

 

совокупности по каждому из этих признаков

 

где n - число наблюдений (ранжированных единиц),

 

d - разность между порядковыми номерами парных членов (d = Nx

 

Nj);

 

Σd2 = (Y-X)сумма квадратов разности рангов Y и X.

 

Данный коэффициент колеблется в пределах от -1 (полная

 

обратная корреляция рангов) до + 1 (полная корреляция рангов)

 

При ρ = 0, корреляция рангов отсутствует.

 

Значимость коэффициента корреляции рангов Спирмена

 

проверяется на основе t-критерия Стьюдента

 

 

 

 

 

 

 

 

ТАБЛИЧНЫЙ МЕТОД (КОРРЕЛЯЦИОННОЙ ТАБЛИЦЫ)

Корреляционная таблица простейший

прием выявления связи между двумя признаками

Если значения расположены в таблице беспорядочно, то связь между переменными отсутствует.

Если значения концентрируются около одной из двух диагоналей, то имеет место прямая или обратная связь.

12.09.2016

ПОКАЗАТЕЛИ, ХАРАКТЕРИЗУЮЩИЕ НАПРАВЛЕНИЕ

И ТЕСНОТУ СВЯЗИ

 

 

Показатель

Методика расчета и содержание показателя

 

 

Коэффициен

Создан немецким ученым Г. Фехнером

т Фехнера

Относится к непараметрическим критериям статистики.

(коэффициен

Основан на степени согласованности направлений отклонений

т корреляции

индивидуальных значений факторного и результативного признаков

знаков)

от соответствующих средних величин. Для расчета этого показателя

 

 

исчисляют средние значения факторного (х) и результативного (j)

 

признаков (по арифметической простой), а затем проставляют знаки

 

отклонений для значений взаимосвязанных пар признаков: если

 

фактическое значение признака больше средней величины, то

 

ставится знак «+», если меньше, то знак «-»)

 

где С - количество совпадений знаков;

 

Н - количество несовпадений знаков.

 

Коэффициент Фехнера может принимать любые значения в

 

пределах [-1; 1]

 

Если Кф = 1, то это значит, что знаки всех отклонений совпадают

 

Если знаки всех отклонений будут разными, то Кф = 0

 

Если Кф = -1, то это дает возможность предположить наличие

 

обратной связи

 

Этот показатель позволяет уловить направление связи, между двумя

 

количественными признаками но не учитывать точно ее величину.

ПОКАЗАТЕЛИ, ХАРАКТЕРИЗУЮЩИЕ НАПРАВЛЕНИЕ И ТЕСНОТУ СВЯЗИ

Показатель

Методика расчета и содержание показателя

Множественный Используется для оценки степеней тесноты связи между

коэффициент несколькими признаками (3 и более) при использовании ранговой ранговой корреляции

корреляции (коэффициент конкордации)

где m - число факторов, между которыми изучается связь п - число ранжированных единиц;

S - сумма квадратов отклонений рангов.

Коэффициент изменяется в пределах от 0 до 1 и характеризует степень тесноты связи, но уже при значении 0,5 можно говорить о тесной связи между вариацией изучаемых признаков

ПРИМЕР. В КОРРЕЛЯЦИОННОЙ ТАБЛИЦЕ ПРЕДСТАВЛЕНЫ ИТОГИ СТАТИСТИЧЕСКОГО НАБЛЮДЕНИЯ СВЯЗИ УРОВНЯ ОПЛАТЫ ТРУДА С ПРОИЗВОДСТВЕННЫМ СТАЖЕМ РАБОТЫ

Стаж

 

Уровень оплаты (Yi), руб.

Итого

Средни

работы

 

 

 

 

 

 

й

(Xi),

8500-

 

8750-

9000-

9250 и

 

уровень

лет

8750

 

9000

9250

выше

 

оплаты

0

2

 

1

-

-

3

8708,3

 

 

 

 

 

 

 

 

1

1

 

1

1

-

3

8875,0

 

 

 

 

 

 

 

 

2

-

 

1

-

1

2

9125,0

 

 

 

 

 

 

 

 

3

-

 

-

-

1

1

9375,0

 

 

 

 

 

 

 

 

4

-

 

-

-

2

2

9375,0

 

 

 

 

 

 

 

 

Всего

3

 

1

1

4

11

-

 

 

 

 

 

 

 

 

Средни

0,333

 

1,000

1,000

3,250

-

-

й стаж

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

ГРАФИЧЕСКИЙ МЕТОД (КОРРЕЛЯЦИОННОГО ПОЛЯ)

Связь между признаками можно увидеть, если построить, отложив на оси абсцисс значения факторного признака (X), на оси ординат - значения результативного признака.

Нанеся на графике точки, соответствующие значениям X и Y, можно получить корреляционное поле, благодаря которому по характеру расположения точек можно судить о направлении

и силе связи

Если точки беспорядочно разбросаны по всему полю, это свидетельствует об отсутствии зависимости

между двумя признаками

Если они концентрируются вокруг оси, идущей от нижнего левого угла в верхний правый, то имеется

прямая зависимость между варьирующими признаками

Если точки концентрируются вокруг оси, идущей от верхнего левого угла в нижний правый, то существует

обратная зависимость

ОДНОФАКТОРНЫЙ И МНОГОФАКТОРНЫЙ КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ

Корреляционно-регрессионный анализ предполагает установление аналитической формы связи (регрессионный анализ) и измерение тесноты, направления связи (корреляционный анализ)

Описание регрессии на эмпирическом уровне сводится к построению эмпирической регрессии

Эмпирическая регрессия строится по данным аналитической или комбинационной группировок и

представляет собой зависимость групповых средних значений признака-результата от групповых средних значений признака-фактора

По существу, и корреляционная таблица, корреляционное поле и эмпирическая линия регрессии уже характеризуют взаимосвязь

Однако оценка тесноты связи требует дополнительных расчетов

12.09.2016

Рисунок 9.4 – Эмпирическая регрессия оплаты труда и производственного стажа

Графическим представлением эмпирической регрессии является линия эмпирической

регрессии

Эмпирическая линия регрессии отражает основную тенденцию рассматриваемой зависимости

Если эмпирическая линия регрессии по своему виду

приближается к прямой линии, то можно предположить наличие прямолинейной

корреляционной связи между признаками

А если линия связи приближается к кривой, то это может быть связано с наличием криволинейной

корреляционной связи

ТИПЫ ФУНКЦИЙ, ИСПОЛЬЗУЕМЫХ ДЛЯ ХАРАКТЕРИСТИКИ РЕГРЕССИИ

Линейная

регрессия

Параболическая Степенная связь функция

Показательна

Гиперболическа

я функция

я связь

Логистическа

Полулогарифмическа

я функция

я функция

6

Соседние файлы в предмете Статистика