Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1_semestr / Статистика / методичка по статистике / методичка по статистике.doc
Скачиваний:
62
Добавлен:
07.03.2015
Размер:
838.14 Кб
Скачать

Количественные критерии оценки тесноты связи

Величина

коэффициента корреляции

Характер связи

До |±0,3|

практически отсутствует

|±0,3| - |±0,5|

Слабая

|+0,5| - |±0,7|

Умеренная

|±0,7| - |±1,0|

сильная

По направлению выделяют связь прямую и обратную. При прямой связи с увеличением или уменьшением значений фак­торного признака происходит увеличение или уменьшение зна­чений результативного. Например, увеличение степени механи­зации труда способствует росту рентабельности строительного производства. В случае обратной связи значения результативно­го признака изменяются в противоположном направлении по сравнению с изменением факторного признака. Так, с увеличе­нием уровня фондоотдачи снижается себестоимость единицы производимой продукции.

По аналитическому выражению выделяют связи прямоли­нейные (или просто линейные) и нелинейные (криволиней­ные). Если статистическая связь между явлениями приближен­но выражена уравнением прямой линии, то ее называют линей­ной связью; если же она выражена уравнением какой-либо кри­вой линии (параболы, гиперболы: степенной, показательной, экспоненциальной и т. д.), то такую связь называют нелинейной или криволинейной.

Для выявления наличия связи, ее характера и направления в статистике используются методы: приведения параллельных данных, аналитических группировок, графический, корреляции и регрессии.

Парная регрессия характеризует связь между двумя призна­ками: результативным и факторным. Аналитически связь между ними описывается уравнениями:

прямой

параболы

гиперболы и т.д.

Определить тип уравнения можно, исследуя зависимость графически. Однако существуют более общие указания, позво­ляющие выявить уравнение связи, не прибегая к графическому изображению. Если результативный и факторный признаки воз­растают одинаково, примерно в арифметической прогрессии, то это свидетельствует о наличии линейной связи между ними, а при обратной связи - гиперболической. Если результативный при­знак увеличивается в арифметической прогрессии, а факторный значительно быстрее, то используется параболическая или сте­пенная функции.

Оценка параметров уравнения регрессии а0, а12 - в урав­нении параболы второго порядка) осуществляется методом наи­меньших квадратов, в основе которого лежит предположение о независимости наблюдений исследуемой совокупности и нахож­дении параметров модели (а0 и а1), при котором минимизируется сумма квадратов отклонений эмпирических (фактических) зна­чений результативного признака от теоретических, полученных по уравнению регрессии:

Система нормальных уравнений для нахождения параметров линейной парной регрессии методом наименьших квадратов имеет следующий вид:

где n - объем исследуемой совокупности (число единиц наблюдения).

В уравнениях регрессии параметр а0 показывает усреднен­ное влияние на результативный признак неучтенных (не выде­ленных для исследования) факторов; параметр а1 (а в уравнении параболы и а2) - коэффициент регрессии показывает, насколько изменяется в среднем значение результативного признака при изменении факторного на единицу его собственного измерения.

Модель регрессии может быть построена как по индивиду­альным значениям признака, так и по сгруппирован­ным данным.

Множественная (многофакторная) регрессия. Изучение связи между тремя и более связанными между собой признака­ми носит название множественной (многофакторной) регрес­сии, описываемой функцией вида:

Построение моделей множественной регрессии включает этапы:

1) выбор формы связи (уравнения регрессии);

2) отбор факторных признаков;

3) обеспечение достаточного объема совокупности для полу­чения несмещенных оценок.

Выбор типа уравнения затрудняется тем, что для любой формы зависимости можно выбрать целый ряд уравнений, кото­рые в определенной степени будут описывать эти связи. Посколь­ку уравнение регрессии строится главным образом для объясне­ния и количественного выражения взаимосвязей, оно должно хорошо отражать сложившиеся между исследуемыми фактора­ми фактические связи.

Практика построения многофакторных моделей взаимосвязи показывает, что все реально существующие зависимости между социально-экономическими явлениями можно описать, исполь­зуя пять типов моделей:

1) линейная:

2) степенная:

3) показательная: (9.5)

4) параболическая:

5) гиперболическая:

Основное значение имеют линейные модели в силу простоты и логичности их экономической интерпретации. Нелинейные формы зависимости приводятся к линейным путем линеариза­ции.

Важным этапом построения уже выбранного уравнения мно­жественной регрессии являются отбор и последующее включе­ние факторных признаков.

Проблема отбора факторных признаков для построения мо­делей взаимосвязи может быть решена на основе эвристических (интуитивно-логических) или многомерных статистических ме­тодов анализа.

Наиболее приемлемым способом отбора факторных призна­ков является шаговая регрессия (шаговый регрессионный ана­лиз). Сущность метода шаговой регрессии заключается в после­довательном включении факторов в уравнение регрессии и пос­ледующей проверке их значимости. Факторы поочередно вводятся в уравнение так называемым «прямым методом». При проверке значимости введенного фактора определяется, насколько умень­шается сумма квадратов остатков и, увеличивается величина множественного коэффициента корреляции (R2). Одновременно используется и обратный метод, т. е. исключение факторов, став­ших незначимыми на основе t-критерия Стьюдента.

При построении моделей регрессии студент может столкнуть­ся и с проблемой мультиколлинеарности, под которой понима­ется тесная зависимость между факторными признаками, вклю­ченными в модель. Мультиколлинеарность существенно искажа­ет результаты исследования.

Одним из индикаторов определения наличия мультиколлине­арности между факторными признаками является превышение величины парного коэффициента корреляции 0,8 ().

Устранение мультиколлинеарности может реализовываться через исключение из корреляционной модели одного или несколь­ких линейно-связанных факторных признаков или преобразова­нием исходных факторных признаков в новые, укрупненные фак­торы.

Оценка существенности связи. Принятие решений на ос­нове уравнения регрессии. Проверка адекватности моделей, построенных на основе уравнений регрессии, начинается с про­верки значимости каждого коэффициента регрессии.

Значимость коэффициента регрессии осуществляется с по­мощью t-критерия Стьюдента:

где 2аi - дисперсия коэффициента регрессии.

Параметр модели признается статистически значимым, если tp > tkp (; v = n - k - 1), где  - уровень значимости, v = n - k - 1 - число степеней свободы.

Величина 2аi может быть определена по выражению:

где 2у - дисперсия результативного признака;

k - число факторных признаков в уравнении.

Более точную оценку величины дисперсии можно получить по формуле:

где Ri - величина множественного коэффициента корреляции по фактору хi с остальными факторами.

Проверка адекватности всей модели осуществляется с помо­щью расчета F-критерия и величины средней ошибки аппрокси­мации ().

Значение средней ошибки аппроксимации, определяемой по формуле

не должно превышать 12-15%.

Интерпретация моделей регрессий осуществляется метода­ми той отрасли знаний, к которой относятся исследуемые явле­ния. Но всякая интерпретация начинается со статистической оценки уравнения регрессии в целом и оценки зависимости вхо­дящих в модель факторных признаков, т. е. с выяснения, как они влияют на величину результативного признака. Чем больше ве­личина коэффициента регрессии, тем значительнее влияние дан­ного признака на моделируемый. Особое значение при этом имеет знак перед коэффициентом регрессии. Знаки коэффициентов регрессии говорят о характере влияния на результативный при­знак. Если факторный признак имеет знак плюс, то с увеличени­ем данного фактора результативный признак возрастает. Если факторный признак имеет знак минус, то с его увеличением результативный признак уменьшается. Анализ модели по данным табл. 9.4. свидетельствует о том, что увеличение кредитных вло­жений и собственного капитала влечет рост стоимости активов коммерческих банков.

С целью расширения возможностей экономического анализа используются частные коэффициенты эластичности, опреде­ляемые по формуле

где - среднее значение соответствующего факторного признака;

- среднее значение результативного признака;

ai - коэффициент регрессии при соответствующем факторном признаке.

Коэффициент эластичности показывает, на сколько процен­тов в среднем изменится значение результативного признака при изменении факторного признака на 1%.

Множественный коэффициент детерминации (R2), пред­ставляющий собой множественный коэффициент корреляции в квадрате, показывает, какая доля вариации результативного при­знака обусловлена изменением факторных признаков, входящих в многофакторную регрессионную модель.

Для более точной оценки влияния каждого факторного при­знака на моделируемый используется Q-коэффициент, определя­емый по формуле:

где - коэффициент вариации соответствующего факторного признака.

Изме­нение тесноты и направления связи является важной задачей изучения и количественного измерения взаимосвязи социально-экономических явлений.

Теснота связи при линейной зависимости измеряется с помо­щью линейного коэффициента корреляции.

В статистической теории разработаны и на практике приме­няются различные модификации формул расчета данного коэф­фициента:

Производя расчет по итоговым значениям исходных перемен­ных, линейный коэффициент корреляции можно вычислить по формуле:

Линейный коэффициент корреляции может быть также вы­ражен через дисперсии слагаемых:

Между линейным коэффициентом корреляции и коэффици­ентом регрессии существует определенная зависимость, которую можно математически выразить следующей формулой:

где ai - коэффициент регрессии в уравнении связи;

хi - среднее квадратическое отклонение соответствующего факторного признака.

Линейный коэффициент корреляции изменяется в пределах от -1 до 1: -1 < г < 1. Знаки коэффициентов регрессии и корреляции совпадают. При этом интерпретацию выходных значений коэффициента корреляции можно представить в табл. 9.5.

Таблица 9.5