- •Статистика
- •II. Содержание дисциплины
- •III. Краткие сведения из теории
- •3.1. Предмет и методы статистики
- •3.2. Статистическое наблюдение
- •3.3. Статистическая сводка и группировка.
- •4.4. Абсолютные статистические величины
- •4.5. Средние величины
- •Средняя арифметическая.
- •Средняя гармоническая
- •Средняя геометрическая
- •Структурные средние
- •4.6. Изучение вариации признака в совокупности
- •Правило сложения дисперсий
- •4.6. Выборочное наблюдение
- •4.6. Статистическое изучение рядов динамики
- •4.7. Индексные метод в статистике
- •1) Физического объема:
- •2) Цен:
- •4.8. Статистическое изучение взаимосвязей
- •Количественные критерии оценки тесноты связи
- •Оценка линейного коэффициента корреляции
- •III. Задание к контрольной работе Задание 1
- •Задание 2
- •Задание 3
- •Задание 4.
- •V. Материалы для практических занятий
- •5.1. Стаистическое наблюдение
- •5.2. Сводка и группировка статистических данных.
- •5.3. Статистические показатели
- •5.4. Распределение признака в совокупности
- •5.5. Выборочные наблюдения.
- •5.6. Ряды динамики
- •5.6. Индексы
- •Статистическое изучение взаимосвязей.
- •VI. Рекомендуемая литература.
- •Итоги деятельности предприятий промышленности региона за год
- •Исходный данные для решения задачи 3
Количественные критерии оценки тесноты связи
Величина коэффициента корреляции |
Характер связи
|
До |±0,3| |
практически отсутствует |
|±0,3| - |±0,5| |
Слабая |
|+0,5| - |±0,7| |
Умеренная |
|±0,7| - |±1,0| |
сильная |
По направлению выделяют связь прямую и обратную. При прямой связи с увеличением или уменьшением значений факторного признака происходит увеличение или уменьшение значений результативного. Например, увеличение степени механизации труда способствует росту рентабельности строительного производства. В случае обратной связи значения результативного признака изменяются в противоположном направлении по сравнению с изменением факторного признака. Так, с увеличением уровня фондоотдачи снижается себестоимость единицы производимой продукции.
По аналитическому выражению выделяют связи прямолинейные (или просто линейные) и нелинейные (криволинейные). Если статистическая связь между явлениями приближенно выражена уравнением прямой линии, то ее называют линейной связью; если же она выражена уравнением какой-либо кривой линии (параболы, гиперболы: степенной, показательной, экспоненциальной и т. д.), то такую связь называют нелинейной или криволинейной.
Для выявления наличия связи, ее характера и направления в статистике используются методы: приведения параллельных данных, аналитических группировок, графический, корреляции и регрессии.
Парная регрессия характеризует связь между двумя признаками: результативным и факторным. Аналитически связь между ними описывается уравнениями:
прямой
параболы
гиперболы и т.д.
Определить тип уравнения можно, исследуя зависимость графически. Однако существуют более общие указания, позволяющие выявить уравнение связи, не прибегая к графическому изображению. Если результативный и факторный признаки возрастают одинаково, примерно в арифметической прогрессии, то это свидетельствует о наличии линейной связи между ними, а при обратной связи - гиперболической. Если результативный признак увеличивается в арифметической прогрессии, а факторный значительно быстрее, то используется параболическая или степенная функции.
Оценка параметров уравнения регрессии а0, а1 (а2 - в уравнении параболы второго порядка) осуществляется методом наименьших квадратов, в основе которого лежит предположение о независимости наблюдений исследуемой совокупности и нахождении параметров модели (а0 и а1), при котором минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по уравнению регрессии:
Система нормальных уравнений для нахождения параметров линейной парной регрессии методом наименьших квадратов имеет следующий вид:
где n - объем исследуемой совокупности (число единиц наблюдения).
В уравнениях регрессии параметр а0 показывает усредненное влияние на результативный признак неучтенных (не выделенных для исследования) факторов; параметр а1 (а в уравнении параболы и а2) - коэффициент регрессии показывает, насколько изменяется в среднем значение результативного признака при изменении факторного на единицу его собственного измерения.
Модель регрессии может быть построена как по индивидуальным значениям признака, так и по сгруппированным данным.
Множественная (многофакторная) регрессия. Изучение связи между тремя и более связанными между собой признаками носит название множественной (многофакторной) регрессии, описываемой функцией вида:
Построение моделей множественной регрессии включает этапы:
1) выбор формы связи (уравнения регрессии);
2) отбор факторных признаков;
3) обеспечение достаточного объема совокупности для получения несмещенных оценок.
Выбор типа уравнения затрудняется тем, что для любой формы зависимости можно выбрать целый ряд уравнений, которые в определенной степени будут описывать эти связи. Поскольку уравнение регрессии строится главным образом для объяснения и количественного выражения взаимосвязей, оно должно хорошо отражать сложившиеся между исследуемыми факторами фактические связи.
Практика построения многофакторных моделей взаимосвязи показывает, что все реально существующие зависимости между социально-экономическими явлениями можно описать, используя пять типов моделей:
1) линейная:
2) степенная:
3) показательная: (9.5)
4) параболическая:
5) гиперболическая:
Основное значение имеют линейные модели в силу простоты и логичности их экономической интерпретации. Нелинейные формы зависимости приводятся к линейным путем линеаризации.
Важным этапом построения уже выбранного уравнения множественной регрессии являются отбор и последующее включение факторных признаков.
Проблема отбора факторных признаков для построения моделей взаимосвязи может быть решена на основе эвристических (интуитивно-логических) или многомерных статистических методов анализа.
Наиболее приемлемым способом отбора факторных признаков является шаговая регрессия (шаговый регрессионный анализ). Сущность метода шаговой регрессии заключается в последовательном включении факторов в уравнение регрессии и последующей проверке их значимости. Факторы поочередно вводятся в уравнение так называемым «прямым методом». При проверке значимости введенного фактора определяется, насколько уменьшается сумма квадратов остатков и, увеличивается величина множественного коэффициента корреляции (R2). Одновременно используется и обратный метод, т. е. исключение факторов, ставших незначимыми на основе t-критерия Стьюдента.
При построении моделей регрессии студент может столкнуться и с проблемой мультиколлинеарности, под которой понимается тесная зависимость между факторными признаками, включенными в модель. Мультиколлинеарность существенно искажает результаты исследования.
Одним из индикаторов определения наличия мультиколлинеарности между факторными признаками является превышение величины парного коэффициента корреляции 0,8 ().
Устранение мультиколлинеарности может реализовываться через исключение из корреляционной модели одного или нескольких линейно-связанных факторных признаков или преобразованием исходных факторных признаков в новые, укрупненные факторы.
Оценка существенности связи. Принятие решений на основе уравнения регрессии. Проверка адекватности моделей, построенных на основе уравнений регрессии, начинается с проверки значимости каждого коэффициента регрессии.
Значимость коэффициента регрессии осуществляется с помощью t-критерия Стьюдента:
где 2аi - дисперсия коэффициента регрессии.
Параметр модели признается статистически значимым, если tp > tkp (; v = n - k - 1), где - уровень значимости, v = n - k - 1 - число степеней свободы.
Величина 2аi может быть определена по выражению:
где 2у - дисперсия результативного признака;
k - число факторных признаков в уравнении.
Более точную оценку величины дисперсии можно получить по формуле:
где Ri - величина множественного коэффициента корреляции по фактору хi с остальными факторами.
Проверка адекватности всей модели осуществляется с помощью расчета F-критерия и величины средней ошибки аппроксимации ().
Значение средней ошибки аппроксимации, определяемой по формуле
не должно превышать 12-15%.
Интерпретация моделей регрессий осуществляется методами той отрасли знаний, к которой относятся исследуемые явления. Но всякая интерпретация начинается со статистической оценки уравнения регрессии в целом и оценки зависимости входящих в модель факторных признаков, т. е. с выяснения, как они влияют на величину результативного признака. Чем больше величина коэффициента регрессии, тем значительнее влияние данного признака на моделируемый. Особое значение при этом имеет знак перед коэффициентом регрессии. Знаки коэффициентов регрессии говорят о характере влияния на результативный признак. Если факторный признак имеет знак плюс, то с увеличением данного фактора результативный признак возрастает. Если факторный признак имеет знак минус, то с его увеличением результативный признак уменьшается. Анализ модели по данным табл. 9.4. свидетельствует о том, что увеличение кредитных вложений и собственного капитала влечет рост стоимости активов коммерческих банков.
С целью расширения возможностей экономического анализа используются частные коэффициенты эластичности, определяемые по формуле
где - среднее значение соответствующего факторного признака;
- среднее значение результативного признака;
ai - коэффициент регрессии при соответствующем факторном признаке.
Коэффициент эластичности показывает, на сколько процентов в среднем изменится значение результативного признака при изменении факторного признака на 1%.
Множественный коэффициент детерминации (R2), представляющий собой множественный коэффициент корреляции в квадрате, показывает, какая доля вариации результативного признака обусловлена изменением факторных признаков, входящих в многофакторную регрессионную модель.
Для более точной оценки влияния каждого факторного признака на моделируемый используется Q-коэффициент, определяемый по формуле:
где - коэффициент вариации соответствующего факторного признака.
Изменение тесноты и направления связи является важной задачей изучения и количественного измерения взаимосвязи социально-экономических явлений.
Теснота связи при линейной зависимости измеряется с помощью линейного коэффициента корреляции.
В статистической теории разработаны и на практике применяются различные модификации формул расчета данного коэффициента:
Производя расчет по итоговым значениям исходных переменных, линейный коэффициент корреляции можно вычислить по формуле:
Линейный коэффициент корреляции может быть также выражен через дисперсии слагаемых:
Между линейным коэффициентом корреляции и коэффициентом регрессии существует определенная зависимость, которую можно математически выразить следующей формулой:
где ai - коэффициент регрессии в уравнении связи;
хi - среднее квадратическое отклонение соответствующего факторного признака.
Линейный коэффициент корреляции изменяется в пределах от -1 до 1: -1 < г < 1. Знаки коэффициентов регрессии и корреляции совпадают. При этом интерпретацию выходных значений коэффициента корреляции можно представить в табл. 9.5.
Таблица 9.5