- •Федеральное агентство по образованию
- •Л. И. Тарновская
- •Предисловие
- •Раздел 1 общая теория статистики
- •Глава 1. Предмет и метод статистики
- •1.1. Понятие статистики
- •1.2. История статистики
- •1.3. Основные особенности науки статистика
- •1.4. Методы статистики
- •1.5. Основные задачи организации государственной
- •1.6. Организация международной статистики
- •Глава2. Статистическое наблюдение
- •2.1. Понятие статистического наблюдения и организационные формы
- •2.2. Виды статистического наблюдения
- •2.3. Способы статистического наблюдения
- •Глава3. Сводка, группировка статистических данных. Таблицы. Графики
- •3.1. Общее понятие статистической сводки
- •3.2. Метод группировки
- •3.3. Виды статистических группировок
- •3.4. Ряды распределения
- •3.5. Статистические таблицы
- •3.6. Графики
- •Глава4. Основные виды обобщающих показателей
- •4.1. Абсолютные и относительные величины
- •4.2. Средние величины
- •4.3. Свойства средней арифметической
- •4.4. Структурные средние
- •Глава5. Основные показатели вариации
- •5.1. Абсолютные показатели вариации
- •5.2. Виды дисперсий и правило их сложения
- •5.3. Относительные показатели вариации
- •Глава6. Законы распределения и их характеристики
- •6.1. Закономерности распределения
- •6.2. Теоретические распределения в анализе вариационных рядов
- •Глава7. Выборочное наблюдение
- •7.1. Способы формирования выборочной совокупности
- •7.2. Ошибки выборки
- •5. Комбинированная выборка
- •7.3. Малая выборка
- •Глава8. Статистическое изучение взаимосвязи социально-экономических явлений
- •8.1. Методы изучения связи социальных явлений
- •8.2. Парная множественная корреляция
- •8.3. Методы изучения связи социальных явлений
- •8.4. Регрессионный анализ в изучении взаимосвязей социально-экономических явлений
- •8.5. Парная регрессия на основе метода наименьших квадратов (мнк)
- •8.6. Множественная (многофакторная) регрессия
- •8.7. Оценка существенности связи
- •Глава9. Изучение динамики общественных явлений
- •9.1. Виды рядов динамики
- •9.2. Показатели динамики
- •9.3. Правила построения рядов динамики
- •9.4. Интерполяция и экстраполяция
- •9.5. Компоненты ряда динамики
- •9.6. Виды и методы выявления типа тенденций в рядах динамики
- •9.7. Показатели колеблемости и прогнозирования
- •9.8. Показатели сезонности
- •Глава10. Экономические индексы
- •10.1. Общее понятие индексов
- •10.2. Классификация индексов
- •10.3. Методика индексного анализа
- •Раздел2 макроэкономическая статистика Глава 11. Статистика экономических показателей
- •11.1.Cистема национальных счетов (снс) как макростатистическая модель экономики
- •11.2. Основные макроэкономические показатели снс
- •11.3. Методы расчета валового внутреннего продукта
- •11.4. Номинальный и реальный валовой внутренний продукт
- •Задача для проверки
- •Глава12. Статистика населения
- •12.1. Понятие населения и демографические процессы
- •12.2. Показатели численности населения и методы их расчета
- •12.3. Показатели движения населения
- •12.4. Методы прогнозирования численности населения
- •12.5. Экстраполяционные методы
- •12.6. Группировки населения
- •Раздел 3 статистика предприятия
- •Глава 13. Статистика производства
- •13.1. Показатели объема продукции (услуг)
- •13.2. Индексный метод анализа динамики объема продукции
- •13.3. Индексный анализ изменения стоимости реализованной продукции
- •13.4. Методы исчисления запасов товарно-материальных ценностей
- •Показатели оборачиваемости запасов
- •13.5. Статистика расхода материальных ресурсов
- •Глава14. Статистические показатели производительности труда
- •Контрольные вопросы
- •Глава15. Статистические показатели оплаты труда
- •Контрольныевопросы
- •Глава16. Статистические показатели себестоимостипродукции
- •Контрольные вопросы
- •Глава17. Статистические показатели основных фондов
- •17.1. Статистическое изучение основных фондов
- •17.2. Методы оценки наличия основных фондов
- •17.3. Показатели использования основных фондов
- •Оглавление
- •Глава 14. Статистические показатели производительности труда 157
8.4. Регрессионный анализ в изучении взаимосвязей социально-экономических явлений
Регрессионный анализ заключается в определении аналитического выражения связи, в котором изменение одной величины (называемой зависимой, или результативным признаком) обусловлено влиянием одной или нескольких независимых величин (факторов), а множество всех прочих факторов, также оказывающих влияние на зависимую величину, принимается за постоянные и средние значения. Целью регрессионного анализа является оценка функциональной зависимости условного среднего значения результативного признака (у) от факторных. Регрессия может быть однофакторной (парной) и многофакторной (множественной).
По форме зависимости различают:
линейную регрессию, которая выражается уравнением прямой(линейной функцией) вида
; (8.27)
нелинейную регрессию, которая выражается уравнениями вида:
параболы
(8.28)
гиперболы
. (8.29)
Если результативный и факторный признаки возрастают одинаково, примерно в арифметической прогрессии, то это свидетельствует о том, что связь между ними линейная, а при обратной связи – гиперболическая.
Если результативный признак увеличивается в арифметической прогрессии, а факторный – значительно быстрее, то используется параболическая или степенная регрессия.
По направлению связи различают:
прямую (положительную) регрессию, появляющуюся при условии, если с увеличением или уменьшением независимой величины значения зависимой также соответственно увеличиваются или уменьшаются;
обратную (отрицательную) регрессию, появляющуюся при условии, что с увеличением или уменьшением независимой величины зависимая соответственно уменьшается или увеличивается.
Основной предпосылкой регрессионного анализа является то, что только результативный признак (у) подчиняется нормальному закону распределения, а факторные признакимогут иметь произвольный закон распределения. При этом заранее подразумевается наличие причинно-следственных связей между результативным (у) и факторными признаками. Число факторных признаков должно быть в 5–6 раз меньше объема изучаемой совокупности [1, 7–1].
8.5. Парная регрессия на основе метода наименьших квадратов (мнк)
Парная регрессия характеризует связь между двумя признаками: результативным и факторным. Оценка параметров уравнений регрессии осуществляется методом наименьших квадратов (МНК), в основе которого лежит предположение о независимости наблюдений исследуемой совокупности.
Сущность метода МНК заключается в нахождении параметров модели (), при которых минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по выбранному уравнению регрессии:
. (8.30)
Для прямой зависимости:
.
Рассматривая Sв качестве функции параметрови проводя математические преобразования (дифференцирование), получаем
Откуда система нормальных уравнений для нахождения параметров линейной парной регрессии МНК имеет вид
где n– объем исследуемой совокупности (число единиц наблюдения).
Число уравнений в системе равно числу искомых параметров.
В уравнениях регрессии параметр показывает усредненное влияние на результативный признак неучтенных (не выделенных для исследования) факторов; параметр(а в уравнении параболы и) – коэффициент регрессии показывает, насколько изменяется в среднем значение результативного признака при увеличении факторного на единицу собственного измерения.
Пример. Имеются следующие данные по 10-ти однородным предприятиям (см. табл. 8.4). Найти зависимость между электровооруженностью труда и продукцией на одного работника.
Решение. По данным табл. 8.4 зависимость между электровооруженностью труда и продукцией на одного работника выражается уравнением прямой:
,
где – выпуск готовой продукции;
– параметры уравнения регрессии;
– электровооруженность.
Таблица 8.4
Номер завода |
Электровооруженность труда на 1 раб., Квт. ч. х |
Выпуск готовой продукции на 1 раб., тыс. р. у |
ху |
|
|
1 |
2 |
3 |
6 |
4 |
3,61 |
2 |
5 |
6 |
30 |
25 |
6,0 |
3 |
3 |
4 |
12 |
9 |
4,41 |
4 |
7 |
6 |
42 |
49 |
7,59 |
5 |
2 |
4 |
8 |
4 |
3,61 |
6 |
6 |
8 |
48 |
36 |
6,80 |
7 |
4 |
6 |
24 |
16 |
5,20 |
8 |
9 |
9 |
81 |
81 |
9,19 |
9 |
8 |
9 |
72 |
64 |
8,38 |
10 |
4 |
5 |
20 |
16 |
5,20 |
Итого |
50,0 |
60,0 |
343 |
304 |
60 |
В среднем |
5,0 |
6,0 |
34,3 |
30,4 |
6,0 |
Подставим в систему нормальных уравнений фактические данные из табл. 8.4:
Домножаем на 5 первое уравнение:
Параметры уравнения регрессии можно определить по формулам:
После определения параметров уравнения регрессии рассчитываем теоретическую линию регрессии путем подстановки значенийхв уравнение связи:
Если параметры уравнения связи определены правильно, то , т. е. 60=60.
Окончательная проверка правильности расчета параметров уравнения связи производится подстановкой ив систему уравнений.
Используя уравнение связи , можно определить теоретическое значениедля любой промежуточной точки.
Коэффициент регрессии уточняет связь междухиу.Он показывает на сколько единиц увеличится результативный признак при увеличении факторного признака на единицу.
Если значения признаков хиузаданы в определенном интервале (а – b), то для каждого интервала сначала определяют середину интервала, а затем строят уравнение регрессии между ними.
Если связь между признаками уихнелинейная и описываетсяуравнением параболы второго порядка, то
В данном случае задача сводится к определению неизвестных параметров: . Параметры находят по МНК, и система уравнений имеет вид:
Решая систему нормальных уравнений, определяют параметры параболы второго порядка.
Пример. В табл. 8.5 приведены данные о стаже рабочего и его выработке. Определить связь между стажем и выработкой рабочего.
Решение. Связь между стажем рабочего и выработкой криволинейная и выражается параболой второго порядка. Составляем систему нормальных уравнений по данным табл. 8.5.:
Домножим первое уравнение на 5 и вычтем первое уравнение из второго:
Домножим второе на 6,08 и вычтем его из третьего уравнения:
Таблица 8.5
№ п/п |
Стаж, лет х |
Выработка, шт. в час у | ||||||
1 |
9 |
9 |
81 |
729 |
6 561 |
81 |
729 |
9,0 |
2 |
8 |
9 |
64 |
512 |
4 096 |
72 |
576 |
8,3 |
3 |
4 |
5 |
16 |
64 |
256 |
20 |
80 |
5,3 |
4 |
2 |
3 |
4 |
8 |
16 |
6 |
12 |
3,5 |
5 |
5 |
6 |
25 |
125 |
625 |
30 |
150 |
6,1 |
6 |
3 |
4 |
9 |
27 |
81 |
12 |
36 |
4,4 |
7 |
7 |
6 |
49 |
343 |
2 401 |
42 |
294 |
7,7 |
8 |
2 |
4 |
4 |
8 |
16 |
8 |
16 |
35 |
9 |
6 |
8 |
36 |
216 |
1 296 |
48 |
288 |
6,9 |
10 |
4 |
6 |
16 |
64 |
256 |
24 |
96 |
5,3 |
Итого |
50 |
60 |
304 |
2 096 |
15 604 |
343 |
2 277 |
60 |
Уравнение Адомножим на 4,5876и вычтем из уравненияВ:
Подставим ив первое уравнение и вычислим параметр:
Уравнение связи тогда будет следующим:
.
Теоретическая линия регрессии:
и т. д.
Если результативный признак с увеличением факторного признака возрастает (или убывает) не бесконечно, а стремится к конечному пределу, то применяется уравнение гиперболы:
Чтобы определить параметры уравнения гиперболы методом наименьших квадратов, необходимо привести его к линейному виду. Для этого производится замена переменных получается система уравнений
Решая систему уравнений, определяются параметры уравнения гиперболы.
Уравнение степенной функции имеет следующий вид:
(8.31)
Степенная функция применяется в экономических исследованиях для характеристики слабо нелинейной связи между результативными и факторными признаками. Параметр имеет экономический смысл – этокоэффициент эластичности. Он показывает, что с увеличением признака фактора на 1 % результативный признак увеличивается на%.
Для определения параметров степенной функции методом наименьших квадратов степенную функцию необходимо привести к линейному виду путем логарифмирования. В результате логарифмирования получим уравнение вида
Заменим
Запишем уравнение
Строим систему нормальных уравнений:
Решая систему нормальных уравнений, определяем параметры иПереходя к первоначальным обозначениямопределяем параметр