- •Статистика
- •Понятие статистического показателя. Атрибуты статистического показателя. Виды статистических показателей.
- •Понятие средней величины. Средняя арифметическая и ее свойства.
- •Количественная оценка тесноты связи по эмпирическим данным: эмпирический коэффициент детерминации, эмпирическое корреляционное отношение.
- •Количественная оценка тесноты связи по эмпирическим данным: коэффициент линейной парной корреляции.
- •Расчет параметров уравнения линейной множественной регрессии и их интерпретация.
- •Статистические методы прогнозирования вопрос 1
- •Вопрос 2
- •Вопрос 3
- •Вопрос 4
- •При косвенном методе величина рассчитывается опосредованно, через другие величины, связанные с искомой определенной зависимостью. Относительные величины измеряются только косвенным методом.
- •Вопрос 5
- •Вопрос 6
- •Вопрос 7
- •Вопрос 8
- •Вопрос 9
- •Вопрос 10
- •Вопрос 11
- •Ч исло групп для удобства возьмем равным 3. Тогда величина интервала будет равна:
- •Вопрос 12
- •Пример: построим равнонаполненную группировку совокупности 20 студентов по признаку «посещаемость практических занятий» - х.
- •Вопрос 13
- •Сложные группировки (группировки по нескольким признакам) делятся на комбинационные и многомерные.
- •Комбинационная группировка студентов по признакам: оценка (y) и посещаемость практических занятий (X):
- •Вопрос 14
- •Вопрос 15
- •Вопрос 16
- •Кумулятивные ряды распределения – ряды распределения, которые содержат один или оба следующих элемента:
- •Вопрос 17 Графические представления рядов распределения
- •Вопрос 18 Понятие средней величины. Средняя арифметическая и ее свойства.
- •Вопрос 19
- •Понятие ведущего показателя
- •Вопрос 20
- •Вопрос 21
- •Вопрос 22
- •Вопрос 23
- •Вопрос 24 Показатели формы распределения. Ответ
- •Вопрос 25 Нормальное распределение и его свойства.
- •Вопрос 26
- •Вопрос 27
- •Вопрос 28
- •Вопрос 29
- •Вопрос 30
- •Вопрос 31 Способы отбора. Ответ
- •Вопрос 32
- •Вопрос 33
- •Вопрос 34
- •Вопрос 35
- •Вопрос 36 Количественная оценка тесноты связи по эмпирическим данным: эмпирический коэффициент детерминации, эмпирическое корреляционное отношение. Ответ
- •Вопрос 37 Количественная оценка тесноты связи по эмпирическим данным: коэффициент линейной парной корреляции. Ответ
- •Вопрос 38
- •Вопрос 39
- •Вопрос 40
- •Вопрос 41
- •Вопрос 42
- •Вопрос 43
- •Вопрос 44 Расчет параметров уравнения линейной множественной регрессии и их интерпретация.
- •Вопрос 45
- •Вопрос 46
- •Вопрос 47
- •Вопрос 48
- •Вопрос 49
- •Вопрос 50
- •Вопрос 51
- •Вопрос 52
- •Добыча нефти в Российской Федерации, млн.Тонн
- •Вопрос 53
- •Область допустимых значений у Кр и Тр от нуля до плюс бесконечности.
- •Используется для правильной оценки значения полученного темпа прироста. Аi показывает какое абсолютное значение скрывается за относительным показателем 1% прироста.
- •Вопрос 54
- •Вопрос 55
- •Вопрос 56
- •Вопрос 57
- •Вопрос 58
- •Вопрос 59 Статистические методы прогнозирования
Вопрос 39
Расчет параметров линейного уравнения регрессии методом наименьших квадратов
ОТВЕТ
Уравнение регрессии – это уравнение, описывающее корреляционную зависимость между признаком-результатом Y и признаками факторами (одним или несколькими).
Наиболее часто для описания статистической связи признаков используется линейное уравнение регрессии. Внимание к линейной форме связи объясняется четкой экономической интерпретацией параметров линейного уравнения регрессии, ограниченной вариацией переменных и тем, что в большинстве случаев нелинейные формы связи для выполнения расчетов преобразуют (путем логарифмирования или замены переменных) в линейную форму. Линейное парное уравнение регрессии имеет вид: Y’i=a+b·Xi , i=1;n, n – объем совокупности (число наблюдений).
Оценки параметров линейной регрессии (a и b) могут быть найдены разными методами. Наиболее распространенным является метод наименьших квадратов (МНК).
МНК позволяет получить такие оценки параметров а и b, при которых сумма квадратов отклонений фактических значений результативного признака - Yi от расчетных (теоретических) значений –Y’i (рассчитанных по уравнению регрессии) минимальна:
.
Проиллюстрируем суть данного метода графически (рис.14). Попытаемся подобрать прямую линию, которая ближе всего расположена к точкам корреляционного поля. Согласно методу наименьших квадратов линия выбирается так, чтобы сумма квадратов расстояний по вертикали между точками корреляционного поля и этой линией была бы минимальной.
Y
Y’i
Yi
X
Х i
Рис.14. Линия регрессии с минимальной суммой квадратов отклонений.
В случае линейной парной зависимости:
S=(Yi-( a+b·Xi))2 min.
Значения Yi и Xi i=1;n нам известны, это данные наблюдений. В функции S они представляют собой константы. Переменными в данной функции являются искомые оценки параметров - а и b. Чтобы найти минимум функции 2-ух переменных необходимо вычислить частные производные данной функции по каждому из параметров и приравнять их нулю, т.е. .
В результате получим систему из 2-ух нормальных линейных уравнений:
Р ешая данную систему, найдем искомые оценки параметров.
Правильность расчета параметров уравнения регрессии может быть проверена сравнением сумм (возможно некоторое расхождение из-за округления расчетов).
Параметр b может быть рассчитан также через коэффициент корреляции: .
Знак коэффициента регрессии b указывает направление связи (если b>0, связь прямая, если b<0, то связь обратная). Величина b показывает на сколько единиц изменится в среднем признак-результат -Y при изменении признака-фактора - Х на 1 единицу своего измерения.
Формально значение параметра а – среднее значение признака-результата Y при значении признака-фактора Х равном нулю. Если признак-фактор не имеет и не может иметь нулевого значения, то вышеуказанная трактовка параметра а не имеет смысла.
Рассчитаем параметры линейного уравнения регрессии, описывающего зависимость выработки рабочего, шт./смену (Y) от разряда (Х). Исходные данные:
X |
3 |
3 |
3 |
4 |
4 |
5 |
5 |
5 |
5 |
6 |
6 |
6 |
6 |
7 |
7 |
7 |
8 |
8 |
8 |
8 |
Y |
10 |
12 |
13 |
11 |
14 |
12 |
13 |
15 |
16 |
15 |
17 |
17 |
18 |
18 |
20 |
22 |
23 |
24 |
27 |
25 |
Для оценки параметра b рассчитаем показатели:
=(3·3+4·2+5·4+6·4+7·3+8·4)/20=5,7;
2х=((3-5,7)23+(4-5,7)22+(5-5,7)24+(6-5,7)24+(7-5,7)23+(8-5,7)24)/20=2,81;
=(10+12+13+11+14+12+13+….+27+25)/20=17,1;
=(3·10+3·12+3·13+4·11+4·14+5·12+5·13+…+8·27+8·25)/20=104,95;
Тогда параметр b=( - · )/2х =(104,95-5,7·17,1)/2,81=2,66.
Парметр a= -b· =17,1- 2,66·5,7=1,927.
Уравнение регрессии будет иметь вид: Y’=1,927+2,66·X..
Интерпретация параметров уравнения регрессии:
b- при увеличении разряда на единицу, выработка рабочего в среднем возрастает на 2,66 шт. за смену.
Параметр а не интерпретируем, т.к. отсутствуют данные о рабочих с разрядом 0.
Рассчитаем теоретические значения признака-результата по уравнению регрессии:
Y’(х=3)=1,927+2,66·3=9,91.
Y’(х=4)=1,927+2,66·4=12,57.
Y’(х=5)=1,927+2,66·5=15,24.
Y’(х=6)=1,927+2,66·6=17,90.
Y’(х=7)=1,927+2,66·7=20,56.
Y’(х=8)=1,927+2,66·8=23,22.
Результаты расчета поместим в таблицу:
X |
3 |
3 |
3 |
4 |
4 |
5 |
5 |
5 |
5 |
6 |
6 |
6 |
6 |
7 |
7 |
7 |
8 |
8 |
8 |
8 |
Y |
10 |
12 |
13 |
11 |
14 |
12 |
13 |
15 |
16 |
15 |
17 |
17 |
18 |
18 |
20 |
22 |
23 |
24 |
27 |
25 |
Y’ |
9,91 |
9,91 |
9,91 |
12,6 |
12,6 |
15,2 |
15,2 |
15,2 |
15,2 |
17,9 |
17,9 |
17,9 |
17,9 |
20,6 |
20,6 |
20,6 |
23,2 |
23,2 |
23,2 |
23,2 |