ЛАБОРАТОРНАЯ РАБОТА4
.docЛАБОРАТОРНАЯ РАБОТА №4 Методы вычисления параметров парной линейной регресии
Линейная парная регрессия
Парной линейной регрессией называется зависимость
y;^ = b0 + b1x
выборочного условного математического ожидания от переменной х. Термин «парная» означает зависимость двух переменных Y, X. Термин «линейная» означает их линейную зависимость.
Условное выборочное математическое ожидание – это выборочное среднее значение величины Y при условии, что переменная X приняла значение х.
Модель наблюдения
yi = b0 + b1x + i,
b0 – оценка свободного члена 0,
b1 – оценка углового коэффициента 1.
MS Excel обеспечивает эффективную поддержку для проведения регрессионного анализа.
-
Постановка задачи
В некоторой фирме имеются статистические данные (xi, yi).
xi - независимая(объясняющая) переменная - расходы на рекламу продукции фирмы;
yi - зависимая(объясняемая) переменная - объём продаж, соответствующий расходам xi.
Следует построить линейную регрессионную модель, объясняющую, как повышение бюджета на рекламу влияет на объём продаж.
Учебные цели: приобрести навыки построения и анализа уравнения регрессии в ТП EXCEL.
Цель работы - освоение инструмента парной линейной регрессии в MS Excel.:
-
Исходные данные. Исходные наблюдения приведены в файле Варианты4.xls.
-
Задание. Необходимо построить линейную регрессионную модель y=a+bx.
-
Выполнение.
1-ый способ.
4.1. Диалоговое окно «Поиск решения»
Пример: На рис. 1 представлен образец выполнения работы.
Для шести наблюдений известны значения двух наблюдаемых величин х и у; х – отчетный месяц, у – объем продаж оборудования.
Отведем под переменные b и a ячейки D3 и E3 соответственно, а в ячейку F3 введем минимизируемую функцию: =суммквразн(B2:B7; E3+D3*A2:A7), которая вычисляет сумму квадратов разностей для элементов указанных массивов.
Выберем команду Сервис, Поиск решения и заполним диалоговое окно Поиск решения. Отметим, что на переменные b и a ограничения не налагаются. В результате вычислений получены значения переменных:
b=2 и a=7,3333. Можно рассчитать теоретические значения у для каждого наблюдения.
Рис. 1. Пример построения линейной модели
2-ой способ.
4.2. Диалоговое окно «Линия тренда»
Установка флажка на опции «показывать уравнение на диаграмме» приводит к появлению уравнения регрессии на диаграмме.
Этот метод плох тем, что для дальнейших вычислений, в которых необходимы параметры регрессии, приходится вводить их значения «вручную».
Последовательность выполнения данного способа состоит в следующем.
4.2.1. Ввести исходные данные, как в указанном примере.
4.2.2. Выделить диапазон этих данных A3:B21.
4.2.3. Выбрать команду Вставка/Диаграмма.
На первом шаге работы мастера выбрать тип диаграммы Точечная, Далее.
На втором шаге проверить, что в текстовом поле Диапазон введен диапазон A3:B21, Далее.
На третьем шаге установить названия осей, Далее.
На четвёртом шаге выбрать место размещения диаграммы и щёлкнуть по кнопке Готово.
4.2.4. Выделить диаграмму. Выбрать команду Диаграмма/ Добавить линию тренда.
4.2.5. Выбрать тип аппроксимации Линейная.
4.2.6. Щёлкнуть на вкладке Параметры и установить флажки как на следующем рисунке.
3-ий способ.
Расчёт по формулам нормальных уравнений
Формулы для расчёта параметров парной линейной регрессии таковы
b0= – свободный член регрессии;
b1 = – угловой коэффициент регрессии
где суммирование ведётся по всем выборочным данным.
Расчёт коэффициентов в Excel производится с помощью следующей таблицы
№ |
Х |
Y |
Х2 |
XY |
1 |
1,1 |
1,6 |
1,21 |
1,76 |
2 |
1,2 |
1,4 |
1,44 |
1,68 |
3 |
1,3 |
1,3 |
1,69 |
1,69 |
4 |
1,4 |
1,2 |
1,96 |
1,68 |
5 |
1,5 |
1,1 |
2,25 |
1,65 |
Итого |
6,5 |
6,6 |
8,55 |
8,46 |
В столбцы ”X”, “Y” данные вводятся непосредственно. В столбцы “X2”, “XY” вводятся формулы с соответствующими ссылками на ячейки, содержащие значения X, Y. Затем эти формулы «растягиваются» по столбцу. В последней строке производится суммирование. Далее в некоторые две ячейки вводятся приведённые формулы со ссылками на соответствующие ячейки последней строки таблицы.
4-ый способ.
Использование функции «линейн»
Формат функции линейн:
линейн(изв_знач_у;изв_знач_х;константа;стат).
Смысл аргументов функции
изв_знач_у – диапазон значений у;
изв_знач_х – диапазон значений х;
константа – устанавливается на 0, если заранее известно, что свободный член равен 0 и на 1 в противном случае;
стат – устанавливается на 0, если не нужен вывод дополнительных сведений регрессионного анализа и на 1 в противном случае.
Использование функции линейн:
-
Выделить область пустых ячеек 5´2 (5 строк, 2 столбца) для вывода результатов регрессионной статистики и 1´2 для вывода только коэффициентов b0, b1.
-
Ввести функцию линейн вручную или через мастера.
-
После корректного ввода функции в левой верхней ячейке выделенной таблицы появится первый итоговый элемент таблицы. Чтобы раскрыть всю таблицу, следует а) нажать клавишу F2, б) затем комбинацию клавиш <CTRL>+<SHIFT>+<ENTER>. Далее появляется регрессионная статистика в следующем порядке
-
-
Значение коэффициента b1
-
Значение коэффициента b0
-
Среднеквадратическое отклонение b1
-
Среднеквадратическое отклонение b0
-
Коэффициент детерминации R2
-
Среднеквадратическое отклонение у
-
F-статистика
-
Число степеней свободы
-
Регрессионная сумма квадратов
-
Остаточная сумма квадратов
-
Дописать вычисление параметров с помощью функций Excel
Выполнение работы
По каждому варианту даны три массива данных х-у. Обработку каждого массива выполнять на отдельном листе.
Обработка массива заключается в следующем.
-
Определить параметры линейной регрессии 4 способами.
-
Сформировать массив невязок i = b1xi + b0 – yi, сделав абсолютную ссылку на ячейки, содержащие b1, b0.
-
Построить диаграмму невязок. Сделать выводы.
Контрольные вопросы
-
Что такое невязки? По какой формуле их можно подсчитать?
-
Что показывает коэффициент детерминации.
-
Что такое число степеней свободы?
-
Что такое условное математическое ожидание Mx(Y)?
-
Что такое корреляционная и регрессионная зависимости Y от X?
-
Что такое модельное уравнение регрессии?
-
Что такое спецификация модели регрессии, объясняемая и объясняющая переменные, параметры модели?
-
Почему невозможно получить модельное уравнение регрессии?
-
Что такое выборочное уравнение регрессии?
-
Что такое выборочное условное среднее?
-
Каковы задачи регрессионного анализа?
-
Какие модели наблюдения соответствуют модельному и выборочному уравнению регрессии?
-
Что такое парная линейная регрессия, для чего она используется?
-
Имеется классическое линейное однофакторное уравнение регрессии, параметры которого оценены обычным МНК . Требуется доказать, что сумма остатков равна нулю: ;