Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

CKT_l.r.05_Prognozirovanie / Решение задач аппроксимации средствами Excel

.pdf
Скачиваний:
115
Добавлен:
29.02.2016
Размер:
632.01 Кб
Скачать

Решение задач аппроксимации средствами Excel

доктор физ.– мат. наук, профессор Гавриленко В.В. ассистент Парохненко Л.М.

(Национальный транспортный университет)

Теоретическая справка. На практике при моделировании различных про-

цессов, в частности, экономических, физических, технических, социальных,

широко используются те или иные способы вычисления приближенных значе-

ний функций по известным их значениям в некоторых фиксированных точках.

Такого рода задачи приближения функций часто возникают:

при построении приближенных формул для вычисления значений характер-

ных величин исследуемого процесса по данным таблиц, полученным в ре-

зультате физического или вычислительного эксперимента;

при численном интегрировании, численном дифференцировании, числен-

ном решении дифференциальных уравнений и т.д.;

при необходимости вычисления значений функций в промежуточных точ-

ках рассматриваемого интервала;

при определении значений характерных величин процесса за пределами рас-

сматриваемого интервала, в частности, при необходимости заглянуть в

“ прошлое”), то есть при определении значений показателей процесса до на-

чала наблюдения;

в прогнозировании, то есть при получении предварительных оценок буду-

щих значений интересуемых показателей процесса (возможность заглянуть

в“ будущее”).

Если для моделирования некоторого процесса, заданного таблицей, по-

строить приближенно описывающую данный процесс функцию на основе ме-

тода наименьших квадратов, то она называется аппроксимирующей функцией

(регрессией), а сама задача построения аппроксимирующих функций называет-

ся задачей аппроксимации.

В данной статье рассмотрены возможности пакета Excel [1–3] при реше-

нии задач аппроксимации, а именно, приведены методы и приемы построения

(создания) регрессий для таблично заданных функций, что является основой регрессионного анализа.

ВExcel для построения регрессий имеются такие возможности, как:

1)добавление выбранных регрессий (линий тренда) в диаграмму, построенную на основе таблицы данных для исследуемой характеристики процесса (этим инструментом можно воспользоваться лишь при наличии построенной диа-

граммы);

2)использование встроенных статистических функций рабочего листа Excel,

позволяющих получать регрессии (линии тренда) на основе таблицы исход-

ных данных (использование данного инструмента предварительно не связы-

вается с наличием соответствующей диаграммы).

Добавление линий тренда в диаграмму

Для таблицы данных, описывающих некоторый процесс и представленных диаграммой, в Excel имеется эффективный инструмент регрессионного анали-

за, позволяющий:

∙ строить на основе метода наименьших квадратов и добавлять в диаграмму пять типов регрессий (линий тренда), которые с той или иной степенью точно-

сти моделируют исследуемый процесс;

добавлять к диаграмме уравнение построенной регрессии;

определять степень соответствия выбранной регрессии отображаемым на диаграмме данным.

Построенные модели процесса – линии тренда (trendlines) показывают

тенденцию изменения данных, дают возможность определять значения иссле-

дуемой характеристики в промежуточных точках, прогнозировать поведение данного процесса в будущем (задача экстраполяции), а также заглянуть в его прошлое.

На основе данных диаграммы Excel позволяет получать такие типы регрес-

сий или линий тренда, как линейный, полиномиальный, логарифмический, сте-

пенной, экспоненциальный, которые задаются уравнением y = y(x) , где x – неза-

висимая переменная, которая часто принимает значения последовательности натурального ряда чисел (1; 2; 3; …) и производит, например, отсчет времени протекания исследуемого процесса.

1. Линейная регрессия хороша при моделировании характеристик, значения которых увеличиваются или убывают с постоянной скоростью. Это наиболее простая в построении, но наименее точная модель исследуемого процесса.

Строится в соответствии с уравнением

y = m x + b ,

где m – угол наклона линейной регрессии к оси абсцисс; b – координата точки пересечения линейной регрессии с осью ординат.

2. Полиномиальная линия тренда полезна для описания характеристик,

имеющих несколько ярко выраженных экстремумов (максимумов и миниму-

мов). Выбор степени полиномиальной линии тренда (полинома) определяется количеством экстремумов исследуемой характеристики. Так, полином второй степени может хорошо описать характеристику, имеющую только один макси-

мум или минимум; полином третьей степени – не более двух экстремумов; по-

лином четвертой степени – не более трех экстремумов и т.д.

Строится в соответствии с уравнением

y = c0 + c1 x + c2 x2 + c3 x3 + c4 x4 + c5 x5 + c6 x6 ,

где коэффициенты c0 , c1, c2 ,...c6 – константы.

3. Логарифмическая линия тренда с успехом применяется при моделирова-

нии характеристик, значения которых вначале быстро растут или убывают по величине, а затем постепенно стабилизируются.

Строится в соответствии с уравнением

y = c × ln(x) + b ,

где коэффициенты b, с – константы.

4. Степенная линия тренда дает хорошие результаты, если значения иссле-

дуемой зависимости характеризуются постоянным изменением скорости роста.

Примером такой зависимости может служить график равноускоренного движе-

ния автомобиля. При наличии в данных нулевых или отрицательных значений использовать степенную линию тренда нельзя.

Строится в соответствии с уравнением

y = c × x b ,

где коэффициенты b, с – константы.

5. Экспоненциальная линия тренда следует использовать в том случае, если скорость изменения данных непрерывно возрастает. Для данных, содержащих нулевые или отрицательные значения, этот вид приближения неприменим.

Строится в соответствии с уравнением

y = c × eb×x ,

где коэффициенты b, с – константы.

При подборе линии тренда Excel автоматически рассчитывает значение величины R2, которая характеризует достоверность аппроксимации: чем ближе значение R2 к единице, тем надежнее линия тренда аппроксимирует исследуе-

мый процесс. При необходимости значение R2 всегда можно отобразить на

диаграмме.

Определяется по формуле

R 2 = 1 -

Σ1

 

Σ1 = ∑(y j − Yj )2

 

S2 = ∑Yj2 -

1

× (∑Yj )2

 

S2

, где

;

.

 

 

j

j

n j

Для добавления линии тренда к ряду данных следует:

1. Активизировать построенную на основе ряда данных диаграмму, т.е. щелк-

нуть в пределах области диаграммы. В главном меню появится пункт Диа-

грамма.

2. После щелчка на этом пункте на экране появится меню, в котором следует выбрать команду Добавить линию тренда.

Пункты 1–2 легко реализуются также следующим приемом: направить ука-

затель мыши к графику, построенного на ряде данных, и щелкнуть правой кла-

вишей мыши, и в появившемся контекстном меню выбрать команду Добавить

линию тренда. На экране появится диалоговое окно Линия тренда с раскры-

той вкладкой Тип (рис.1).

Рис.1. Вкладка Тип диалогового окна Формат линии тренда

3. Выбрать на вкладке Тип необходимый тип линии тренда (по умолчанию выбирается тип Линейный). Для типа Полиномиальная в поле Степень сле-

дует задать степень выбранного полинома.

4. В поле Построен на ряде перечислены все ряды данных рассматриваемой диаграммы. Для добавления линии тренда к конкретному ряду данных следует в поле Построен на ряде выбрать его имя.

5. При необходимости, перейдя на вкладку Параметры (рис.2), можно для ли-

нии тренда задать следующие параметры:

∙ Изменить название линии тренда в поле Название аппроксимирующей

(сглаженной) кривой;

∙ Задать количество периодов (вперед или назад) для прогноза в поле Про-

гноз.

∙ Вывести в область диаграммы уравнение линии тренда, для чего следует ус-

тановить флажок для опции «показать уравнение на диаграмме».

∙ Вывести в область диаграммы значение достоверности аппроксимации R2,

для чего следует установить флажок для опции «поместить на диаграмму ве-

личину достоверности аппроксимации (R^2)».

∙ Задать точку пересечения линии тренда с осью Y, для чего следует устано-

вить флажок для опции «пересечение кривой с осью Y в точке:». 6. Нажать клавишу OK.

Рис.2. Вкладка Параметры диалогового окна Линия тренда

Для редактирования уже построенной линии тренда следует:

1. Щелкнуть левой клавишей мыши по той линии тренда, которую требуется

изменить.

2. Нажать в главном меню клавишу Формат, а появившемся контекстном ме-

ню выбрать команду Выделенная линия тренда.

Пункты 1–2 легко реализуются также следующим приемом: направить ука-

затель мыши к графику линии тренда, щелкнуть правой клавишей мыши, и в появившемся контекстном меню выбрать команду Формат линии тренда.

Еще легче реализуются пункты 1–2: двойным щелчком левой клавишей мыши по графику линии тренда.

3. На экране появится диалоговое окно Формат линии тренда (рис.3), содер-

жащее три вкладки: Вид, Тип, Параметры, причем содержимое вкладок Тип,

Параметры полностью совпадает с аналогичными вкладками диалогового ок-

на Линия тренда (рис.1–2).

4.При необходимости, перейдя на вкладку Вид (рис.3), можно для линии тренда задать тип линии, ее цвет и толщину.

5.Нажать клавишу OK.

Для удаления уже построенной линии тренда следует выбрать удаляемую линию тренда и нажать клавишу Delete.

Достоинствами этого инструмента регрессионного анализа являются:

∙ относительная легкость построения на диаграммах линии тренда без созда-

ния для нее таблицы данных;

достаточно широкий перечень типов предложенных линий трендов, причем в этот перечень входят наиболее часто используемые регрессии;

возможность прогнозирования поведения исследуемого процесса на произ-

вольное (в пределах здравого смысла) количество шагов вперед, а также назад;

возможность получения уравнения линии тренда в аналитическом виде;

возможность, при необходимости, получения оценки достоверности прове-

денной аппроксимации.

Кнедостаткам можно отнести следующие моменты:

построение линии тренда осуществляется лишь при наличии построенной на ряде данных диаграммы;

несколько загроможден процесс формирования рядов данных для исследуе-

мой характеристики на основании полученных для нее уравнений линий трен-

да, так как коэффициенты этих уравнений при каждом изменении значений ря-

да данных пересчитываются, но лишь в пределах области диаграммы;

∙ в отчетах сводных диаграмм при изменении представления диаграммы или связанного отчета сводной таблицы имеющиеся линии тренда не сохраняются,

то есть до проведения линий тренда или другого форматирования отчета свод-

ных диаграмм следует убедиться, что макет отчета удовлетворяет необходи-

мым требованиям.

Рис.3. Вкладка Вид диалогового окна Формат линии тренда

Линиями тренда можно дополнить ряды данных, представленные на гра-

фиках, гистограммах, плоских ненормированных диаграммах с областями, ли-

нейчатых, точечных, пузырьковых и биржевых диаграммах.

Нельзя дополнить линиями тренда ряды данных на объемных, нормиро-

ванных, лепестковых, круговых и кольцевых диаграммах. При замене типа диа-

граммы на один из вышеперечисленных, а также при изменении представления отчета сводной диаграммы или связанного отчета сводной таблицы соответст-

вующие данным линии тренда будут утеряны.

Использование встроенных функций Excel

ВExcel имеется также инструмент регрессионного анализа для построения линий тренда вне области диаграммы. Для этой цели можно использовать ряд статистических функций рабочего листа, однако все они позволяют строить лишь линейные или экспоненциальные регрессии.

ВExcel имеется несколько вариантов построения линейной регрессии (ли-

нейного тренда), в частности:

с помощью функции ТЕНДЕНЦИЯ;

с помощью функции ЛИНЕЙН;

с помощью функций НАКЛОН и ОТРЕЗОК.

ВExcel имеется также несколько вариантов построения экспоненциальной линии тренда, в частности:

с помощью функции РОСТ;

с помощью функции ЛГРФПРИБЛ.

Следует отметить, что приемы построения регрессий с помощью функций

ТЕНДЕНЦИЯ и РОСТ практически совпадают. То же самое можно сказать и о паре функций ЛИНЕЙН и ЛГРФПРИБЛ. Для всех этих четырех функций при создании таблицы значений используются такие возможности Excel, как формулы массивов, что несколько загромождает процесс построения регрес-

сий. Заметим также, что построение (создание) линейной регрессии, на наш взгляд, легче всего осуществить с помощью функций НАКЛОН и ОТРЕЗОК,

где первая из них определяет угловой коэффициент линейной регрессии, а вто-

рая – отрезок, отсекаемый регрессией на оси ординат.

Достоинствами данного инструмента регрессионного анализа являются:

∙ достаточно простой однотипный процесс формирования рядов данных ис-

следуемой характеристики для всех встроенных статистических функций, за-

дающих линии тренда;

∙ стандартная методика построения линий тренда на основе сформированных рядов данных;

∙ возможность прогнозирования поведения исследуемого процесса на необ-

ходимое количество шагов вперед или назад.

К недостаткам данного инструмента можно отнести то, что в Excel нет встроенных функций для создания других (кроме линейного и экспоненциаль-

ного) типов линий тренда. Это обстоятельство часто не позволяет подобрать с помощью выше перечисленных встроенных функций достаточно точную мо-

дель исследуемого процесса, а также получать близкие к реальности прогнозы.

Кроме того, при использовании функций ТЕНДЕНЦИЯ и РОСТ не известны уравнения линий тренда.

Следует отметить, что в этой статье авторы не ставили целью излагать курс регрессионного анализа с той или иной степенью полноты. Основная цель ста-

тьи – на конкретных примерах показать возможности пакета Excel при реше-

нии задач аппроксимации; продемонстрировать, каким эффективными инстру-

ментами для построения регрессий и прогнозирования обладает Excel; проил-

люстрировать, как относительно легко такие задачи могут быть решены даже пользователем, не владеющим глубокими знаниями регрессионного анализа.

Предложенная в статье методика по овладению навыков решения средства-

ми Excel такого рода задач (см. также [4 – 7], где приведены методики решения в Excel систем линейных алгебраических уравнений, нелинейных уравнений,

задач оптимизации, транспортных задач) может быть полезна и интересна пользователям. Это связано с тем, что пакет Excel установлен практически на каждом современном компьютере, в то время как такие известные специализи-

рованные математические пакеты, как Mathematica, Maple, Matlab, Mathcad,

обладающие более мощными возможностями для построения регрессий и про-

гнозирования, используются значительно меньшей пользовательской аудито-

рией.

Ниже приводятся решения конкретных задач с помощью перечисленных инструментов пакета Excel.

Задача 1. Для таблицы данных о прибыли автотранспортного предприятия за 1995–2002 г.г. необходимо выполнить следующие действия: