Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Уч_пособиядлямагистров по ОНИОТД / Основы научн. исслед. ОТД новая2 - копия.docx
Скачиваний:
546
Добавлен:
03.03.2016
Размер:
30.28 Mб
Скачать

10.6. Метод наименьших квадратов и элементы анализа временных рядов при изучении оперативно-тактических действий.

В ЭТОМ РАЗДЕЛЕ рассматриваются объекты исследования, на которые воздействует единственная управляемая переменная величина (фактор)X1.

Пусть эксперимент состоит в постановке N опытов, и в этих опытах факторX1 принимает значения Х11, Х12, ..., X1N. Здесь Х1j — значение фактора X1 в опыте номер j: j= 1,2, ..., N. Выходная величина у принимает в этих опытах значения у1, у2, ..., уN соответственно. Отложим по оси абсцисс значения фактора X1 принимаемые им в опытах, а по оси ординат - соответствующие значения у. Мы получим совокупность точек, соответствующую, например, рис. 10.2.

Целью эксперимента в данном случае является установление закономерности изменения выходной величины упри изменении фактора X1. Для отыскания этой закономерности хотелось бы получить функцию y = f (X1) называемую математической моделью, которая с достаточной точностью описывала бы результаты эксперимента.

На рисунке 10.2 представлены зависимость значении Yi от соответствующих значений Хi. Закономерность изменения величины Yi в зависимости от величины Хi мы получаем на графике, если проведем гладкую кривую, лежащую возможно ближе ко всем экспериментальна точкам.

Рис. 10 .2 График зависимости y=f(xi)

Однако на глаз такую кривую можно провести разными способами, и, кроме того, помимо графика хотелось бы получить аналитическое представление для исследуемой закономерности. Все это заставляет обратиться к аналитическим методам построения математической модели.

Конкретизируем теперь приведенное выше требование, чтобы экспериментальные точки лежали в совокупности как можно ближе к кривой являющейся графиком искомой зависимости.

Допустим, что аналитическое представление зависимости у X1 уже каким-то образом получено в виде уравнения y=f(X1), называемого уравнением регрессии. Функция в правой части уравнения называется функцией отклика. График зависимости у -f(X1)- это искомая кривая (рис.10.2).

Значениям фактора Х1, равным Х11, Х12, ..., X1N, соответствуют точки на кривой ŷ1, ŷ2,..., ŷN. Эти точки являются значениями выходной величины, рассчитанными по уравнению регрессии у =f(X1):

(10.8)

Величина δ1= y1 - ŷ1 характеризует отклонение результата экспериментаy1 в точке X11 от значения функции отклика ŷ1 = f(X11) в этой же точке. Аналогично можно рассмотреть отклонения

δ2= y2 – ŷ2 ,…, δN = yN– ŷN (10.9)

Вид функции отклика f(X1) должен быть известен заранее. В планировании эксперимента чаще всего рассматривают модели в виде полиномов 1-го и 2-го порядков. Если имеется единственная переменная X1, то полином 1-го порядка - это уравнение прямой

(10.10)

а полином 2-го порядка - уравнение параболы

(10.11)

По результатам обработки экспериментальных данных надо по-' лучить значения параметров Во, В1, ..., называемых коэффициентами регрессии.

Метод наименьших квадратов - это один из способов обработки результатов эксперимента с целью отыскания коэффициентов регрессии. В соответствии с этим методом значения параметров математической модели выбираются из условия минимума суммы квадратов отклонений Ф:

(10.12)

С помощью метода наименьших квадратов найдем формулы для коэффициентов регрессии в простейшем случае линейной модели (10.12). Подставим в формулу (10.13) в качестве ŷj= f(X1j) выражения В0 + В1X1j, j = 1,2,...,N.

Тогда

(4.5)

(10.13)

Чтобы найти значения Во и В1 при которых сумма Ф минимальна, возьмем производные от Ф по Во и по В1 и приравняем их к нулю. В результате после простейших преобразований получим следующую систему:

(10.14)

Решая эту систему из двух линейных уравнений с двумя неизвестными Во и В1 найдем:

; (10.15)

. (10.16)

Если рассматривать модель в виде полинома второго порядка (10.11). то для отыскания трех неизвестных коэффициентов регрессии В'0, В'1, и В'11 надо решить следующую систему из трех линейных уравнений с тремя не известными:

(10.17)

Аналогичным путем легко получить систему уравнений для отыскания коэффициентов регрессии в случае нескольких варьируемых факторов. Однако решение этих систем без применения ЭВМ достаточно трудоемко.

Особый интерес представляет случай, когда в качестве единственного варьируемого фактора Xi рассматривается время , а выходной величиной являются результаты наблюдений, характеризующие изменение некоторого явления. Последовательность таких наблюдений, взятая во времени, называется временным рядом уt..

В качестве примера можно рассмотреть временной ряд, характеризующий количество выездов ежемесячно в течении года. Отдельные наблюдения временного ряда называются его уровнями и обозначаются , у1, у2, ..., уN.

Важной задачей анализа временных рядов является отыскание основной закономерности изменения изучаемого явления во времени. Для выявления этой закономерности временной ряд необходимо сгладить, устранив в нем случайные колебания. Функция, полученная в результате сглаживания временного ряда и отражающая основную тенденцию явления, называется трендом. Понятие тренда аналогично рассмотренному выше понятию математической модели объекта.

Для решения задачи сглаживания временных рядов существуют различные методы. Простейшим из них является метод скользящей средней. Он позволяет получить графическое представление для тренда. При улаживании временного ряда по методу скользящей средней группы последовательных наблюдений ряда заменяются их средними арифметическими. В результате случайные колебания ряда погашаются.

Изложим этот метод подробнее. Пусть дан ряд у1, у2, ..., уN. Зададимся интервалом сглаживания μ. Это то число наблюдений, по которым берется среднее арифметическое. Пусть для определенности μ = 5. Тогда сглаживание происходит следующим образом:

вычисляется среднее по первым пяти уровням

(10.18)

Это среднее приписывается середине интервала сглаживания, то

есть в данном случае 3-му наблюдению

вычисляется среднее по следующей группе из пяти уровней у2, у3,…, у6:

(10.19)

Это значение приписывается уже 4-му наблюдению;

Вычисляем, которое приписывается пятому

наблюдению и т. д.

Очевидны следующие свойства сглаженного ряда, полученного пометоду скользящей средней: этот ряд короче исходного на (μ - 1) наблюдения; сглаженный ряд будет тем более плавным, чем шире интервал сглаживания.

Другим весьма распространенным методом сглаживания времен­ных рядов является изложенный выше метод наименьших квадратов. Аналогическое выражение для тренда яри этом задается заранее, а с помощь метода наименьших квадратов отыскиваются значения неизвестных параметров тренда.

В пожарной статистике большое внимание уделяется прогнозированию пожаров. В частности, к задаче прогнозирования относится задача экстраполяции временного ряда. Она состоит в том, чтобы по имеющимся уровням у1, у2, ..., уn временного ряда предсказать значения у на периоды N+1, N+2, N+i.(YN+1)

Возвращаясь к предыдущему примеру, можно поставить задачу прогнозирования количество пожаров на последующие годы.

Задача прогнозирования, как правило, включает в себя в качестве предварительного этапа задачу сглаживания.

В простейшем случае задачу экстраполяции временного ряда легко решить, воспользовавшись аналитическим выражением для тренда f() найденным по методу наименьших квадратов. Для получения прогнозируемых значений N+1, N+2, N+i достаточно в выражение тренда подставить соответствующее значение t, то есть

(10.20)