Добавил:
Без скрытых скриптов, криптомайнинга, вирусов и прочего, - чистая литература. 你好,所有那些谁花时间翻译中国 Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Д6577 Алексеев ГВ Основы научных исследований.doc
Скачиваний:
11
Добавлен:
13.09.2020
Размер:
630.78 Кб
Скачать

Системы нормальных уравнений для различных форм связи

Форма связи

Уравнение регрессии

Система нормальных уравнений

Линейная

у = а0 + а1x

а0n + а1хi = yi;

а0хi + а1 = xi yi

Парабола

у = а0 + а1x + а2x2

а0n + а1 хi + а2 = yi;

а0 хi + а1 + а2 = xi yi;

а0 + а1 + а2= yi

При наличии больших значений признака его уменьшают путем замены переменной, например при прогнозировании, вычитанием какой-либо постоянной величины

t = t0 – 1980.

В дальнейшем вычислительный процесс можно упростить путем отсчета от середины ряда измерений, в соответствии с которыми вводят новую переменную вида

х = хх = х,

где х – среднее значение факторного признака; n – число измерений.

Лучше иметь нечетное число измерений. При этом алгебраическая сумма х становится равной нулю и, следовательно, количество членов в системах нормальных уравнений уменьшается, а вычисления сокращаются. При этом промежуточные результаты для удобства и наглядности располагают в виде таблицы. Системы нормальных уравнений довольно просто решаются с помощью ЭВМ.

После определения значений коэффициентов записывают математическую модель, по которой проводят вычисления. По результатам этих вычислений строят график и для сравнения накладывают его на диаграмму рассеивания.

Построенную модель выхода оценивают на соответствие изучаемому процессу. Значимость модели определяется ее возможностью прогнозировать средние значения выхода по заданным значениям независимых переменных.

Для линейных моделей выхода продукта, например, от формирующих его факторов в качестве показателя тесноты связи применяют линейный коэффициент парной корреляции

r = [(xy)*x*y*] / xy,

где (xy)* – среднее значение произведения признаков; x* – среднее значение факторного признака, х* = (хi)/n, здесь n – количество экспериментальных измерений; y*– среднее значение результативного признака.

При неадекватности построенной линейной модели экспериментальным данным переходят к построению нелинейной модели, которую в дальнейшем преобразуют с помощью соотношений табл. 1.7.

Таблица 1.7

Замена переменных для линеаризации моделей

Уравнение регрессии

Замена переменных

Линеаризованная форма связи

Гипербола у = а0 + а(1/х)

Z = 1/x

Y = а0 + а1Z

Показательное у = а 0 (а1)х

Y = lg y; A0 = lg a0; A1= lg a1

Y = A0 +A1x

Степенное у = а

Y = lg y; A0 = lg a0; Z = lg х

Y = А0 + а1Z

Полулогарифмическое у = а0 + а1 log x

Z = lg x

Y = А0 + а1Z

Качественную оценку тесноты корреляционной связи между признаками проводят по таблице Чеддока (табл. 1.8).

Таблица 1.8

Характеристика тесноты связи между величинами по Чеддоку

Диапазон изменения r

0,1–0,3

0,3–0,5

0,5–0,7

0,7–0,9

0,9–0,99

Характеристика связи

Слабая

Умеренная

Заметная

Высокая

Весьма высокая

Если r = 0, то связь между признаками отсутствует, если же r = 1, то существует функциональная связь между признаками.

В качестве меры тесноты корреляционной связи между изучаемыми признаками, а также показателя степени близости математической формы связи к фактическим данным для линейных и нелинейных форм связи применяют отношение

 = [ (y*)2 /  (yiy*)2,

где – значение признака, вычисленное по модели; yi – экспериментальное значение результативного признака.

В качестве меры точности используют среднюю относительную ошибку апроксимации

* = (1/n)  |(yiy*) / yi|  100 %.

При подборе математической формы связи следует ориентироваться на такую, для которой больше корреляционное отношение и меньше средняя относительная ошибка. Если * < (10...20) %, то модель называется достаточно адекватной реальной закономерности.

Поскольку показатели тесноты корреляционной связи исчислены по выборочным данным и являются случайными величинами, необходимо установить значимость показателей корреляции и коэффициентов модели. С этой целью определяют ошибку коэффициента корреляции по величине среднего квадратического отклонения:

r = (1 – r2) / n.

Затем величину r сопоставляют с r через отношение tr = r/ r. Принято считать, что если tr = > 2, то с вероятностью 0,95 можно говорить о значимости полученного коэффициента корреляции.

Для оценки надежности уравнения регрессии применяют F-кри-терий Фишера

Fр = /,

где  – дисперсия фактических значений спроса  = [(yi y*)2]/(n – 1);  – остаточная дисперсия = [( yi)2] / (n – 1 – p), здесь р – число коэффициентов в модели.

Показатели f1 = (nр – 1) и f2 = (n – 1) называют числами степеней свободы. Полученное расчетное значение критерия Fр сравнивается с табличным Fт, которое определяется по значениям f1 и f2 для заданного уровня значимости  = 0,05. Если Fр Fт, то уравнение считается надежным с вероятностью 95 %.

Для оценки значимости коэффициентов линейных моделей сначала находят случайную ошибку для а0:

m0 = (ост )/ n [– (xi) 2/n] ,

а затем случайную ошибку для а1:

m1 = (ост )/ [ – (xi) 2/n] .

Далее находят фактические значения критерия tф для этих коэффициентов:

tф0 = |а0| / m0; tф1 = |а1| / m1.

Затем по заданной доверительной вероятности  и соответствующим значениям числа степеней свободы f = (n p) по таблице Стьюдента определяют критическое значение tT.

Если при сравнении выполняется неравенство tф > tТ, то коэффициенты признают значимыми, после чего определяют для них доверительные границы:

(а0 m0 tТ); (а1 m1 tТ).

При использовании математических моделей расчетные значения могут не совпадать с фактическими, так как линия модели описывает взаимосвязь лишь в среднем и отдельные наблюдения рассеяны вокруг нее. Это происходит по причине воздействия ряда неучтенных факторов, случайных помех и ошибок измерений, поэтому уравнение можно представить в виде

ух =  ух,

где ух – пределы для ; ух – случайная переменная, характеризующая отклонение.

Полагая, что отклонения фактических значений у от средних распределены по нормальному закону, для любого значения х можно определить доверительное отклонение по формуле

ух = (t, fост/ n)1 + (xix*)2/ ,

где t, f – значение параметра Стьюдента, определяемое по заданной доверительной вероятности  и числу степеней свободы f.

Зону, в которую попадают все значения случайной величины, можно приближенно вычислить на основании графиков рис. 1.1.

y

y = a0 + a1x

h

h

y*

h L =  (xix*)2/n

h = t, fост/n

h

L x* L x

Рис. 1.1. Доверительная область модели

При проведении многофакторного анализа последовательность действий принципиально не меняется. В многофакторную модель включают только те факторы, которые линейно независимы и существенно влияют на изменение результативного признака. Из двух факторов, у которых коэффициент парной корреляции выше 0,8, включают только один. Число включаемых в модель факторов должно быть меньше числа наблюдений.

Пример 1.2. Построить модель зависимости выхода Y некоторого вида продукции фирмы от объясняющих параметров: Х1 – время; Х2 – расходы на сырье; Х3 – расходы на энергоресурсы; Х4 – расходы на заработную плату; Х5 – расходы на оборудование.

Статистические данные по всем переменным приведены в табл. 1.9.

Таблица 1.9

Соседние файлы в предмете Процессы и аппараты пищевых производств