Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Учебное пособие по МПП

.pdf
Скачиваний:
72
Добавлен:
21.03.2015
Размер:
2.61 Mб
Скачать

В более общем виде линейная множественная регрессия записывается так: m

y = b0 x0 + b1 x1 + b2 x2 + … + bm xm = bi xi ,

i 0

где y - теоретическое значение результативного признака; xi - аргументы (факторы);

m - число изучаемых факторов;

bi - частные коэффициенты регрессии, показывающие степень влияния каждого из факторов на функцию;

b0 - остаточный член, характеризующий среднее значение функции.

Для получения таких регрессий необходимо располагать статистическими (экспериментальными) данными, которые в общем случае можно представить таблицей 2.4.

Таблица 2.4

 

 

 

 

J = 1, 2, … , n – (столбец)

 

 

 

 

1

2

J

n

 

X1

X11

X12

X1j

X1n

Х1j

строка)

 

 

 

 

 

 

 

 

 

X2

X21

X22

X2j

X2n

Х2j

m – (

 

 

 

 

 

 

 

 

Хi

Xi1

Xi2

Хij

Хin

Хij

2, …,

 

 

 

 

 

 

 

 

= 1,

 

 

 

 

 

 

 

 

Хm

Xm1

Xm2

Хmj

Хmn

Хmj

I

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

У

У1

У2

Уj

Уn

Уj

Процесс построения множественной регрессии поясним на примере. Пример. Для случая y = f(x1, x2) линейная регрессия имеет вид

y = a + b x1 + c x2. При вычислении коэффициентов a, b, c воспользуемся методом наименьших квадратов. Тогда будем иметь

n

2 min

 

z yj a bx1j cx2 j

(2.7)

j 1

Вычислим частные производные выражения 2.7. по параметрам a, b и c, получим:

31

z

2

n

y

 

a bx

cx

 

1 0

 

 

 

 

 

j

2 j

 

a

 

1j

 

 

 

 

 

 

j 1

 

 

 

 

 

 

 

 

 

 

z

 

 

n

yj

a b1j cx2 j x1j

0

 

2

(2.8)

 

 

b

j 1

 

 

 

 

 

 

 

 

 

z

2

n

y

 

a bx

cx

 

x

 

 

0

 

 

 

j

2 j

2 j

 

c

 

1j

 

 

 

 

j 1

 

 

 

 

 

 

 

 

 

 

Преобразуя систему (2.8), получим

n

 

 

n

 

n

 

 

na b x1j

c x2 j

yj

 

 

j 1

 

j 1

 

j 1

 

 

n

 

 

n

 

n

 

n

 

a x1 j

b x12j

c x1j x2 j

x1j yj

(2.9)

j 1

 

j 1

 

j 1

j 1

 

n

 

 

n

 

 

n

n

 

a x2 j

b x1 j x2 j

c x22j

x2 j yj

 

j 1

 

 

j 1

 

 

j 1

j 1

 

Система (2.9.) представляет систему линейных уравнений, решая которую одним из известных методов, найдем значения неизвестных параметров a, b, c.

Методом Крамера параметры a, b и с определяются из выражений:

а Да ;b Дb ;с Дс ,

Д Д Д

где Д - главный определитель системы линейных уравнений (2.9); Да - определитель системы уравнений, в котором столбец коэффициентов при а заменен столбцом свободных членов;

Дb - определитель системы, в которой столбец коэффициентов при b заменен столбцом свободных членов; Дс - определитель системы, в которых столбец коэффициентов при с заменен столбцом свободных членов.

m

Если требуется построить математическую модель вида y bi xi ,

i 0

то для вычисления коэффициентов bi (i = 0, 1, 2, …, m) опять воспользуемся методом наименьших квадратов, получаем систему нормальных уравнений вида

32

nb0 b1 x1j ... bm xmj yj ;

b0 x1j b1 x1j x2 j ... bm x1j xmj x1j yj ;

.....................................................................................

b0 xmj b1 x1j xmj ... bm xmj xmj xmj yj .

(2.10)

Решая систему (2.10) известным методом, найдем значения параметров bi уравнения регрессии. Наиболее распространенным методом решения системы (2.10) является метод обращения матриц, запрограммирован-

ный в ряде стандартных программ аппроксимации.

 

В матричной форме система (2.10) запишется

 

XB = Y,

(2.11)

где X - исходная матрица;

 

В - матрица исходных значений параметров;

 

Y - матрица свободных членов.

 

 

n

x

....

 

x

 

 

 

 

 

B

 

 

 

y

 

mj

 

 

 

0

 

j

 

 

1 j

 

 

 

 

B

B1

 

 

 

x1 j

x1j x2 j

....

x1j xmj

;

x1 j yj

X

 

....

....

....

 

 

 

 

 

;

Y

 

 

 

....

 

 

 

 

....

 

.....

 

 

xmj

x1 j xmj

....

 

 

 

 

 

 

 

 

 

 

xmj yj

 

xmj xmj

 

 

Bm

 

 

.

При решении системы линейных уравнений матричным способом необходимо вычислить обратную матрицу (X-1) и умножить её на правую и

левую части уравнения (2.11), получим_

_ X 1 XB X 1Y .

Так как X X E и E B = B, то окончательное выражение для опре-

деления матричным способом параметров Bi примет вид

B = X-1 Y.

2.5. Программные средства построения математических моделей

Для повышения качества регрессионного анализа разработана программа на алгоритмическом языке QBasic, содержание которой приведено в прил. 3.

Программа обладает следующими особенностями:

- функция аппроксимации двухпараметрическая, линеаризованная функция типа y = ax + b;

-набор аппроксимирующих функций – 9;

-программа сортирует функции по коэффициенту парной корреля-

ции;

33

- работает в диалоговом режиме.

Обширная библиотека прикладных программ, обеспечивающих реализацию основных численных методов га персональных ЭВМ, приведена в учебной и справочной литературе [9, 25].

Контрольные вопросы

1.Назначение корреляционно – регрессионного анализа.

2.Корреляционные и функциональные зависимости.

3.Коэффициент корреляции и его предельные значения.

4.Формулы вычисления парной и множественной коэффициентов корреляции.

5.Оценка точности аппроксимации нелинейной зависимости.

6.Сущность метода наименьших квадратов.

7.Виды парных регрессий.

8.Способы линеаризации нелинейных зависимостей.

9.Множественная линейная регрессия.

10.Последовательность вычисления параметров множественной регрессии методом Крамера.

11.Последовательность вычисления параметров множественной регрессии матричным способом.

Глава 3. СТАТИСТИЧЕСКАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ. ВЕРОЯТНОСТНЫЕ МОДЕЛИ

При изучении процессов автомобильного транспорта нередко возникает необходимость обработки больших объемов информации, предоставленной в виде статистических рядов. Например, пробег шин до замены, величина износа протектора шины у различных автомобилей на определенном пробеге, величина люфта рулевого управления автомобилей в процессе эксплуатации и другие случайные величины.

Случайной величиной называется такая величина, которая в результате опыта может принять то или иное значение, которое с точностью нельзя предсказать до опыта.

Все случайные величины делятся на дискретные и непрерывные. Дискретная случайная величина принимает фиксированные значения на отрезке [а, в]. Непрерывная случайная величина принимает на отрезке [a, в] любое значение.

34

При обработке такой статистической информации определяются числовые характеристики и закон распределения рассматриваемой случайной величины.

3.1. Основные характеристики случайных величин

Для количественной оценки случайной однородной величины используются следующие числовые характеристики:

Среднее арифметическое случайной величины служит характеристикой математического ожидания распределения случайной величины и вычисляется по формуле

 

 

 

1 n

 

 

 

X ( X1 X2 ... Хn )/n

 

Xi ,

 

 

 

 

n i 1

где Х1, Х2, ..., Хn - значения элементов ряда; п - число элементов ряда. Статистическая дисперсия характеризует разброс случайной величи-

ны относительно ее среднего значения. Она вычисляется по формуле

Д 1 ( Xi X )2 . n

Среднее квадратическое отклонение служит мерой рассеивания случайной величины относительно ее среднего значения и вычисляется по формуле

 

1

n

 

_ 2

 

 

 

 

x

x .

 

 

 

 

 

 

i

 

 

 

n 1i 1

 

 

Коэффициент вариации ряда определяется отношением V

_ .

 

 

 

 

 

X

По коэффициенту вариации приближенно определяется закон распределения случайной величины, так при V ≤ 0,3 распределение подчиняется нормальному закону, при V = 0,52 - закону распределения Релея, а при V = 1,0 - экспоненциальному (показательному) закону распределения.

Статистическая оценка коэффициента асимметрии дает дополнительную информацию о форме распределения случайной величины (рис. 3.1). Асимметрия или скошенность вычисляется по формуле

 

 

 

 

1 n

 

 

 

 

 

 

 

 

X)3

 

 

 

 

 

(Xi

 

 

 

 

 

 

 

 

n i 1

 

.

A

 

 

 

 

 

 

 

 

у3

 

 

 

 

Статистическая оценка коэффициента эксцесса дает дополнительную информацию о форме распределения случайной величины (рис. 3.2).

35

Эксцесс, или островершинность вычисляется по формуле

 

 

 

 

1 n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(Xi

X )

 

 

 

 

 

 

 

 

n i 1

 

 

 

3.

Э

 

 

 

 

 

 

 

 

 

 

у4

 

 

 

 

f(x)

А<0

A>0

X 3.1. Положительная и отрицательная асимметрия

f(x)

 

 

Э > 0

 

Э > 0

 

Э < 0

X

X

Рис. 3.2. Положительный и отрицательный эксцессы

3.2. Законы распределения случайной величины

Между частными значениями случайной величины и вероятностями их появления существует определенная зависимость. Указанная зависимость называется законом распределения.

36

Закон распределения случайной величины можно задать в виде таблицы, графика или формулы.

Различают законы распределения дискретной случайной величины и законы распределения непрерывной случайной величины.

3.2.1. Законы распределения дискретной случайной величины

Основными вероятностями закона распределения дискретной случайной величины являются биномиальный закон и закон Пуассона.

Биноминальный закон распределения

Биномиальное распределение возникает при выполнении следующих условий:

-в результате одного испытания может появиться одно из двух противоположных событий А или A B;

-вероятности указанных событий от опыта к опыту не меняются и составляют Р(А) = р и Р(В) = q;

-проводится п независимых испытаний.

При выполнении указанных условий возникают различные комбинации таких событий, вероятность появления которых определяется по формуле, называемой биномиальным законом распределения

 

n!

n m

 

m

m

n m

 

m

 

 

Pm,n

 

q

 

p

 

Cn q

 

p

 

,

(3.1)

m! n m !

 

 

 

 

где п - число независимых испытаний;

Р(m,n) - вероятность того, что при п испытаниях событие А появится ровно m раз;

ри q - вероятноcти появления соответственно событий А и В, где q = 1-р;

Сmn - число сочетаний из n элементов по m.

Для биномиального распределения числовых характеристик: математическое ожидание М(т) и дисперсия Д(т) выражаются с помощью формул

М[m] = пр и Д[т] = прq.

Распределение Пуассона

Распределение Пуассона представляет собой предельный случай биномиального распределения для условий, когда р → 0; п → ∞ и пр = а.

Преобразуя выражение биномиального закона при приведенных выше условиях, получим формулу распределения Пуассона:

37

P(m,n)

am

е

,

(3.2)

m

 

 

 

 

 

 

где п - число испытаний;

m - число появлений события А m (= 0, 1, 2...);

P(m, n) - вероятность того, что при n испытаниях событие А появится ровно m´раз;

а - параметр закона (а = пр);

р- вероятность появления события А в одном испытании.

Всвязи с тем, что вероятность появления отдельных событий в распределении Пуассона характеризуется малой вероятностью (р → 0), закон Пуассона называют законом редких явлений.

Математическое ожидание М(т) и дисперсия Д(т) для распределения Пуассона равны и определяются по выражению

М[т] = Д[m] = nр = а.

Закон Пуассона описывает:

-поток требований в зону ремонта и ТО;

-поток заявок на запасные части, узлы, агрегаты;

-случайное число отказов в течение фиксированной наработки. Дискретная случайная величина, кроме формул 3.1 и 3.2, также мо-

жет быть задана:

а) рядом распределения вероятности (табл. 3.1).

Таблица 3.1

Частота значения

mA

0

1

2

3

m

события А

 

 

 

 

 

 

 

Вероятности, отве-

P(m, n)

P(0, n)

P(1, n)

P(2, n)

P(3, n)

P(m, n)

чающие частным

 

 

 

 

 

 

 

значениям появле-

 

 

 

 

 

 

 

ния случайной ве-

 

 

 

 

 

 

 

личины

 

 

 

 

 

 

 

б) многоугольником распределения вероятности появления события

А (рис. 3.3).

в) графиком функции распределения вероятности.

На основании ряда распределения или многоугольника распределения может быть построен график функции распределения рис. 3.4.

Основные числовые характеристики дискретной случайной величины в этом случае определяются по формулам

38

m

pi

- математическое ожидание;

 

 

М m mi

 

 

i 0

 

 

 

 

 

 

m

M m )2 pi

- дисперсия.

 

 

 

Д m ( mi

 

 

 

i 0

 

 

 

 

 

 

P(m,n)

 

 

 

 

 

 

P(1, n)

 

 

 

 

 

 

P(0, n)

 

 

 

 

 

 

 

0

1

2

3

4

mA

Рис. 3.3. Многоугольник распределения вероятности дискретной

 

 

случайной величины

 

 

 

F(m)

1

P(x<4)

F(m)= P(X<mA)

P(x<3)

P(x<2)

P(x<1)

P(x<0)

0

1

2

3

4

mA

Рис. 3.4. График распределения вероятности дискретной случайной величины

39

3.2.2. Законы распределения непрерывной случайной величины

При описании непрерывных случайных величин производственных процессов автомобильного транспорта широко используются следующие вероятностные законы:

-нормальный закон распределения;

-закон равномерной плотности;

-показательный (экспоненциальный) закон распределения;

-законы Вейбулла и др.

Нормальный закон распределения

Нормальный закон распределения записывается так

,

где f(x) - плотность вероятности распределения непрерывной случайной величины;

xi – текущее значение случайной величины (аргумент);

математическое ожидание случайной величины (среднее значение); σ – среднее квадратическое отклонение случайной величины; π = 3,14159; е = 2,718.

График плотности вероятности распределения случайной величины нормального закона имеет вид рис. 3.5.

 

Y

1

 

 

 

 

2

 

 

3

- σ

0

1 – σ = 0,5; 2 - σ = 1,0; 3 - σ = 2,0

Рис. 3.5. Характер рассеяния кривой нормального распределения

40