Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Лінійна алгебра

.pdf
Скачиваний:
9
Добавлен:
11.02.2016
Размер:
301.37 Кб
Скачать

 

 

 

 

 

 

11

 

 

 

 

 

 

 

 

 

1 1

2 3

 

3+ 6 2

 

1

y =

 

2 1

3

 

 

 

=

 

 

6 + 3

 

=

 

 

 

 

6

 

 

6

 

3

.

 

 

3 2

4

 

 

 

 

 

9

12 + 4

 

 

 

 

 

 

 

1

 

 

 

 

1

 

Таким чином, нові координати вектора x: y = (1,3,1).

6.ПРЯМА, ПЛОЩИНА І ГІПЕРПЛОЩИНА

Заналітичної геометрії ми знаємо, що рівняння прямої лінії на площині

R2 має вигляд

a1x1 + a2 x2 = b.

Це рівняння першого степеня відносно змінних x1 та x2 . Тут a1 , a2 та b

задані числа.

У тривимірному просторі R3 рівняння першого степеня a1x1 + a2 x2 + a3x3 = b,

де a1 , a2 , a3 та b – задані числа, задає площину.

 

 

Означення.

У n-вимірному просторі Rn

множина

точок

x = (x1,x2 ,...,xn ),

координати яких задовольняють

рівняння

першого

степеня

a1x1 + a2 x2 + ...+ an xn = b,

де a1 , a2 , ... ,an та b – задані числа, називається гіперплощиною.

Якщо ввести вектори a = (a1, a2 , ..., an ) та x = (x1,x2 ,...,xn ), то

рівняння гіперплощини можна записати так: a x = b.

Кожна гіперплощина ділить простір Rn на два півпростори. Один з них є множиною точок x = (x1,x2 ,...,xn ), координати яких задавольняють

нерівність

a1x1 + a2 x2 + ...+ an xn b. Другий півпростір задається нерівністю

a1x1 + a2 x2 + ...+ an xn b.

Зазначимо, що обидва півпростори містять в собі граничні точки a1x1 + a2 x2 + ...+ an xn = b.

Множини, які містять в собі граничні точки називаються замкненими. В противному випадку – називаються відкритими.

Отже, наші півпростори – замкнені множини.

Приклад. На площині R2 зобразити пряму

 

2x1 + 5x2 = 30

(6.1)

 

12

 

 

та півплощини

+ 5x2

≤ 30,

 

2x1

(6.2)

2x1

+ 5x2

≥ 30.

(6.3)

Розв’язання. Щоб зобразити пряму, знайдемо на ній які-небудь дві точки. Наприклад, точки M1 (15,0) і M2 (0,6) лежать на прямій бо

координати цих точок задовольняють рівнянню (6.1). Ця пряма зображена на рис. 6.1.

 

x2

 

x2

 

 

 

 

 

 

 

6

 

6

2x1

+ 5x2

≥ 30

 

 

 

 

 

O

15

x1

 

O

15

x

 

 

 

1

 

Рис. 6.1

 

 

 

Рис. 6.2

 

Візьмемо будь-яку точку, координати якої не задовольняють рівняння (6.1). Наприклад, точка O(0,0) не задовольняє цьому рівнянню. Координати

цієї точки задовольняють нерівність (6.2). Можна довести, що координати всіх точок, розташованих нижче прямої задовольняють нерівність (6.2), а координати точок, розташованих вище прямої задовольняють нерівність (6.3). На рис. 6.2 заштрихована півплощина, яка задана нерівністю (6.3).

Пряма на рис. 6.1 розділяє площину R2 на дві півплощини. Одна з них задається нерівністю (6.2), а друга – нерівністю (6.3).

7. ОПУКЛІ МНОЖИНИ

Означення. Множина точок називається опуклою, якщо для будь-яких двох точок множини вона вміщує всі точки відрізка, що з’єднує ці точки.

a

b

a

b

Рис. 7.1

Рис. 7.2

13

На рис. 7.1 зображено опуклу множину, а на рис. 7.2 – не опуклу множину, бо не всі точки відрізка ab нналежать даній множині.

На рис. 7.1 зображено точки a, b і відрізок, що їх з’єднує. Виникає задача: як записати точки відрізка ab аналітично?

Спочатку розв’яжемо задачу у тривимірному просторі R3 . Елементи цього простору можна зображувати точками або векторами (рис. 7.3).

 

C

B

b

 

d

 

 

 

A

b

a

 

c

 

 

 

 

a

 

 

 

O

 

c

 

Рис. 7.3

Рис. 7.4

 

Позначимо через O – початок системи координат. Елементами простору

R3 будемо вважати точки A, B, або вектори a, b. Візьмемо будь-яку точку

C (або вектор c) на відрізку AB. Тоді за правилом суми векторів

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

c = b +

BC

.

 

 

(7.1)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= a b, то

 

Оскільки вектор BC паралельний до вектора

BA

можна

записати

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= λ1 (a b),

 

 

(7.2)

 

 

 

 

 

 

 

 

BC

 

 

причому, λ1 (0,1) бо

 

 

 

 

<

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

BC

BA

 

 

 

Підставляючи (7.2) в (7.1), отримаємо

 

 

 

c = b + λ1 (a b) = b + λ1a λ1b = λ1a + (1λ1 )b.

(7.3)

Позначимо λ2 =1λ1 та помітимо, що λ1 + λ2

=1 і λ2 (0,1). Тоді

рівність (7.3) можна записати так:

 

 

 

 

 

 

 

 

 

 

 

 

 

c = λ1a + λ2b,

 

 

(7.4)

де λ1 (0,1) і λ1 + λ2 =1.

 

 

 

Отже, будь-яку внутрішню точку c відрізка ab можна подати у вигляді (7.4). Права частина цього виразу називається опуклою лінійною комбінацією двох точок a і b.

Узагальнимо поняття відрізка в n-вимірному просторі Rn .

Означення. Опуклою лінійною комбінацією двох точок a і b простору

Rn називається права частина виразу (7.4).

Відрізок ab – це сукупність всіх опуклих лінійних комбінацій точок a і b при λ1 [0,1].

Поняття про опуклу лінійну комбініцію двох точок розповсюджується і на більшу кількість точок.

14

Означення. Опуклою лінійною комбінацією точок a1 , a2 , ... ,am

простору Rn називається

λ1a1 + λ2a2 +...+ λmam ,

де λi ≥ 0 (i =1,2,...,m) та λ1 + λ2 +...+ λm =1.

З’ясуємо геометричний зміст опуклої лінійної комбінації трьох точок a, b і c:

де λi ≥ 0 (i =1,2,3)

 

 

λ1a + λ2b + λ3c,

 

 

та λ1 + λ2 + λ3 =1.

 

 

 

Припустимо, що λ1 + λ2

> 0 і запишемо вираз (7.5) у вигляді

 

 

 

λ1

 

 

λ2

 

 

(λ1

+ λ2 )

 

a +

 

b

+ λ3c.

 

λ1 + λ2

λ1

+ λ2

 

 

 

 

 

 

(7.5)

(7.6)

Позначимо

 

 

 

 

 

 

 

 

d =

 

λ1

 

a +

 

λ2

 

b

λ

+

λ

λ

+

λ

 

 

 

 

1

 

2

 

1

 

2

 

d є опуклою лінійною комбінацією точок a і b, тому належить відрізку ab (рис. 7.4). Запишемо (7.6) у вигляді

(λ1 + λ2 )d + λ3c.

Ми отримали опуклу лінійну комбінацію точок d і c. Сукупність всіх опуклих лінійних комбінацій цих точок задає відрізок dc. Виходить, що сукупність всіх опуклих лінійних комбінацій трьох точок a, b і c задає плоский трикутник abc (рис. 7.4).

Тепер стає зрозумілою наступна теорема.

Теорема. Опукла лінійна комбінація довільного числа точок, які належать опуклій множині, також належать цій множині.

8. ОПУКЛІ МНОГОГРАННИКИ

Означення. Крайньою точкою опуклої множини називається точка, яку не можна виразити у вигляді опуклої лінійної комбінації двох інших різних точок цієї множини.

Наприклад, крайніми точками для круга є всі точки його кола, для

трикутника – його вершини, для відрізка – його кінці.

Означення. Опукла замкнена множина, яка має скінченну кількість крайніх точок, називається опуклим многогранником.

Прикладами опуклих многогранників в просторі R2 є трикутник, паралелограм, трапеція, в просторі R3 – куб, паралелепіпед, піраміда.

Теорема. Множина точок x = (x1,x2 ,...,xn ), яка задовольняє системі лінійних нерівностей

15

 

ai1x1 + ai2 x2 + ...+ ain xn bi , i =1,2,...,m,

(8.1)

є опукла множина.

Доведення. Візьмемо які-небудь дві точки

x

і x

′′

′′ ′′

′′

,),

 

= (x1

,x2

,...,xn )

 

= (x1,x2

,,...,xn

координати яких задовольняють нерівностям (8.1):

ai1x1′ + ai2 x2′ + ...+ ain xn′ ≤ bi ,

i =1,2,...,m,

(8.2)

ai1x1′′+ ai2 x2′′ + ...+ ain xn′′ ≤ bi ,

i =1,2,...,m.

(8.3)

Доведемо, що координати точки

λ1x′ + λ2 x′′, λ1 (0,1), λ1 + λ2 =1

теж задовольняють нерівностям (8.1).

Помноживши обидві частини нерівності (8.2) на λ1, а обидві частини

нерівності (8.3) на λ2 і результати склавши, отримаємо

ai1 (λ1x1′ + λ2 x1′′) + ai2 (λ1x2′ + λ2 x2′′) + ...+ ain (λ1xn′ + λ2 xn′′) λ1bi + λ2bi .

Оскільки λ1bi + λ2bi = (λ1 + λ2 )bi = bi , то

ai1 (λ1x1′ + λ2 x1′′) + ai2 (λ1x2′ + λ2 x2′′) + ...+ ain (λ1xn′ + λ2 xn′′) bi .

Ми довели, що координати точки λ1x′ + λ2 x′′ задовольняють системі

нерівностей (8.1). Отже, множина точок, яка задовольняє цієї системі є

опуклою. Теорему доведено.

Означення. Множина точок, яка визначається системою лінійних

нерівностей (8.1), називається многогранником розв’язків цієї системи.

 

Приклад. Зобразитм на рисунку многогранник розв’язків системи

 

2x1 + 5x2

30,

(8.4)

4x1 x2

16,

(8.5)

x1 0, x2 0.

(8.6)

Розв’язання. Спочатку розглянемо прямі, які задані рівняннями

 

2x1 + 5x2

= 30,

(8.7)

4x1 x2

=16.

(8.8)

Розв’язавши систему цих рівнянь ми знайдемо точку перетину відповідних прямих. Система має єдиний розв’язок x1 = 5, x2 = 4, тому

прямі мають єдину спільну точку A(5,4).

Пряму (8.7) проведемо через знайдену точку A і точку з координатами (0,6), а пряму (8.8) – через точку A і точку (4,0). Ці прямі зображені на

рис. 8.1.

Координати точки O(0,0) задовольняють нерівність (8.4). Тому

координати всіх точок, що розташовані нижче від прямої (8.7) задовольнятимуть цю нерівність.

16

Координати точки O(0,0) задовольняють також нерівність (8.5). Тому

координати всіх точок, що розташовані ліворуч від прямої (8.8) задовольнятимуть цю нерівність.

6

x2

 

 

x2

 

 

 

 

 

A(5,4)

 

 

 

 

A(5,4)

 

 

 

 

 

 

 

 

 

 

 

 

 

g

 

 

 

 

 

x1

О

 

 

О

4

4

x1

 

 

Рис. 8.1

 

 

Рис. 8.2

 

 

Нерівність x1 ≥ 0 задає півплощину розташовану праворуч від прямої

x1 = 0. Нерівність

x2

≥ 0 задає півплощину розташовану вище від прямої

x2 = 0. Многокутник розв’язків системи зображено на рис. 8.1.

 

 

9. ПРИКЛАД ЗАДАЧІ ЛІНІЙНОГО ПРОГРАМУВАННЯ

Розглянемо задачу знаходження найбільшого значення функції

S = 3x1 + 2x2

при умові, що невідомі числа x1 та x2 задовольняють системі нерівностей (8.4)-(8.6).

Оскільки функція S лінійна відносно змінних x1 та x2 (тобто є

многочленом першого степеня) і додаткові умови (8.4)-(8.6) задані системою лінійних нерівностей, то така задача в математиці називається задачею лінійного програмування.

В попередньому прикладі ми з’ясували, що система нерівностей (8.4)- (8.6) геометрично являє собою многокутник, зображений на рис. (8.1). Наша задача полягає в тому, щоб серед точок цього многокутника знайти ту, в якій функція S досягатиме найбільшого значення. Знайдемо градієнт g функції

S :

S

 

 

 

S

 

 

 

 

 

 

 

 

 

= grad S =

 

 

+

 

 

= 3

 

+ 2

 

.

 

 

 

i

j

i

j

g

 

 

 

 

 

 

x

x

 

 

 

1

 

 

 

2

 

 

 

 

 

 

 

Градієнт g = (3,2), зображений на рис. 8.2, показує напрям

найбільшого зростання функції S . Напрям, протилежний градієнту, є напрямом найбільшого спадання функції. У точках прямої, що перпендикулярна градієнту, функція приймає одне й те саме значення. Пересуваючи цю пряму паралельно самій собі у напрямі градієнта, ми

17

збільшимо значення значення функції S на цій прямій. З рис. 8.2 видно, що найбільшого значення функція досягатиме в точці A(5,4), а найменшого – в точці O(0,0). Отже

S(5,4) = 3 5+ 2 4 = 23 – найбільше значення функції,

S(0,0) = 3 0 + 2 0 = 0 – найменше значення функції.

Задачі математичного програмування з більшою кількістю змінних виходять за межі курсу вищої математики і вивчаються в інших дисциплінах.

10. ЛІНІЙНІ ОПЕТАТОРИ ТА ЇХ МАТРИЦІ

Визначення. Оператором A називається правило, за яким кожному елементу x множини X ставиться у відповідність єдиний елемент y множини Y . Результат дії оператора A на елемент x позначають y = Ax. При цьому елемент y називають образом елемента x, а x– прообразом елемента y .

Множина X називається областю визначення оператора, а множина Y – множиною його значень (рис. 10.1).

Також кажуть, що оператор A елементи множини X переводить в елементи множини Y і пишуть A: X Y .

 

 

 

 

 

 

A

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

y

 

 

 

 

 

y=Ax

 

 

 

 

 

 

 

 

 

 

 

 

X

 

 

Y

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 10.1

 

 

Нехай

 

X і Y – лінійні простори. Оператор

A: X Y , називається

лінійним, якщо для будь-яких елементів x1 та x2

з

X і довільного числа α

справджуються рівності:

 

 

 

 

 

1) A(x1 + x2 ) = Ax1 + Ax2 ; 2) A(α x1 ) = α Ax1.

Теорема. Будь-який лінійний оператор

A: Rn Rm однозначно

визначається деякою матрицею розміром m× n.

 

 

Доведення. Позначимо через

p , p

,..., p

базис в просторі Rn , а через

 

 

 

 

 

1 2

 

n

 

 

q ,q ,...,q

m

– базис в просторі

Rm . Кожний з

 

елементів Ap належить

1 2

 

 

 

 

 

 

 

i

простору Rm , а тому може бути розкладений за векторами базису цього простору:

18

 

 

Ap = a q + a

q

 

 

+...+ a

 

q

 

,

 

 

 

 

1

11

1

21 2

 

 

m1

 

 

m

 

 

 

 

Ap2

= a12q1 + a22q2 +...+ am2qm ,

 

 

 

.............................................

 

 

(10.1)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ap

= a

q

 

+ a

 

q

 

+...+ a

mn

q .

 

 

 

 

n

1n

1

2n

 

2

 

 

 

m

 

Складемо матрицю, стовпці якої – координати образів базисних векторів

 

 

 

 

 

 

a

a

 

 

... a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

11

12

 

 

1n

 

 

 

 

 

 

 

 

 

 

 

A =

a21

a22 ... a2n

.

 

 

 

 

(10.2)

 

 

 

 

 

 

....................

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

am1

am2 ... amn

 

 

 

 

 

 

Нехай оператор

A

переводить

елемент

x = x1 p1 + x2 p2 +...+ xn pn в

елемент

y = y1q1 + y2q2 +...+ ymqm , тобто y = Ax. Враховуючи лінійність

оператора A і формули (10.1), одержимо

 

 

 

 

 

 

 

 

 

m

 

n

 

 

n

 

 

 

 

 

 

n

m

 

 

 

m

n

yiqi = A

xj pj = xj Apj = xj aijqi = qi

aij xj .

i=1

 

j=1

 

 

j=1

 

 

 

 

 

j=1 i=1

 

 

i=1 j=1

Порівнюючи коефіцієнти при базисних векторах qi , отримаємо формули

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

yi = aij xj ,

 

i =1,2,...,m,

 

 

 

 

 

j=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

які можна записати в матричному вигляді y = Ax, де A – матриця (10.2),

 

 

 

 

x

 

 

 

 

 

 

y

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

x = x2

,

 

 

 

 

y = y2

 

.

 

 

 

 

 

 

...

 

 

 

 

 

 

...

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xn

 

 

 

 

 

 

ym

 

 

 

Ми довели, що кожному лінійному оператору A: Rn Rm відповідає матриця (10.2). Ця матриця називається матрицею оператора A. Справедливе і обернене твердження: кожній матриці розміром m× n відповідає лінійний оператор.

Лінійний оператор та його матрицю можна позначати однією і тією ж буквою.

Теорему доведено.

11. МАТРИЦЯ ПЕРЕХОДУ ДО ІНШОГО БАЗИСУ

У попередньому пункті ми з’ясували, що лінійний оператор

A: Rn Rm однозначно задається деякою матрицею. Але ця матриця

19

залежить не тільки від самого оператора A, а й від обраних базисів в просторах Rn та Rm . З’ясуємо, як зміниться матриця, якщо змінити базиси.

Нехай в просторі Rn дано два базиси: старий і новий, B – матриця переходу. Тоді, як ми знаємо, координати вектора x в старому базисі та його координати xв новому базисі зв’язані формулою

x = Bx.

Якщо визначник матриці B відмінний від нуля, то існує обернена

матриця B1 і можна записати

x′ = B1x.

Нехай

лінійний

оператор,

що задається

матрицею

A,

переводить

елемент x

в елемент

y : y = Ax, координати

елементів x

та

y

задані в

старому базисі. Якщо ми хочемо, щоб оператор діяв на елемент x в

новому

базисі, то

треба підставити

x = Bx, отримаємо y = ABx.

Вектор y

записаний в старому базисі. Щоб записати його в новому базисі, треба помножити його на матрицю B1 : y′ = B1 y. Остаточно отримаємо

y′ = B1ABx.

Відповідь. Якщо в старому базисі лінійний оператор мав матрицю A, то

в новому базисі його матриця має вигляд

 

A′ = B1AB,

(11.1)

де B– матриця переходу від старого базису до нового.

 

12. ВЛАСТИВІ ВЕКТОРИ І ВЛАСТИВІ ЧИСЛА

Означення. Властивим вектором лінійного оператора

A називається

такий ненульовий вектор x, що для деякого числа λ справджується рівність

Ax = λx.

(12.1)

Саме число λ називається властивим значенням оператора A, що відповідає

властивому вектору x.

 

Очевидно, ящо x – властивий вектор, то α x

– теж властивий

вектор для будь-якого числа α ≠ 0.

 

Нехай A: Rn Rn . Тоді оператор A задається матрицею порядку n. Позначимо через I одиничну матрицю того ж порядку. Враховуючи, що

x = Ix, перепишемо рівняння (12.1) в іншому вигляді

Ax = λIx, Ax λIx = 0, (AλI )x = 0.

Отже, рівняння (12.1) можна записати у вигляді

 

(AλI )x = 0.

(12.2)

У просторі Rn рівняння (12.2) є матричним рівнянням системи лінійних однорідних рівнянь. Ця система має ненульовий розв’язок лише у тому випадку, коли визначник системи дорівнює нулю:

20

 

AλI = 0.

(12.3)

Рівняння (12.3) називається характеристичним рівнянням системи. Розв’язавши характеристичне рівняння, знайдемо властиві числа оператора A. Підставивши знайдене властиве число в систему рівнянь (12.2), знайдемо відповідні властиві вектори.

Приклад 12.1. Знайти властиві вектори і властиві числа оператора, що заданий матрицею

 

3

−1

A =

−1

3

.

 

 

Розв’язання. Складемо рівняння (12.2). В нашому випадку

1 0

 

1 0

λ 0

 

I =

 

,

λI = λ

 

=

 

,

 

0 1

 

 

0 1

0

λ

 

тому

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

AλI =

 

3 −1

 

λ 0

=

3− λ −1

 

 

 

 

−1 3

 

 

 

 

.

 

 

 

 

 

 

 

 

0

λ

 

 

−1

3− λ

 

Запишемо рівняння (12.2) в матричному вигляді

 

 

 

 

 

 

 

 

3− λ

 

−1

x

 

 

= 0

 

 

 

 

 

 

 

 

 

−1

3− λ

1

 

 

 

 

 

 

 

 

 

 

 

x2

 

 

 

 

 

і в розгорнутому вигляді

 

(3− λ )x x = 0,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

 

= 0.

 

 

 

 

 

 

 

 

x + (3− λ)x

 

 

 

(12.4)

 

 

 

 

 

 

1

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Розв’яжемо характеристичне рівняння

 

 

 

 

λ = 2,

 

3− λ −1

 

= 0,

 

(3− λ)

2

−1= 0,

 

 

λ − 3 = −1,

 

 

 

 

 

 

−1 3− λ

 

 

 

 

 

 

=1,

 

1

 

 

 

 

 

 

 

 

 

 

 

 

λ − 3

λ2 = 4.

В нашому прикладі характеристичне рівняння має два корені. Обидва корені – дійсні числа. І взагалі, якщо матриця A симетрична відносно

головної діагоналі, то її властиві значення – дійсні числа.

Підставимо λ1 = 2 в систему (12.4) і знайдемо відповідний властивий вектор

x1 x2 = 0,−x1 + x2 = 0.

Система має безліч розв’язків x1 = x2 . Одним із них буде властивий вектор l1 = (1,1). Поділивши цей вектор на його довжину 2 , отримаємо властивий вектор одиничної довжини

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]