Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
8
Добавлен:
19.02.2016
Размер:
544.71 Кб
Скачать

1

ДЕРЖАВНИЙ УНІВЕРСИТЕТ ТЕЛЕКОМУНІКАЦІЙ

Кафедра вищої математики

ЗАТВЕРДЖУЮ Завідувач кафедри ______________

О. В. Барабаш "___" _____________20___ року

ЛЕКЦІЯ

з навчальної дисципліни

Математичні методи в соціології

Тема 1. Вступ до курсу “Математичні методи в соціології ”. Базовий матеріал до курсу із теорії ймовірностей: Випадкові величини одно-та двовимірні

Лекція 8. Нормальний закон розподілу на площині. Прямі лінії середньоквадратичної ре-

гресії двовимірної випадкової величини.

Навчальний час – 1,5 годин.

Для студентів Навчально-наукового інституту Гуманітарних технологій за напрямом підго-

товки 402 соціологія, освітньо-кваліфікаційного рівня бакалавр, спеціальністю 6.040201 ”соціологія

Навчальна та виховна мета: 1.Ознайомлення: із нормальним законом розподілу на площині та формулами для прямих ліній середньоквадратичної регресії двовимірної випадкової величини.

Обговорено та схвалено на засіданні кафедри

“___” _________ 20___ року Протокол №____

Київ – 20__

2

Зміст

Вступ

1. Нормальний закон розподілу на площині. Еквівалентність некорельованості та незалеж-

ності компонент нормально розподіленої двовимірної випадкової величини.

2.Поняття функцій та ліній регресії двовимірної випадкової величини. Лінійність регресій компонент нормально розподіленої двовимірної випадкової величини.

3.Поняття середньоквадратичної регресії компонент двовимірної випадкової величини та прямі середньоквадратичної лінійної регресії. Збіг прямих середньоквадратичної регресії з відпо-

відними лініями регресії компонент для нормально розподіленої двовимірної випадкової величини.

Заключна частина.

Л I Т Е Р А Т У Р А

1. Барковський В.В., Барковська Н.В., Лопатін О.К. Теорія імовірностей та математична статистика. К.:ЦНЛ, – 2006 – 424 с.

Наочні посібники

Таблиці значень функцій Лапласа та Гауса

Завдання на самостійну роботу

1.Вивчити матеріал лекції за підручником [1] (стор. 127-128) та наступним текстом лек-

ції.

Вступ – в лекції розглядається базовий матеріал до курсу “Математичні методи в соціоло-

гії ”із теорії ймовірностей: Нормальний закон розподілу на площині; прямі лінії середньоквадра-

тичної регресії двовимірної випадкової величини

3

1. Нормальний закон розподілу на площині. Еквівалентність некорельованості та незалежності компонент нормально розподіленої двовимірної випадкової величини.і

Нагадаємо: у випадку одновимірної нормальної випадкової величини X густина її розпо-

ділу описується функцією Гаусса:

 

 

1

 

 

( x a)2

 

 

f (x)

 

 

e

 

2

,

(1)

 

 

 

 

 

 

σ

 

 

 

 

 

 

 

 

 

 

 

де а, – параметри розподілу. Область можливих значень випадкової величини X належить непе-

рервній множині точок х осі ОХ. Статистичний зміст параметрів розподілу: a M ( X ), σ2 D( X ) .

На Рис.1 зображено графік густини розподілу випадкової величини Х.

Рис.1. Графік густини нормально розподіленої випадкової величини (графік функції Гаусса)

Двовимірна випадкова величина (X; Y) розподілена на площині ОХУ за нормальним законом, якщо густина її розподілу описується функцією 2-х змінних:

f (x, y)

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

2πσ

σ

y

1 К

2

 

 

x

 

 

 

x y

 

 

1

 

x a

x

2

 

 

 

 

 

 

 

 

2 Кx y

 

2(1 Кx y

 

σx

 

 

 

2 )

 

 

 

e

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x a

 

 

y ay

y ay

2

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ

x

 

 

σ

y

 

 

σ

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

, (2)

де

ах,

ау,

х,

у,

Кху

 

параметри

розподілу:

aх

M ( X ),

aу M (Y );

σ2x D( X ),

σ2y D(Y );

Kxy

rxy

. Отже,

точка з коорди-

σxσ y

 

 

 

 

 

 

 

 

 

натами (ах, ау) є центром розподілу випадкової величин ;Y); середньоквадратичні відхилення

4

х, у кожної з компонент характеризують міру розсіяння випадкової величини навколо її центру;

Кху та rху – відповідно коефіцієнт та момент кореляції випадкових величин Х і Y.

Якщо коефіцієнт кореляції Кху=0 має нульове значення, то відповідно до формули (2) дво-

вимірна густина розподілу набуде такого вигляду:

 

 

 

 

1

x a 2

y ay 2

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

2

 

σx

 

σ y

 

 

f (x, y)

 

 

 

 

 

e

 

 

 

 

 

 

 

 

 

2πσxσ y

 

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

У цьому випадку

 

 

 

 

 

 

1 x ax 2

 

 

 

 

 

 

1

y ay 2

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

f (x, y)

 

 

 

2

σ

 

 

 

 

 

2

 

σ y

 

f

(x) f

 

 

 

 

 

 

e

 

 

 

 

x

 

 

 

e

 

 

 

 

 

2

( y)

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2πσx

 

 

 

 

 

 

 

 

2πσ y

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(3)

(4)

тобто, виконується необхідна та достатня умова незалежності випадкових величин Х та Y (див.

попередню лекцію), тому для нормально розподіленої двовимірної випадкової величини понят-

тя некорельованості (Кху=0) та незалежності її компонент є еквівалентними.

Відповідно до формули (4) густúни розподілу кожної з компонент Х і Y одновимірних

випадкових величин мають значення:

 

 

 

 

 

 

( x a )2

 

 

 

 

 

 

 

 

(e ay )2

 

 

 

1

 

 

x

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

e 2y ,

 

f (x)

 

 

 

e 2x ,

f

2

( y)

 

 

 

(5)

 

 

 

 

 

 

 

 

1

σx

 

 

 

 

 

σ y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

тобто, кожна з компонент має нормальний розподіл.

2. Поняття функцій та ліній регресії двовимірної випадкової величини. Лінійність регресій компо-

нент нормально розподіленої двовимірної випадкової величини

Густúни умовного розподілу кожної з компонент Х та Y визначаються за формулами

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

x a

x

К

 

 

 

y ay 2

 

 

 

 

 

f ( x, y)

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

x y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

x, у

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σx

 

 

 

 

 

σ y

 

 

 

f

 

 

 

 

 

 

 

 

 

 

 

 

 

e 2(1 Кx y

)

 

 

 

 

 

 

 

 

 

,

1 y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f2

 

σ

x

1 К

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

y ay

К

 

 

 

x a

x

2

(6)

 

 

 

 

f ( x, y)

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

x y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

х, y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ y

 

 

 

σx

 

 

 

 

f

 

 

 

 

 

 

 

 

 

 

e 2(1 Кx y

)

 

 

 

 

 

 

 

 

,

2 x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f1

 

 

σ

y

1 К

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

отриманими на основі формул (2) і (5) внаслідок алгебраїчних перетворень.

Отже, кожний із законів умовного розподілу випадкових величин Х та Y є нормальним з умовним математичним сподіванням та умовною дисперсією, які відповідно до формул (1), (6) є такими:

5

M

 

( X ) a

 

К

 

σ

x

 

( y a

) ,

M

 

(Y ) a

 

 

К

 

σ y

( x a

);

 

y

x

x y

 

 

 

x

y

x y

 

 

 

 

 

 

σ y

 

 

y

 

 

 

 

 

σx

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

,

(7)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D

( X ) σ 2

(1 К

 

2 ),

 

D (Y ) σ 2

(1 К

 

2 ).

 

 

 

 

y

 

 

 

x

 

 

 

x y

 

 

x

 

y

 

 

 

x y

 

 

Відповідно до формул (7) умовні дисперсії кожної з компонент, Dy ( X ) або Dx (Y ) , є ста-

лими і не залежать від значення y або х іншої компоненти двовимірної випадкової величини. Цю властивість називають рівнозмінюваністю умовних нормальних розподілів і використовують в ста-

тистичному аналізі.

Означення 1. Функціональна залежність величини умовного математичного очікування однієї із компонент двовимірної випадкової величини від величини іншої компоненти називається фун-

кцією регресії цієї компоненти на іншу, а графік функції регресії відповідно – лінією регресії:

M y ( X ) φ1( у) – функція регресії Х на Y; M х (Y ) φ2 (х) – функція регресії Y на Х. (8)

Згідно з формулами (7) для умовних очікувань компонент двовимірної нормально розпо-

діленої випадкової величини, функція φ1( у) регресії Х на Y та функція φ2 (х) регресії Y на Х є лінійними, і відповідно лінії регресії є прямими лініями.

Зауваження 1. Термін регресія: regression (латин.) – повернення назад, для позначення зво-

ротного руху, відступлення тощо.

3. Поняття середньоквадратичної регресії компонент двовимірної випадкової величини та прямі середньоквадратичної лінійної регресії. Збіг прямих середньоквадратичної регресії з відповідними лініями регресії компонент для нормально розподіленої двовимірної випадкової величини.

В багатьох задачах потрібно встановити та оцінити залежність досліджуваної випадкової величини від однієї або багатьох інших величин. Припустимо, що необхідно визначити залежність між випадковими величинами Y та Х. Дві випадкові величини можуть бути пов’язані або функціо-

нальною залежністю, або статистичною, або вони можуть бути незалежними.

Розглянемо двовимірну величину (X, Y), компоненти X і Y якої - залежні випадкові величи-

ни (дискретні або неперервні). Подамо наближено одну з цих величин, наприклад Y, як функцію іншої

Y g( X ) .

Це наближення можна здійснити різними способами, найбільш поширеним з яких є метод

найменших квадратів.

6

Означення 2. Функція g(X) називається найкращим наближенням випадкової величини Y

по методу найменших квадратів, якщо математичне очікування випадкової величини – ква-

драта відхилення Y від значень функції g(Х), тобто величина

M[Y g( X )]2 ,

(9)

набуває найменшого значення. При цьому функція g(x) називається середньоквадратичною ре-

гресією Y на Х.

 

Якщо величину Y наближено подають лінійною функцією від Х, тобто

 

Y g( X ) α β X ,

(10)

де постійні величини і – невідомі параметри, які визначаються методом найменших квадратів,

то функція g(Х) називається лінійною середньоквадратичною регресією Y на Х.

Теорема. Лінійна середньоквадратична регресія Y на Х, (10), обчислюється за формулою:

 

 

 

 

 

g( X ) m

 

K

 

σ y

( X m

) ,

 

 

 

(11)

 

 

 

 

 

y

xy

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σx

 

 

 

 

 

 

де m

 

M ( X ),

m

 

M (Y ); σ2 D( X ),

σ2

D(Y );

K

 

 

rxy

.

x

у

xy

 

 

 

 

x

 

 

 

y

 

 

 

 

σx

σ y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Доказ теореми базується на знаходженні значень параметрів і для величини (9):

 

 

 

 

F(α,β) M[Y g( X )]2 M[Y (α β X )]2 ,

(12)

із умови мінімуму функції 2-х змінних, вираз якої на основі властивостей математичного очіку-

вання та дисперсії перетворено до вигляду

F(α,β) M[Y (α β X )]2 σ2y

β2

σ2x

2Kxyσxσ y β my α β mx 2 .

(13)

Необхідні умови екстремуму:

F

 

0;

F

0 – складають систему лінійних рівнянь від-

 

α

 

 

β

 

 

 

 

 

 

 

носно невідомих і , після розв’язання якої отримаємо:

 

 

 

 

 

α=m

 

K

 

σ y

m

;

β= K

 

σ y

.

(14)

y

xy

 

xy

 

 

 

 

σx

x

 

 

σx

 

 

 

 

 

 

 

 

 

 

 

При цих значеннях і екстремум є мінімумом.

 

 

 

 

 

Після підставлення знайдених значень і у лінійне наближення для Y (10)

маємо:

g( X ) α

σ

або g( X ) my Kxy σy ( X

x

 

 

σ

y

 

 

σ

y

 

 

β X my

Kxy

 

mx

Kxy

 

X .

(15)

σx

 

 

 

 

 

 

σx

 

mx ) , що й треба було довести.

7

Пряма лінія, що відповідає лінійній середньоквадратичній регресії Y на Х, (11), в коорди-

натах х~Х , y~Y=g(Х) має рівняння:

σ

y my Kxy σy (x mx ) (16)

x

Після підставлення знайдених значень і у вираз (13) отримаємо мінімальне значення функції F(α,β) , яке дорівнює величині

σ2y 1 K2xy ,

що носить назву залишкової дисперсії випадкової величини Y відносно випадкової величини Х;

вона характеризує величину помилки, яку допускають при заміні Y лінійною функцією g(Х)= + Х (помилку необхідно трактувати як мінімум математичного очікування (9) квадрата

випадкової величини – квадрата відхилення Y від значень функції g(Х)).

Аналогічно можна отримати рівняння прямої лінії середньоквадратичної регресії Х на Y:

x m

 

K

 

σx

( y m

) .

(17)

x

xy

 

 

 

σ y

y

 

 

 

 

 

 

 

 

 

Прямі лінії (16), (17) середньоквадратичних регресій перетинаються в точці точці (тх,, ту)

– центрі сумісного розподілу випадкових величин Х і Y.

Якщо коефіцієнт Кху кореляції випадкових величин Х і Y дорівнює 1 , тобто між випа-

дковими величинами має місце строга лінійна залежність, то обидві прямі середньоквадратич-

ної регресії збігаються.

Порівнюючи отримані рівняння (16), (17) прямих середньоквадратичної регресії із функ-

ціями регресії (7) (залежностями умовного математичного очікування однієї із компонент дво-

вимірної нормальної випадкової величини від величини іншої компоненти), дійдемо висновку:

для двовимірної нормально розподіленої випадкової величини прямі середньоквадратич-

ної регресії збігаються з відповідними прямими регресії.

Заключна частина

В лекції викладено базовий матеріал до курсу “Математичні методи в соціології ”із теорії ймовірностей: нормальний закон розподілу на площині; прямі лінії середньоквадратичної регресії двовимірної випадкової величини

Канд. фіз-мат. н., доцент

(О. Б. Омецінська)

Соседние файлы в папке архив прош.сесий