Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Хмельницкий университет управления и права

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

3 модуль.doc

Скачиваний:

130

Добавлен:

23.02.2016

Размер:

3.32 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 2122 / 2222

Виконання студентами тестових завдань з питань теми заняття. Методичні вказівки

Ключовими термінами, на розумінні яких базується засвоєння навчального матеріалу теми, є : методи лінеаризації кривих, логістична крива, час максимального попиту, прогнозні розрахунки – аргумента за відомою функцією і навпаки, функції за відомим аргументом.

З метою глибокого засвоєння навчального матеріалу при самостійному вивченні теми студенту варто особливу увагу зосередити на таких аспектах.

Основні задачі теорії кореляції.
Побудова прямої лінії регресії.
Нелінійна кореляція.

1. Нехай задано дві випадкові величини – X і Y. Можливі такі ситуації.

1) X та Y – незалежні величини: зміна Х не впливає на розподіл Y.

2) X та Y пов’язані функціональною залежністю.

3) Між X та Y існує статистична (стохастична) залежність: одному й тому ж значенню величини X відповідає статистична сукупність значень величини Y. Якщо, зокрема, при зміні однієї величини (X) змінюється середнє значення другої (), то статистична залежність називається кореляційною. Таким чином, кореляційна залежність – це функціональна залежність між значеннями величини X та умовними середніми значеннями випадкової величини Y.

Кореляція називається неповною, коли одній величині (наприклад, X) надаються певні фіксовані значення х₁, х₂,…,х_к і для кожного з них шляхом експерименту знаходять сукупність значень величини Y. Кореляція називається повною, коли кожен із відібраних елементів статистичної сукупності об’єктів досліджується відразу і по Х, і по Y.

а) питання про форму кореляційного зв’язку між Х і Y;

б) оцінка тісноти кореляційного зв’язку між Х і Y.

Розв’язання задачі а) зводиться до підбору певного виду функціональної залежності, а задачі б) – визначення того, наскільки близька досліджувана залежність до вибраної функціональної.

Задача а) розв’язується за допомогою регресій. Емпірична лінія регресії – це ламана лінія, яка з’єднує точки з координатами A_і (x_і,) (тут –умовна середня (і=1,2,…,n)). Теоретично лінією регресії Y по Х називається лінія, яка “згладжує” емпіричну лінію регресії. Рівняння цієї лінії дає наближений аналітичний вираз регресії.

Кореляційна залежність між випадковими величинами Х та Y називається лінійною кореляцією, якщо теоретичні рівняння регресії Y по Х та Х по Y лінійні. В противному випадку кореляційна залежність називається нелінійною.

2. Параметри теоретичного рівняння прямої лінії регресії Y по Х знаходять у такий спосіб.

А) Якщо дано n точок () (і=1,2,…, n), шукають рівняння виду . Згідно з методом найменших квадратів, мінімізують суму квадратів відхилень виду. Виходячи з цієї вимоги, одержують:

Аналогічно можна знайти рівняння прямої лінії регресії Х по Y: Зауважимо, що коефіцієнт можна представити у вигляді деσ_х та σ_у – вибіркові середні квадратичні відхилення, а R вибірковий коефіцієнт кореляції:

Цей коефіцієнт – статистична оцінка теоретичного коефіцієнта кореляції p, який визначається за формулою:

Б) Якщо дані спостереження над випадковими величинами Х і Y задані кореляційною таблицею розмір n х m з рівновіддаленими варіантами, то рівняння прямої лінії регресії Y по Х зручно шукати у формі дета– вибіркові середні випадкових величинХ і Y відповідно, а r_ху – вибірковий коефіцієнт кореляції, представлений у вигляді причомуw_ij – емпірична ймовірність появи значення (х_і, ) ,n – кількість спостережених варіант випадкової величини X, m – кількість спостережених варіант випадкової величини Y.

Нехай результати спостережень задані кореляційною таблицею з рівновіддаленими варіантами, причому h₁ – крок варіант випадкової величини Х, а h₂ – крок варіант випадкової величини Y. Для полегшення розрахунків переходять до умовних варіант U і V, користуючись співвідношенням деC₁ і C₂ – “хибні нулі” варіант випадкових величин Х і Y. Вибірковий коефіцієнт кореляції =, де причому

У рівняння прямої регресії виходять величини які обчислюють за допомогою формул

ПРИКЛАД. Знайти вибіркове рівняння прямої регресії Y по Х за даними кореляційної таблиці 1.

Таблиця 1

Х	Y					n_x
Х	10	15	20	25	30	n_x
50 60 70 80 90	9 2 - - -	9 10 3 - -	- 11 15 6 -	- - 12 10 1	- - - 7 5	18 23 30 23 6
n_y	11	22	32	23	12	100

Розв’язування. Перетворимо кореляційну таблицю 1, ввівши умовні варіанти Замінимо частоти емпіричними ймовірностями. Отримаємо таблицю 2.

Таблиця 2

U	V					w_u
U	-2	-1	0	1	2	w_u
-2 -1 0 1 2	0,09 0,02 - - -	0,09 0,10 0,03 - -	- 0,11 0,15 0,06 -	- - 0,12 0,10 0,01	- - - 0,07 0,05	0,18 0,23 0,30 0,23 0,06
w_v	0,11	0,22	0,32	0,23	0,12	1

Визначимо :

;

Знайдемо :

;

Обчислимо:

Далі знайдемо суму

Знайдемо вибірковий коефіцієнт кореляції:

Звідси маємо: ,Обчислюємо середні квадратичні відхилення:

Таким чином, вибіркове рівняння регресії має вигляд або

3. Припустимо, що точки кореляційного поля ґрупуються навколо деякої кривої лінії. У цьому випадку графік емпіричної лінії регресії співставляють з графіками відомих функцій. Невідомі параметри рівнянь регресії шукають методом найменших квадратів, провівши попередньо лінеаризацію (“випрямлення”) кривих. Так, наприклад, щоб піібрати параметри a і a₁ степеневої залежності , лінеаризуємо це рівняння за допомогою логарифмування:

Якщо позначити то останнє рівняння набуває виду

Параметри і можна визначити методом найменших квадратів.

Оцінка точності апроксимації криволінійною залежністю проводиться за допомогою кореляційного відношення :

Якщо при цьому , то крива точніше апроксимує залежність, ніж пряма. Прилінійна кореляція буде точнішою. Зауважимо, що для прямої лінії.

Важливе значення у прогнозуванні має логістична залежність

причому B, k – сталі числа.

Якщо відомі результати n спостережень (t_i, y_i) (i=1,2,…,n), то ця залежність будується, як кореляційна. Заміною змінних

Вона лінеаризується у залежність де.

З використанням методу найменших квадратів для середніх значень параметрів В і k отримуємо формули:

ПРИКЛАД. За щоденними даними першої декади червня рівня забезпеченості y населення послугою туристичного агентства (таблиця 1) встановити логістичну залежність.

Таблиця 1

(дні)