Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ms_labs

.pdf
Скачиваний:
25
Добавлен:
10.12.2018
Размер:
4.28 Mб
Скачать

Медіану

t0 b ln 2 1/ a .

Моду

 

 

 

 

1

 

 

 

 

 

1

 

 

 

 

 

a

 

 

t0

b 1

 

 

 

,

 

 

 

 

 

 

a

 

при a 1,

при чому a,b 0 .

 

 

 

 

 

 

Наявність ґама-функції у виразах математичного сподівання та дисперсії практично не дає можливості безпосередньо їх визначити на підставі вибіркових значень методом найменших квадратів.

Для визначення параметрів a і b розподілу Вейбула використовують різноманітні класичні та емпіричні підходи та чисельні методи.

3. Розподіл Релея

Однопараметричний розподіл Релея є одномодальним розподілом, з правосторонньою асиметрією і додатною областю значень. Він широко використовується в теорії надійності і є добре вивченим. Його залежність від одного параметра є зручною для проведення ідентифікації індивідуальних розподілів, оскільки легко створити порядкову шкалу.

Однопараметрична функція розподілу Релея та його щільність мають такий вигляд

 

 

 

 

 

 

t

2

 

 

 

 

 

 

 

F t; 1 exp

 

 

 

 

 

,

t 0,

0 ,

(4)

 

 

 

 

2

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f t;

t

 

 

 

 

 

t

2

 

 

 

 

 

 

 

 

exp

 

 

 

 

 

 

,

t 0 ,

 

(5)

 

2

 

 

 

 

 

 

 

 

 

 

 

 

2

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

де – параметр розподілу, який ще називають параметром масштабу. Двох параметрична функція розподілу Релея має такий вигляд

 

 

0 2

 

 

0,

0 .

F t; 1 exp

 

2

,

 

 

 

2

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Розподіл Релея має додатну асиметрію, а його єдина мода знаходиться в

61

точці t . Усі його моменти є додатними. Основними параметрами є такі: Математичне сподівання

 

 

 

 

 

 

 

 

E X

 

 

1.253 .

2

Дисперсія

 

 

 

 

 

 

 

 

2

 

2

0.429 2 .

D T

 

 

 

 

 

2

 

 

Коефіцієнт варіації

 

 

 

 

 

 

 

 

 

4

 

 

0.5

1.913 .

 

 

 

 

 

 

 

 

 

4

 

 

Коефіцієнт асиметрії

As 2 3 0.631.

4 3

Коефіцієнт ексцесу

Es 24 16 2 16 0.2455 – 7

4 2

Мода

Mo

Медіана

Me 2 ln 2 0.5 1.177

В теорії надійності його використовують для опису поведінки зношення вузлів, деталей. З ергономічної точки зору, в сенсі надійності оператора, його можна використати для опису значень часу розпізнавання послідовності зображень людиною-оператором протягом тривалого часу T , коли суттєво проявляється стан втоми та пов’язаного з ним зростання нервової напруженості. Тоді ймовірність розпізнавання всіх зображень послідовності визначається як

62

 

 

 

 

T

2

 

 

 

P t exp

 

 

 

 

 

,

 

 

 

2

 

 

 

2

 

 

 

 

 

 

 

 

інтенсивність не розпізнання зображень

 

 

 

 

 

 

 

 

t

 

T

,

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

а середній час до першого нерозпізнаного зображення

 

 

 

 

 

t

.

2

Очевидно що такі оцінки можуть бути визначені на підставі моделі операторської діяльності, побудованої за результатами експериментальних досліджень.

Дані розподіли хоча близькі за зовнішнім виглядом є виведені для різних випадкових величин, тобто мають тісний зв’язок з явищами які вони описують.

В даній лабораторній роботі вони використовуються для моделювання інших за змістом даних, проте можна розглядати час розпізнавання зображення об’єкта заданого класу як час його життя з моменту появи його на екрані до моменту розпізнавання оператором. В такому поданні, час розпізнавання вже можна трактувати з точки зору надійності і застосовувати приведені закони розподілу

Хід роботи.

Побудова гістограми і кумуляти

1.Відкрити нову книгу Ексель і внести вказані дані на перший аркуш.

2.Визначити розмах даних R xmax xmin та знайти кількість інтервалів

групування за однією з таких формул

k 3.322 lg n 1;

k 1.15 0.42 n 1 2 0.27 ; k 5 lg n ;

k n ;

k 1.9 n0.4

63

3. Через один стовпчик справа від стовпчика даних будуємо значення стовпчика інтервалів (кишень). Для цього в першу комірку цього стовпчика вносимо нуль, в другу (під першою) записуємо значення величини інтервалу

 

R

. Виділивши першу і другу комірки, методом автозаповнення

k

 

 

заповнюємо значеннями нижче розташовані комірки, поки значення останньої перевищить величину xmax .

4. Активізуємо надбудову Ексель Аналіз даних і відкриваємо опцію «Гістограма». Далі, заповнюємо вікно «Вхідний інтервал», заповнюємо вікно «Інтервал кишень», вказуємо місце виведення значень гістограми «Вихідний інтервал», ставимо галочки навпроти опцій «Інтегральний процент» та «Вивід графіка». Натискаємо «ОК» і отримуємо результат, зображений таблицею на рис.1а. Перший стовпчик таблиці є стовпчиком границь інтервалів, другий – це кількості рівнів, значення яких відносяться до даного інтервалу. Третій стовпчик переводимо в числовий формат, в результаті чого його значення будуть числами від 0 до 1. Останню стрічку можна відкинути.

Знаходження параметрів розподілів.

Для знаходження параметрів a – форми та b – масштабу використовуємо

дані полігону частот і кумуляти.

 

 

 

 

 

 

 

 

 

 

 

 

 

Bin

Frequency

Cumulative

 

 

 

Гістограма даних

 

 

 

 

%

 

50

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

1

0,68%

 

45

 

 

 

 

 

 

 

 

 

 

 

0,090909

2

2,05%

інтервалів

40

 

 

 

 

 

 

 

 

 

 

 

0,272727

43

47,95%

30

 

 

 

 

 

 

 

 

 

 

 

0,181818

24

18,49%

 

35

 

 

 

 

 

 

 

 

 

 

 

0,363636

35

71,92%

рівнів

25

 

 

 

 

 

 

 

 

 

 

 

0,454545

20

85,62%

 

 

 

 

 

 

 

 

 

 

 

20

 

 

 

 

 

 

 

 

 

 

 

0,545455

15

95,89%

кількість

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,636364

4

98,63%

15

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,727273

0

98,63%

 

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,818182

1

99,32%

 

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,909091

0

99,32%

 

0

 

 

 

 

 

 

 

 

 

 

 

1

1

100,00%

 

1

2

3

4

5

6

7

8

9

10

11

12

 

 

 

 

 

Інтервали

 

 

 

 

 

More

0

100,00%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

а

 

 

 

 

 

 

 

б

 

 

 

 

 

 

 

 

 

64

 

 

 

 

 

 

 

 

 

 

 

 

Кількість рівнів в інтервалі

 

 

Полігон частот

 

 

 

 

 

 

50

 

 

 

 

 

 

 

 

 

 

 

1,2

45

 

 

 

 

 

 

 

 

 

 

 

 

40

 

 

 

 

 

 

 

 

 

 

 

1,0

 

 

 

 

 

 

 

 

 

 

ймовірність-

 

35

 

 

 

 

 

 

 

 

 

 

0,8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

30

 

 

 

 

 

 

 

 

 

 

 

 

25

 

 

 

 

 

 

 

 

 

 

 

0,6

20

 

 

 

 

 

 

 

 

 

 

Частота

 

15

 

 

 

 

 

 

 

 

 

 

0,4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

 

 

 

 

0,2

 

 

 

 

 

 

 

 

 

 

 

 

5

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

0,0

1

2

3

4

5

6

7

8

9

10

11

12

 

 

 

 

Інтервали групування

 

 

 

 

 

Кумулята даних

 

 

 

 

 

1

2

3

4

5

6

7

8

9

10

11

12

 

 

 

Інтервали групування

 

 

 

в

г

Рис. 1. Результати опції «Гістограма»: а – таблиця даних полігону частот і кумуляти, б – гістограма даних, в – полігон частот, г – кумулята.

І. Знаходження параметрів розподілу за полігоном частот.

1.Скопіюємо стовпчик полігону частот на новий аркуш.

2.В сусідню з першою коміркою справа введемо формулу (3), попередньо визначивши такі дані, для цієї формули:

 

 

f t

a t t

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b

 

 

 

 

b

 

t0 xmin ,

a 1.5 ,

b x .

 

 

 

 

a 1

 

 

t t

 

a

 

 

 

 

 

0

 

 

 

exp

 

 

b

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3. Присвоїмо цим значенням відповідні імена. Для цього, побудуємо стовпчик параметрів t0 , a , b . Навпроти кожного з цих параметрів введемо їх числові значення. Далі, активізуємо комірку зі значенням параметра t0 . На панелі інструментів клацаємо мишкою на «Вставка» «Ім’я» «Присвоїти». В результаті значенню параметра t0 буде присвоєно його ім’я t0 . Аналогічно поступаємо з параметрами a і b .

ВЕксель дана формула має такий вигляд:

a / b t t0 / b ^ a 1 exp t t0 / b ^ a .

65

Значеннями для t виступають значення стовпчика полігону частот. Здійснюємо автозаповнення і отримуємо стовпчик значень, обчислених за даною формулою і конкретними значеннями вказаних параметрів.

4.Подаємо графіки значень обох стовпчиків в одній координатній площині. Як правило, обидва графіки і положенням і формою різняться між собою, тобто модель (графік функції) не відповідає своєму оригіналу (графіку полігону).

5.Для наближення моделі до оригіналу необхідно мінімізувати суму квадратів відхилень Skv , яку визначають за допомогою формули

n

=СУММКВРАЗН = xоригінал x модель 2 , i 1

визначивши для неї місце в комірці під стовпчиком числових значень імен.

6. Використовуючи надбудову «Пошук рішення», вид якої зображено на рис. 2 встановлюємо цільову комірку – комірку зі значенням Skv , далі рівною мінімальному значенню. «Змінюючи комірки» зі значеннями параметрів, виділяємо діапазон цих значень і клацаємо команду «Виконати».

Врезультаті виконання цієї команди зміняться значення параметрів моделі, зміниться значення суми квадратів відхилень в комірці Skv , а графік моделі наблизиться до графіка полігону частот.

Впереважаючій більшості випадків модель відповідатиме своєму оригіналу, а її параметри можна вважати такими, що адекватно описують розподіл рівнів даного часового ряду.

Рис. 2. Вікна надбудови «Пошук рішення»

66

ІІ. Знаходження параметрів розподілу за кумулятою.

В цьому випадку оригіналом є графік кумуляти – функції закону розподілу

 

t t

0

a

 

F t 1 exp

 

 

,

(1)

 

 

 

 

b

 

 

 

 

 

 

 

 

 

 

 

який записується в Екселі таким способом « 1 exp t t0 / b ^ a ». Параметрам t0 , a , b присвоюються ті ж самі значення або значення

визначені за полігоном частот. Далі процедура аналогічна.

Зауваження. Для усунення конфліктів у формулах треба змінити імена параметрів, tt0 , aa , bb або інші і тоді можна провести процедуру на тому самому аркуші. Варта так само змінити назви для Skv .

Якщо в обох випадках параметри розподілу a і b не значно відрізняються між собою робота виконана правильно.

Аналогічною є процедура для знаходження параметрів Релея.

Форма звітності.

НАЗВА МЕТА РОБОТИ

І. Знаходження параметрів розподілу Вейбула ІІ. Знаходження параметрів розподілу Релея

Графік часового ряду

Графік кумуляти і моделі для

 

Графік кумуляти і моделі для

розподілу Вейбула

 

розподілу Релея

 

 

 

Параметри розподілу Вейбула і сума

 

Параметри розподілу Релея і сума

квадратів відхилень

 

квадратів відхилень

 

 

 

 

67

Дати короткі коментарі до кожного графіка. Висновок.

ЛАБОРАТОРНА РОБОТА № 7

КОРЕЛЯЦІЙНИЙ АНАЛІЗ ЧАСОВИХ ПОСЛІДОВНОСТЕЙ

ВСТУП

У практичній діяльності системного аналітика часто зустрічаються ситуації, в яких оцінку однієї з властивостей об'єкта необхідно здійснювати з врахуванням оцінки іншої властивості. У цьому випадку виникає необхідність визначення взаємного впливу властивостей. Закономірності такого впливу досить складно описати математичними моделями. У подібних ситуаціях використовують кореляційну оцінку показників, встановлюючи елемент якісної, експертної оцінки впливу одного показника на інший. Метою дослідника при вирішенні зазначеної задачі є не тільки знаходження кореляційної залежності між двома властивостями об'єкта, а й отримання якісної (експертної) оцінки впливу однієї властивості на іншу.

Під кореляційним аналізом розуміють групу методів, що дозволяють виявляти наявність і ступінь взаємозв'язку між кількома параметрами, що змінюються випадковим чином. Міра такого взаємозв'язку оцінюється спеціальними числовими характеристиками, а також їх статистиками, що визначають ступінь близькості цього взаємозв'язку до функціонального, який може існувати між параметрами, що володіють детермінованим характером зміни.

Кореляційний зв'язок з'являється, коли одному і тому ж значенню аргументу (незалежної змінної) відповідає низка значень функції (залежної змінної). Тоді зв'язок виявляється у вигляді тенденції зміни середніх значень функції залежно від змін аргументу. Цим кореляційний зв'язок відрізняється від функціонального, який виникає у разі, коли заданому значенню аргументу відповідає цілком певне значення функції. По суті кореляційний зв'язок є неповним, оскільки залежність між функцією і аргументом в кожному конкретному випадку схильна до впливу з боку інших чинників (які найчастіше мають мінливий характер).

Найбільш повно в статистиці розроблена методологія парної кореляції, що

68

розглядає вплив варіації однієї факторної ознаки на результатну.

Дослідження парної кореляції здійснюється на основі кореляційного аналізу, передбачає послідовне вирішення низки завдань:

 

виявлення зв'язку;

 

опис зв'язку в табличній і графічній формах;

 

вимірювання тісноти зв'язку;

 

формулювання висновків про характер існуючого зв'язку.

Основні

завдання кореляційного аналізу – це визначення і вираження

форми аналітичної залежності результативної ознаки y від факторних ознак xi . Відмінною рисою кореляційного аналізу є вимірювання тісноти зв'язку між y і x . Його основними числовими характеристиками є коефіцієнт

кореляції і кореляційне відношення.

Виділяють такі етапи кореляційного аналізу:

виявлення взаємозв'язку між ознаками;

визначення форми зв'язку;

визначення сили ( тісноти ) і напрямку зв'язку .

Інтерпретуючи результати кореляційного аналізу потрібно мати на увазі, що коефіцієнт кореляції є статистичним показником, який не вказує на те, що досліджувані величини знаходяться в причинно-наслідковому зв'язку. Тому будь-яке трактування кореляційної залежності повинне ґрунтуватися на інформації про суть і характер досліджуваних експериментальних даних та процесів, яким вони відповідають.

До переваг кореляційного аналізу можна віднести можливість створення нового правила взаємодії функцій одна з одною, а також оцінку взаємодії функцій отриманих невідомим шляхом.

Недоліками є те, що всі результати, отримані за допомогою цієї методики можна використовувати лише в області даного дослідження або близько до нього. Після виявлення стохастичних зв'язків між досліджуваними змінними величинами дослідник приступає до математичного опису виявленої ним і цікавої для нього залежності.

Мета і завдання лабораторної роботи

Метою роботи є ознайомлення з методами кореляційного аналізу експериментальних даних, поданих часовими послідовностями або послідовностями випадкових чисел (вибірками).

Для цього потрібно:

- побудувати кореляційне поле;

69

-визначити значення коефіцієнта кореляції;

-перевірити гіпотези щодо значущості коефіцієнта кореляції;

-побудувати кореляційну матрицю.

І. Теоретичні відомості

Кореляційне поле. У своїй практиці дослідник часто виявляє існування певних залежностей між отриманими експериментальними даними та впливаючими на результат чинниками. Переважно, вже на підставі візуального аналізу поля кореляції можна висунути гіпотезу щодо існуючого зв'язку між усіма можливими значеннями X і Y: лінійний або нелінійний, сильний, слабкий або відсутній. Переважно такий зв'язок є випадковим.

Графічне подання взаємозв’язку між двома досліджуваними послідовностями називається кореляційним полем або полем кореляції або діаграмою розсіювання. Графічний метод забезпечує наочне зображення форми зв'язку між цими послідовностями. Для цього, в прямокутній системі координат будують графік – по осі ординат відкладають індивідуальні значення однієї послідовності, вибраної в якості результативної ознаки Y , а по осі абсцис - індивідуальні значення іншої – факторної ознаки X . Власне сукупність точок результативної і факторної ознак, як зображено на рис. 7.1

називається полем кореляції.

а б

Рис. 7.1. Візуальна оцінка характеру зв’язку: а – вказує на його відсутність, б – на нелінійність.

70

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]