Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
лаб_роб_2.doc
Скачиваний:
9
Добавлен:
18.08.2019
Размер:
103.94 Кб
Скачать

Лабораторна робота № 2 (4 год.)

Тема: Основи інтелектуальних обчислень.

Мета: дати поняття інтелектуальних обчислень, ознайомити з основними методами інтелектуальних обчислень, навчити розв’язувати задачі, використовуючи методи інтелектуальних обчислень мовами процедурного програмування.

Обладнання: ПК, MS Office, Paint, Pascal, Си++.

Теоретичні відомості Види моделей інтелектуальних обчислень

Розглянемо основні види моделей, що використовуються для знаходження нового знання на основі даних інформаційного сховища. Метою інтелектуальних технології є знаходження нового знання, що користувач може надалі застосувати для поліпшення результатів своєї діяльності. Результат моделювання - це виявлені відношення в даних.

Можна виділити принаймні шість методів виявлення й аналізу знань: класифікація, регресія, прогнозування часових послідовностей (рядів), кластеризація, асоціація, послідовність.

Перші три використовуються головним чином для передбачення, у той час як останні зручні для опису існуючих закономірностей в даних.

Класифікація є найбільш розповсюдженою операцією інтелектуального аналізу даних. З її допомогою виявляються ознаки, що характеризують групу, до якої належить той чи інший об'єкт. Це робиться за допомогою аналізу вже класифікованих об'єктів і формулювання деякого набору правил. В багатьох видах бізнесу проблемою є втрата постійних клієнтів. У різних сферах (таких, як мобільний телефонний зв'язок, фармацевтичний бізнес чи діяльність, пов'язана із кредитними картками) її позначають різними термінами - "зміною моди", "виснаженням попиту" чи "купівельною зрадою", - але суть при цьому одна.

Класифікація допоможе вам виявити характеристики "хитливих" покупців і створити модель, здатну передбачати, хто саме схильний піти до іншого постачальника. Використовуючи її, можна визначити самі ефективні види знижок і інших вигідних пропозицій, що будуть найбільш діючими для тих чи інших типів покупців. Завдяки цьому можна втримати клієнтів, витративши рівно стільки грошей, скільки необхідно. Один раз визначений ефективний класифікатор використовується для класифікації нових записів у базі даних у вже існуючі класи й в цьому випадку він здобуває характер прогнозу.

Наприклад, класифікатор, що вміє ідентифікувати ризик віддачі позики, може бути використаний для прийняття рішення, чи великий ризик надання позики визначеному клієнту. Тобто класифікатор використовується для прогнозування ймовірності повернення позики.

Регресійний аналіз використовується в тому випадку, якщо відношення між змінними можуть бути виражені кількісно у виді деякої комбінації цих змінних. Отримана комбінація використовується для передбачення значення, що може приймати цільова (залежна) змінна, яка обчислюється на заданому наборі значень вхідних (незалежних) змінних. У найпростішому випадку для цього використовуються стандартні статистичні методи, такі як лінійна регресія. На жаль, більшість реальних моделей не вкладаються в рамки лінійної регресії. Наприклад, розміри продажів чи фондові ціни дуже складні для передбачення, оскільки можуть залежати від комплексу взаємин множин змінних. Таким чином, необхідні комплексні методи для передбачення майбутніх значень.

Прогнозування часових послідовностей. Основою для всіляких систем прогнозування служить історична інформація, що зберігається в інформаційних сховищах у виді часових рядів. Якщо можна побудувати математичну модель і знайти шаблони, що адекватно відбивають цю динаміку, є імовірність, що з їх допомогою можна передбачати і поведінку системи в майбутньому. Прогнозування часових послідовностей дозволяє на основі аналізу поведінки часових рядів оцінити майбутні значення прогнозованих змінних. Звичайно, ці моделі повинні містити в собі особливі ознаки часу: ієрархія періодів (місяць-квартал-рік), особливі відрізки часу (п'яти- шести чи семиденний робочий тиждень), сезонність, свята й ін.

Кластеризація відрізняється від класифікації тим, що самі групи заздалегідь не задані. За допомогою моделі кластеризації засоби інтелектуальних обчислень самостійно виділяють різні однорідні групи даних.

Асоціація має місце в тому випадку, якщо кілька подій зв'язані між собою і адресована до класу проблем аналізу структури. Класичний приклад аналізу структури покупок відноситься до представлення придбання якої-небудь кількості товарів як одиночної економічної операції (транзакції). Оскільки велика кількість покупок відбувається в супермаркетах, а покупці для зручності використовують кошики, куди і складається весь товар, то найбільш відомим прикладом знаходження асоціацій є аналіз вмісту кошику.

Метою цього підходу є знаходження трендів (однакових ділянок) серед великого числа транзакцій, які можна використовувати для пояснення поведінки покупців. Така інформація може бути використана для регулювання запасів, зміни розміщення товарів на території магазину й прийняття рішення по проведенню рекламної кампанії для збільшення всіх продажів або для просування визначеного виду продукції, хоча цей підхід прийшов винятково з роздрібної торгівлі, він може також добре застосовуватися у фінансовій сфері для аналізу портфеля цінних паперів і знаходження наборів фінансових послуг, які клієнти часто придбають разом. Це може використовуватися для створення деякого набору послуг, як частини кампанії по стимулюванню продажів. Наприклад, дослідження, проведене в супермаркеті, може показати, що 65% купуючих картопляні чіпси, беруть також і "кока-колу", а при наявності знижки за такий комплект "колу" здобувають у 85% випадків. Маючи такі дані, менеджерам легко оцінити, наскільки діюча надана знижка.

Послідовність має місце, коли існує ланцюжок зв'язаних у часі подій. Традиційний аналіз структури покупок має справу з набором товарів, що представляють одну транзакцію. Варіант такого аналізу зустрічається, коли існує додаткова інформація (номер кредитної карти клієнта чи номер його банківського рахунка) для зв'язування різних покупок у єдину часову серію. В такій ситуації важливо не тільки співіснування даних всередині однієї транзакції, але і порядок, у якому ці дані з'являються в різних транзакціях і час між цими транзакціями. Правила, що встановлюють ці відношення, можуть бути використані для визначення типового набору попередніх продажів, що можуть повести за собою наступні продажі визначеного товару. Після покупки будинку в 45% випадків протягом місяця купується і нова кухонна плита, а в межах двох тижнів 60% новоселів обзаводяться холодильником.

Ці основні типи моделей використовуються для знаходження нового знання в сховищах даних.

Звернемося тепер до методів (алгоритмів), що використовуються для проведення інтелектуальних обчислень.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]