Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
BD-КН1.doc
Скачиваний:
18
Добавлен:
27.04.2019
Размер:
7.07 Mб
Скачать

5. Засоби інтелектуального аналізу даних

На сьогоднішній день існує клас інформаційних систем (DSS-системи – системи підтримки прийняття рішень) орієнтованих на аналіз даних, виконання складних запитів, моделювання процесів, прогнозування, знаходження залежностей між даними.

Останнім часом в напрямку розвитку DSS-систем сформувався ряд нових концепцій:

  • концепція сховища даних (Data Warehouse);

  • інтелектуальний аналіз даних - (Data Mining);

  • оперативна аналітична обробка OLAP (On-Line Analytical Processing);

Концепція сховища даних визначає процес збору, фільтрації, попередньої обробки й нагромадження даних з метою довгострокового зберігання даних, надання результуючої інформації користувачам у зручній формі для статистичного аналізу й створення аналітичних звітів.

Найчастіше використаються два типи схеми сховища даних:

  • Зірка

  • Сніжинка

Схема “зірка” складається з однієї денормалізованої таблиці фактів, декількох десятків досить невеликих довідкових таблиць (вимірів). Таблиці вимірів пов’язані з таблицею фактів за ключовими полями. Таблиця фактів є дочірньою відносно таблиць вимірів. Полями таблиці фактів, крім ключів, є міри, тобто числові поля, що задають кількісні значення. Кількість рядків у цій таблиці може становити десятки й сотні тисяч тому слід передбачати запобіжні заходи від вибуху даних.

Схема “сніжинки” є модифікацією схеми “зірки”, деякою поступкою нормалізації – тут частина таблиць вимірів розбита на кілька зв'язних таблиць. Завдяки частковій нормалізації, “сніжинка” дозволяє заощадити дисковий простір, але зменшується швидкість перегляду вимірів.

Концепція інтелектуального аналізу даних визначає завдання пошуку функціональних і логічних закономірностей у накопиченій інформації, побудова моделей і правил, які пояснюють знайдені аномалії, прогнозують розвиток певних процесів.

Концепція OLAP – концепція комплексного багатовимірного аналізу даних, накопичених у сховищі даних або в традиційній базі даних.

Сучасні засоби OLAP-аналізу (On-Line Analytical Processing, тобто аналіз в реальному масштабі часу) надають можливість швидкого аналізу розділяємої багатовимірної інформації. Гіперкуб є концептуальною логічною моделлю організації даних, але не фізичною реалізацією їх зберігання, оскільки зберігатися такі дані можуть і в реляційних таблицях. Дані, представлені у вигляді багатовимірних кубів дозволяють будувати звіти у необхідних керівнику інформаційних зрізах та ракурсах без звернення до програмістів та отримання спеціальних знань. Куби, які наповнені інформацією про господарчу діяльність підприємства, надають можливість графічного представлення даних та показників в будь-яких необхідних для аналізу комбінаціях, що можуть змінюватись за потребою для більш ґрунтовного та оперативного прийняття стратегічних та управлінських рішень. Орієнтована на користувача модель даних являє собою множину багатовимірних кубів, вісями координат якої є основні атрибути бізнес-процесу, що аналізується.

Розглянемо приклад використання бази даних підприємства для аналізу його діяльності з метою забезпечення підтримки прийняття рішень на майбутні періоди. Відповіді на багато питань можна знайти в базі даних підприємства, яка зберігає дані по місяцях та кварталах за попередні періоди (рік як мінімум). Тобто, звичайна база підприємства, що зберігає дані обліку діяльності підприємства є темпоральною, а дані, що знаходяться в ній, з певним припущенням, можна вважати часовими рядами.

Спроектуємо OLAP-куби для перевірки ряду гіпотез щодо планування діяльності підприємства на майбутні періоди на основі наявних даних, збережуваних у базі даних підприємства:

  • асортимент продукції та окремі типи продукції можна відкоригувати з урахуванням невиконаних заявок замовників;

  • можна забезпечити визначення найбільш перспективних замовників на основі замовлень за попередні періоди ;

  • можна спрогнозувати попит на продукцію в населених пунктах на основі невиконаних заявок.

Ефективне планування асортименту продукції дозволяє збільшити прибуток та приплив грошових коштів без додаткових інвестицій. Для визначення оптимального асортименту, звичайно, необхідно врахувати багато факторів, таких як попит на ринках збуту, потужність підприємства, дії конкурентів тощо. Тому при прогнозуванні попиту доцільно окрім вивчення ринків збуту використати наявну в базі даних підприємства інформацію про продукцію, яка була замовлена, але не виготовлена.

Представлена на рис. 2.1. модель OLAP-куба складається з таблиці фактів "Заявка", таблиць вимірів "Продукція" та "Тип продукції"; вісями вимірів OLAP-куба є час, назва продукції, назва типу продукції, міри куба – кількість та вартість замовленої продукції .

Спроектований таким чином OLAP-куб надасть керівникові інформацію в узагальненому вигляді про кількість та вартість замовлень кожного виду продукції, для аналізу асортименту продукції, що користувалася найбільшим попитом, та задоволення підприємством цього попиту.

Рис. 2.1. Модель OLAP-куба для аналізу асортименту продукції

Для визначення замовників, які на протязі певного періоду заказали найбільшу у вартісному та кількісному вимірах обсяги продукції на рис 2.2. представлена модель OLAP-куба, де таблицею факту є "Заявка", а таблицями вимірів – таблиця "Замовник" та денормалізована таблиця "Продукція", вісі вимірів даного куба – назва підприємства, назва продукції; міра куба – кількість ; обчислюванні значення – вартість кожного замовлення .

Рис 2.2. Модель OLAP-куба для визначення найбільш перспективних замовників.

На рис. 2.3. представлена модель OLAP-куба, для аналізу попиту на продукцію підприємства в населених пунктах на основі виконаних на невиконаних заявок на продукцію підприємства з метою виявлення найбільш перспективних замовників для покращення співпраці з ними, наявну в базі даних. Таблиця фактів "Заявка" пов’язана з таблицями вимірів "Населений пункт", "Замовник" та "Продукція" за ключовими полями, вісями даного куба є населений пункт та продукція, мірами ‑ кількість та вартість замовленої продукції по кожному населеному пункту .

Рис 2.3. Модель OLAP-куба для аналізу попиту на продукцію в різних населених пунктах

Багато інформаційних систем на ринку України в якості СУБД використовують MS SQL Server, наприклад, 1С "Підприємство".

MS SQL Server має потужний інтерфейс роботи з OLAP-кубами – MS Analysis Services, який в якості OLAP-клієнта може використовувати загальновідомий продукт MS Excel 2000.

Використання OLAP-інструментів надає можливість:

  • зв’язку багатьох факторів, які важливі для прийняття управлінських рішень в комплексну картину, зручну для аналізу;

  • оперативного корегування поточної діяльності підприємства на всіх управлінських рівнях;

  • виявлення ваги та впливу окремих факторів на виробництво продукції;

  • оперативна картина завантаження потужностей підприємства;

  • додаткові фактори при аналізі та плануванні виробництва продукції.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]