Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
baza_danih.doc
Скачиваний:
7
Добавлен:
21.04.2019
Размер:
395.78 Кб
Скачать

50. Сутність медодики вимірного моделювання сховищ даних.

Для визначення даних, які необхідно зберігати в сховищі даних, передусім необхідно провести збір вимог кінце­вих користувачів. Вимоги до сховища даних кінцевих користува­чів можна умовно розбити на дві групи: вимоги, орієнтовані на процес, та інформаційно орієнтовані вимоги.

Вимоги, орієнтовані на процес, пов'язані з процесами обробки даних при виконанні бізнес-аналізу. При вивченні цих вимог з'ясовуються основні види перетворень, групувань та обчислень, які необхідно виконувати з даними при обчисленні агрегованих даних.

Інформаційно орієнтовані вимоги дозволяють визначитись з основними запити та основними бізнес-цілями побудови сховища даних. Аналіз цієї групи вимог дає змогу встановити одну або кіль­ка цілей створення сховища, а також ідентифікувати основні біз-нес-події та показники, які будуть аналізуватися кінцевим корис­тувачем.

Бізнес-запити являють собою інформаційні потре­би кінцевих користувачів в аналітичній інформації. При опиту­ванні користувачів необхідно визначити основні типи запитів. Найпоширенішими є такі:

  • запити перевірки, результат виконання яких підтверджує якусь бізнес-подію. Наприклад, з'ясування факту надходження коштів від певного споживача за певний товар;

  • запити порівняльного аналізу, результат виконання яких по­рівнює дані про якісь факти. Наприклад, порівняння даних про збут певного виду продукції за останній місяць з даними попере­днього місяця;

  • запити тенденції, результати виконання яких аналізують та виявляють тенденції у зміні певних фактів у часі. Наприклад, як змінювався дохід від реалізації певного виду продукції за останні 12 місяців;

  • запити для аналізу відношень, ранжування та кластериза-ції, результати виконання яких дозволяє певним чином класифі­кувати та ранжувати дані про певні бізнес-події. Наприклад, ран­жування кращих споживачів продукції за обсягами продажів протягом останнього року;

  • запити статистичного аналізу дозволяють провести стати­стичний аналіз фактів, що характеризують певні бізнес-події. На­приклад, обчислення середнього (мінімального, максимального) доходу від реалізації продукції по певному регіону.

51. Визначення сховищ та вітрин (кіосків) даних їх призначення та застосування.

Сховище даних — це інтегрований накопичувач даних, які збираються з різних систем та джерел і використовуються для бізнес-аналізу та прийняття обгрунтованих стратегічних рішень.

Сховище даних (Data Warehouse) — це предметно орі­єнтована, інтегрована, прив'язана до часу та незмінна сукупність даних, призначена для підтримки прийняття рішень.

Дані в сховищі даних організовані від­повідно до основних напрямів діяльності підприємства чи фірми (замовники, продажі, склад і т. п.). Це — відмінність сховищ даних від організації оперативної БД, в якій дані організуються відповід­но до процесів (відвантаження товару, виписка рахунків і т. п.). Предметна організація даних не лише спрощує проведення аналізу, але й значно прискорює виконання аналітичних розрахунків. Тоб­то сховища орієнтовані на бізнес-поняття, а не на бізнес-процеси.

Перш ніж завантажити дані до сховища вони перевіряються, певним чином відбираються, приводяться до'одні го єдиного способу кодування, виду та формату і в необхідній мі. агрегуються (тобто обраховуються сумарні показники). З цьои моменту вони представляються користувачеві у вигляді єдиної» інформаційного простору, які набагато простіше аналізувати

Кіоски, або вітрини, даних {data marts) — це певна підмножи-на корпоративних даних, які характеризують конкретний аспект діяльності корпорації, наприклад роботу конкретного підрозділу. Кіоск може вміщувати як агреговані, так і первинні дані певної предметної області. Кіоск може отримувати дані з корпоративно­го сховища даних (залежний кіоск) чи бути незалежним і тоді джерелом поповнення його даними будуть оперативні БД. Розро­бка кіоску даних потребує значно менше часу і в середньому за­ймає приблизно 3—4 місяці.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]