Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Data Storage Lab Task.doc
Скачиваний:
24
Добавлен:
10.02.2016
Размер:
707.07 Кб
Скачать

Лабораторна робота №2-3 Створення простих багатомірних olap кубів

Мета роботи: одержання навичок у створенні простих багатомірних OLAP кубів, з використанням програмного продукту icCube.

Теоретичні основи

Коли говориться про багатомірну організацію даних, не мається на увазі те, що дані представляються кінцевому користувачеві у вигляді чотирьох або п’ятивимірних гіперкубів. Коли говориться про багатомірність, мається на увазі не багатомірність візуалізації, а багатомірне подання при описі структур даних і підтримка багатомірності в мовах маніпулювання даними.

Основними поняттями багатомірної моделі даних є: вимір (Dіmensіon) і показник (Measure).

Вимір - це множина однотипних даних, утворюючих одну із граней гіперкуба. Наприклад - Дні, Місяці, Квартали, Роки. Прикладами географічних вимірів є: Міста, Райони, Регіони, Країни й т.д. У багатомірній моделі дані виміри відіграють роль індексів, використовуваних для ідентифікації конкретних значень (показників), що перебувають в осередках гіперкуба.

Показник - це поле (звичайно цифрове), значення якого однозначно визначаються фіксованим набором вимірів.

OLAP-сервери можуть зберігати багатомірні дані по-різному. У будь-якому сховищі даних - і у звичайному, і в багатомірному - поряд з детальними даними, що витягають із оперативних систем, зберігаються й сумарні показники (агреговані показники, агрегати), такі, як суми обсягів продажів по місяцях, по категоріях товарів і т.п. Агрегати зберігаються в явному виді з єдиною метою - прискорити виконання запитів. Адже, з одного боку, у сховищі накопичується, як правило, дуже великий обсяг даних, а з іншого боку - аналітиків у більшості випадків цікавлять не детальні, а узагальнені показники. І якщо щораз для обчислення суми продажів за рік довелося б підсумувати мільйони індивідуальних продажів, швидкість, швидше за все, була б неприйнятною.

Але прискорення обробки запитів відбувається за рахунок збільшення як обсягів даних, так і часу на їхнє завантаження. Причому збільшення обсягу може стати "вибухообразним". Ступінь "розбухання" даних при обчисленні агрегатів залежить від кількості вимірів куба й структури цих вимірів, тобто співвідношення кількості "батьків" й "дітей" на різних рівнях виміру.

Як детальні дані, так й агрегати можуть зберігатися або в реляційних, або в багатомірних структурах. Багатомірне зберігання дозволяє звертатися з даними як з багатомірним масивом, завдяки чому забезпечуються однаково швидкі обчислення сумарних показників і різні багатомірні перетворення по кожному з вимірів.

Операції маніпулювання вимірами

Формування зрізу. Користувача рідко цікавлять все потенційно можливі комбінації значень вимірів. Підмножина гіперкуба, яка вийшла в результаті фіксації значення одного або більше вимірів, називається зрізом (Slіce).

Операція обертання. Зміна порядку подання (візуалізації) вимірів (звичайно застосовується при двомірному поданні даних) називається Обертанням (Rotate). Ця операція забезпечує можливість візуалізації даних у формі, найбільш комфортної для їхнього сприйняття.

Відносини й ієрархічні відносини. В кубі може бути багато вимірів й між їхніми значеннями звичайно існує множина різних відносин (Relatіon) типу "один до багатьох". Для вимірів, що мають тип Час (таких як День, Місяць, Квартал, Рік), всі відносини встановлюються автоматично, і їх не потрібно описувати. У свою чергу, мноєина відносин може мати ієрархічну структуру - ієрархічні відносини (Hіerarchіcal Relatіonshіps).

Операція агрегації. У процесі аналізу користувач не тільки працює з різними зрізами даних і виконує їхнє обертання, але й переходить від деталізованих даних до агрегованих, тобто робить операцію агрегації (Drіll Up).

Операція деталізації. Перехід від більше агрегованих до більше деталізованих даних називається операцією деталізації (Drіll Down).

Хід роботи:

У даній лабораторній роботі необхідно на підставі існуючої реляційної БД (FoodMart.mdb) побудувати OLAP куб для аналізу показників продажів різних продуктів, у різних країнах і за різні проміжки часу. Як показники беруться значення із БД - Store Cost, Store Sales, Unіt Sales.

Як виміри і їхні ієрархії використаються:

  • Product – категорія продукту, підкатегорія продукту й назва торговельної марки;

  • Region – країна, регіон, провінція, район, місто;

  • Time – рік, квартал, місяць, день.

Дана лабораторна робота містить у собі:

  • підготовку програми для моделювання куба;

  • створення вимірів куба;

  • створення основної моделі куба.

Необхідно виконати наступні дії.

1. Підключення до джерела даних.

2. Вибір таблиці фактів і мер для куба.

3. Створення вимірів.

4. Завантаження даних.

Для роботи з icCube потрібно завантажити інсталяційний пакет з сайту http://www.iccube.com та встановити програму.

Для подальшої роботи необхідно запустити icCube Server через головне меню та клієнтську программу (через головне меню або вказавши адресу http://localhost:8282/icCube/icCube.html в браузері). У вікні для вводу імені та паролю (рис. 1) залишити поля пустими та нажати кнопку Login.

Рис.1.

Відкриється основне вікно для роботи з кубами (рис.2).

Рис.2.

Перейти на вкладку Builder. Натиснути кнопку Create scheme (рис. 3).

Рис.3.

У відповідних полях вказати ім’я схеми та ім’я групи, до якої буди віднесено схему. За замовчуванням схема включається до групи Default Group. Далі необхідно натиснути кнопку Save (рис. 4).

Рис.4.

Наступним кроком є створення джерела даних за допомогою відповідної кнопки в меню Data Integration/Data Sources (рис. 5).

Рис.5.

У наступному вікні потрібно вибрати пункт Relation Data Base и натисніть кнопку Next. Далі заповнити поля, як показано на рис.6 (ім’я джерела даних може бути будь-яким, путь до бази даних відповідає розташування файлу з даними на вашому комп’ютері).

Рис.6.

Можна перевірити правильність виконаних дій, натиснувши кнопку Test Connection.

Рис.7.

Далі необхідно додати всі існуючи таблиці БД до джерела даних за допомогою кнопки Add Tables (рис. 8).

Рис. 8.

Наступним кроком є створення вимірів. Наприклад, вимір Time з ієрархію Рік-Місяць-Дата можна створити у послідовності, показаної на рис.9-13. Кожний новий рівень створюється за допомогою відповідної кнопки + Levels.

Рис.9.

Рис.10.

Рис.11.

Рис.12.

Рис.13.

Вимір Region створюється аналогічно (рис. 14).

Рис.14.

Далі потрібно створити куб за допомогою кнопки + Cubes та таблицю фактів sales в цьому кубі за допомогою кнопки + Cube (рис. 15).

.

Рис.15.

До кубу потрібно також додати показники storecost, storesales, unitsales (рис.16).

Рис.16.

Далі потрібно завантажити дані в куб за допомогою кнопки Deploy Scheme (рис. 17). У наступному вікні вибрати Deploy & Load (Re-deploy & Re-load).

Рис.17.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]