Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ISTE.doc
Скачиваний:
617
Добавлен:
08.02.2016
Размер:
3.81 Mб
Скачать

3.5.2. Технологія аналізу olap

Після того як дані отримані, очищені, приведені до єдиного вигляду та вміщені в сховище даних, їх необхідно аналізувати. Для цього використовується технологія OLAP [Error: Reference source not found]. Дванадцять основних принципів OLAP були сформульовані в 1993 році Є.Ф.Коддом – розробником теорії реляційних баз даних. Терміном OLAP (OnLine Analytical Processing) позначається процес оперативного аналізу даних. Пізніше визначення Кодда було перероблено в так званий тест FASMI (Fast Analysis of Shared Multidimensional Information – швидкий аналіз розділяємої (доступної багатьом користувачам) багатомірної інформації), який вимагає, щоб OLAP-засіб надавав наступні можливості швидкого аналізу розділяємої багатомірної інформації:

  • Висока швидкість. Аналіз повинен проводитись однаково швидко за усіма аспектами інформації. При цьому допустимий час відгуку повинен складати не більше 5 секунд.

  • Аналіз. Повинна існувати можливість проводити основні типи числового та статистичного аналізу – заданого розробником програми чи довільно заданого користувачем.

  • Розділення доступу. Доступ до даних повинен бути багатокористувацьким. При цьому повинен контролюватися доступ до конфіденційної інформації.

  • Багатомірність. Це основна і найважливіша характеристика OLAP.

  • Робота з інформацією. Програма повинна забезпечувати можливість звертання до довільної потрібної інформації незалежно від її об’єму та місця зберігання.

OLAP надає організаціям максимально зручні і швидкі засоби доступу, перегляду та аналізу ділової інформації. OLAP забезпечує користувача природною та інтуїтивно зрозумілою моделлю даних, організовуючи їх у виді багатомірних кубів (cubes). Осями (dimensions) багатомірної системи координат служать основні атрибути бізнес-процесу, що піддається аналізу. Наприклад, для процесу продаж це може бути категорія товару, регіон, тип покупця. Практично завжди в якості одного з вимірів використовується час. Всередині кубу знаходяться дані, що якісно характеризують процес, – так звані міри (measures). Це може бути об’єм продаж в штуках чи в грошовому вираженні, залишки на складі, видатки тощо. Користувач, який аналізує інформацію, може „нарізати“ куб по різних напрямках, отримати зведені (наприклад по рокам) чи, навпаки, детальні (по тижням) дані та виконати інші операції, необхідні для аналізу даних.

В першу чергу слід відмітити той факт, що, оскільки аналітик завжди оперує деякими підсумковими, а не детальними даними, в базах даних OLAP практично завжди зберігаються поряд з детальними даними і так звані агрегати – обчислені заздалегідь підсумкові показники. Прикладами агрегатів можуть служити сумарний об’єм продаж за рік чи середній залишок товару на складі. Зберігання попередньо розрахованих агрегатів є основним способом підвищення швидкості виконання OLAP-запитів. Зрозуміло, що створення агрегатів може привести до значного збільшення об’єму даних. Іншою проблемою зберігання OLAP-даних є розрідженість багатомірних даних. Наприклад, якщо в 2008 році продаж в деякому регіоні не було, то на перетині відповідних вимірів кубу не буде ніякого значення. Якщо OLAP-сервер буде при цьому зберігати деяке значення, наприклад число 0, то при значній розрідженості даних кількість пустих клітинок, для зберігання яких використовується пам’ять, може в багато разів перевищувати кількість заповнених, в результаті чого загальний об’єм буде невиправдано зростати. Різні типи OLAP вирішують ці та інші проблеми різними способами.

Для зберігання даних використовуються такі різновиди OLAP [Error: Reference source not found]:

  • Спеціальні багатомірні СУБД (OLAP-сервери). Їх іще називають MOLAP (Multidimensional OLAP). При виконанні складних запитів, що аналізують дані в різних вимірах, багатомірні СУБД забезпечують більшу продуктивність порівняно з реляційними. При цьому швидкість виконання запиту не залежить від того, по якому виміру здійснюється „зріз“ багатомірного куба.

  • Традиційні реляційні СУБД – ROLAP (Relational OLAP). Використання спеціальних структур даних – схеми „зірки“ та „сніжинки“, а також зберігання обчислених агрегатів роблять можливим аналіз реляційних даних. Реляційні СУБД історично більш звичні, і в них зроблені значні інвестиції. З цієї причини ROLAP зараз більш поширені.

  • Комбінований варіант – HOLAP (Hybrid OLAP), які суміщають два розглянуті види СУБД. Одним із варіантів суміщення двох типів СУБД є зберігання даних в багатомірній СУБД, а детальних даних (які мають найбільший об’єм) – в реляційній.