- •Понятие систем поддержки принятия решений. Knowledge Discovery in Databases и Data Mining.
- •2. Основные задачи, решаемые в Data Mining.
- •3. Требования, предъявляемые к базам данных в сппр.
- •4. Концепция хранилища данных.
- •5. Типы архитектур сппр.
- •6.Многомерная модель данных.
- •7.Понятие olap‑системы
- •8.Способы реализации хранилищ данных. Архитектура molap
- •9.Технологии rolap и holap реализации хранилищ данных.
7.Понятие olap‑системы
OLAP‑система включает в себя 2 осн компонента:
– OLAP‑сервер, обеспечивающий хранение данных и обработку данных в виде концептуальной многомерной модели.
– OLAP-клиент, представляющий пользователю интерфейс к многомерной модели данных.
OLAP-серверы скрывают от конечного пользователя способ реализации многомерной модели. Они формируют гиперкуб, с которым пользователи посредством OLAP-клиента выполняют все необходимые манипуляции, анализируя данные.
Выделяют 3 осн способа реализации многомерной модели данных:
– MOLAP (Multidimensional OLAP) – для реализации многомерной модели используют многомерные БД;
– ROLAP (Relational OLAP) – для реализации многомерной модели используют специальную организацию реляционных БД;
– HOLAP (Hybrid OLAP) – для реализации многомерной модели используют сочетание многомерных и реляционных БД.
MOLAP‑серверы используют для хранения и управления данными многомерные БД. При этом данные хранятся в виде упорядоченных многомерных массивов. Индексами таких массивов являются измерения. Многомерные массивы подразделяются на гиперкубы и поликубы. В гиперкубе все хранимые в БД ячейки имеют полный набор измерений. В поликубе каждая ячейка хранится с собственным набором измерений, и все связанные с этим сложности обработки перекладываются на внутренние механизмы системы.
Физически данные, представленные в многомерном виде, хранятся в "плоских" файлах. При этом куб представляется в виде одной плоской таблицы, в которую построчно вписываются все комбинации членов всех измерений с соответствующими им значениями мер.
В технологии ROLAP гиперкуб эмулируется на логическом уровне средствами реляционной базы данных. При эмуляции чаще всего используется так называемая радиальная схема, или схема "звезда". В этой схеме используются два вида таблиц: таблица фактов и таблицы измерений. Запись таблицы факта соответствует ячейке гиперкуба. В таблицах измерений приводятся значения каждого измерения.
В сложных задачах с многоуровневой иерархией измерений используется схема "снежинка". В этих случаях производится нормализация таблиц измерений, что отражает иерархию измерений. Это схема позволяет добиться лучшей производительности, но часто приводит к избыточности данных и к значительным усложнениям в структуре базы данных, в которой оказывается огромное количество таблиц измерений.
Гибридная архитектура HOLAP объединяет технологии ROLAP и MOLAP. В отличие от MOLAP, которая работает лучше, когда данные плотные, серверы ROLAP лучше в тех случаях, когда данные довольно разрежены. Серверы HOLAP применяют подход ROLAP для хранения разреженных детализированных данных и подход MOLAP для хранения плотных агрегированных данных. Например, в крупном супермаркете детальные данные по покупкам по каждому чеку можно хранить в реляционной структуре, а обобщенные данные, например, по группам товаров, отделам, интервалам дат целесообразно хранить в многомерной структуре. Логически HOLAP является самым гибким подходом. Реализация HOLAP объединяет достоинства и недостатки MOLAP и ROLAP, но сложна в администрировании.