Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
shpory1-9.doc
Скачиваний:
5
Добавлен:
23.09.2019
Размер:
110.59 Кб
Скачать

8.Способы реализации хранилищ данных. Архитектура molap

MOLAP (Multidimensional OLAP) – для реализации многомерной модели используют многомерные БД;

MOLAP‑серверы используют для хранения и управления данными многомерные БД. При этом данные хранятся в виде упорядоченных многомерных массивов. Индексами таких массивов являются измерения. Многомерные массивы подразделяются на гиперкубы и поликубы. В гиперкубе все хранимые в БД ячейки имеют полный набор измерений. В поликубе каждая ячейка хранится с собственным набором измерений, и все связанные с этим сложности обработки перекладываются на внутренние механизмы системы.

Физически данные, представленные в многомерном виде, хранятся в "плоских" файлах. При этом куб представляется в виде одной плоской таблицы, в которую построчно вписываются все комбинации членов всех измерений с соответствующими им значениями мер.

"+" многомерных БД: высокая скорость поиска и выборки данных, т. к. многомерная база данных денормализована, содержит заранее агрегированные показатели и обеспечивает доступ к запрашиваемым ячейкам без дополнительных преобразований при переходе от множества связанных таблиц к многомерной модели.

В подавляющем большинстве случаев информационный гиперкуб является сильно разреженным. Серьезным недостатком многомерных баз данных является низкий коэффициент использования памяти при хранении разреженных данных. Это объясняется тем, что требуется заранее резервировать место для всех значений, даже если многие из значений будут отсутствовать. Кроме того, структуру многомерной базы очень сложно модифицировать. Например, добавление нового измерения требует полной перестройки гиперкуба.

Использование MOLAP является эффективным, если объем исходных данных для анализа не слишком велик, набор информационных измерений стабилен и время ответа системы на нерегламентированные запросы является наиболее критичным параметром.

9.Технологии rolap и holap реализации хранилищ данных.

ROLAP (Relational OLAP) – для реализации многомерной модели используют специальную организацию реляционных БД;

HOLAP (Hybrid OLAP) – для реализации многомерной модели используют сочетание многомерных и реляционных БД.

В технологии ROLAP гиперкуб эмулируется на логическом уровне средствами реляционной базы данных. При эмуляции чаще всего используется так называемая радиальная схема, или схема "звезда". В этой схеме используются два вида таблиц: таблица фактов и таблицы измерений.

Запись таблицы факта соответствует ячейке гиперкуба. В таблицах измерений приводятся значения каждого измерения.

Таблица факта является центральной таблицей в схеме "звезда". Размер таблицы может быть очень большим. Таблица факта соединяет данные, которые хранились бы во многих таблицах нормализованной реляционной базы данных.

Таблицы измерений содержат неизменяемые или редко изменяемые данные. Если измерение содержит иерархию, то таблица измерений может содержать поля, указывающие на "родителя" в этой иерархии. Таблицы измерений и таблица факта связаны идентифицирующими связями "один ко многим" (в нотации IDEF1X). Родительскими таблицами являются таблицы измерений. При этом первичные ключи таблиц измерений мигрируют в первичный ключ таблицы факта. Первичный ключ таблицы факта целиком состоит из первичных ключей всех таблиц измерений.

В сложных задачах с многоуровневой иерархией измерений используется схема "снежинка". В этих случаях производится нормализация таблиц измерений, что отражает иерархию измерений. Это схема позволяет добиться лучшей производительности, но часто приводит к избыточности данных и к значительным усложнениям в структуре базы данных, в которой оказывается огромное количество таблиц измерений.

Достоинства ROLAP:

1.Корпоративные хранилища данных реализуются средствами реляционных СУБД. При этом размер хранилища не является таким критичным параметром, как в случае MOLAP.

2.В случае переменной размерности задачи, когда изменения в структуру измерений приходится вносить достаточно часто, ROLAP системы являются оптимальным решением, так как в них такие модификации не требуют физической реорганизации БД.

3.Реляционные СУБД обеспечивают высокий уровень защиты данных и хорошие возможности разграничения прав доступа.

Главный недостаток ROLAP по сравнению с многомерными СУБД – меньшая производительность. Для обеспечения производительности, сравнимой с MOLAP, реляционные системы требуют тщательной проработки схемы базы данных и настройки индексов, то есть больших усилий со стороны администраторов БД.

Гибридная архитектура HOLAP объединяет технологии ROLAP и MOLAP. В отличие от MOLAP, которая работает лучше, когда данные плотные, серверы ROLAP лучше в тех случаях, когда данные довольно разрежены. Серверы HOLAP применяют подход ROLAP для хранения разреженных детализированных данных и подход MOLAP для хранения плотных агрегированных данных. Например, в крупном супермаркете детальные данные по покупкам по каждому чеку можно хранить в реляционной структуре, а обобщенные данные, например, по группам товаров, отделам, интервалам дат целесообразно хранить в многомерной структуре. Логически HOLAP является самым гибким подходом. Реализация HOLAP объединяет достоинства и недостатки MOLAP и ROLAP, но сложна в администрировании.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]