Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
стоэи.doc
Скачиваний:
187
Добавлен:
16.03.2016
Размер:
476.67 Кб
Скачать

31. Технология olap, olap-куб – основные понятия.

OLAP(OnlineAnalyticalProcessing) – технология оперативной аналитической обработки данных, использующая методы и средства для сбора, хранения и анализа многомерных данных в целях поддержки процессов принятия решений.

Основное назначение OLAP-систем – поддержка аналитической деятельности, произвольных запросов пользователей – аналитиков.

Цель OLAP-анализа – проверка возникающих гипотез.

Возможность анализа зависимостей между различными параметрами предполагает возможность представления данных в виде многомерной модели – гиперкуба, или OLAP-куба.

Осями многомерной системы координат служат основные атрибуты анализируемого бизнес-процесса. На пересечениях осей изменений (Dimensions) находятся данных, количество характеризующие процесс меры (Measures).

Факт – это числовая величина, которая располагается в ячейках гиперкуба.

Измерение (dimension)- это множество объектов одного или нескольких типов, организованных в виде иерархической структуры и обеспечивающих информационный контекст числового показателя. Объекты, совокупность которых и образует измерение, называются членами измерений (members).

Ячейка (cell) – атомарная структура куба, соответствующая полному набору конкретных значений измерений.

Иерархия – группировка объектов одного измерения в объекты более высокого уровня. Например, день-месяц-год. Иерархии в измерениях необходимы для возможности агрегации и детализации значений показателей согласно их иерархической структуре.

Базовые операции, выполняемые над OLAP-кубом:

-срез (slice-and-dice) – формируется подмножество многомерного массива данных, соответствующее единственному значению одного или нескольких элементов измерений, не входящих в это подмножество.

-вращение – изменение расположения измерений, представленных в отчете или на отображаемой странице. Например, операция вращения может заключаться в перестановке местами строк или столбцов таблицы. Кроме того, вращением куба данных является перемещение внетабличных измерений на место измерений, представленных на отображаемой странице, и наоборот.

-консолидация (roll-up/drillup) и детализация (drill-down) – операции, которые определяют переход вверх по направлению от детального представления данных к агрегированному и наоборот, соответственно.

32. Архитектура olap-систем, таблицы фактов, таблицы измерений. Способы реализации многомерной модели.

OLAP-система состоит из множества компонент. На самом высоком уровне представления система включает в себя источник данных,OLAP-сервер и клиента.

Источник данных представляет собой источник, из которого берутся данные для анализа.

OLAP-клиент представляет пользователю интерфейс к многомерной модели данных, обеспечивая возможность удобно манипулировать данными для выполнения задач анализа.

OLAP-сервер обеспечивает хранение данных, выполнение над ними необходимых операций и формирование многомерной модели на концептуальном уровне.

Таблица фактов.

Таблица фактов – является основной таблицей хранилища данных. Как правило, она содержит сведения об объектах или событиях, совокупность которых будет в дальнейшем анализироваться.

4 наиболее часто встречающихся типа фактов:

-факты, связанные с транзакциями (transactionfacts). Основаны на отдельных событиях.

-факты, связанные с «моментальными снимками» (snapshotfacts). Основаны на состояниях объекта.

-факты, связанные с элементами документа (line-itemfacts). Основаны на том или ином документе и содержат подробную информацию об элементах этого документа.

-факты, связанные с событиями или состоянием объекта (eventorstatefacts). Представляют возникновение события без подробностей о нем.

Таблица фактов, как правило, содержит уникальный составной ключ, объединяющий первичные ключи таблиц измерений. При этом как ключевые, так и некоторые неключевые поля должны соответствовать будущим измерения OLAP-куба. Помимо этого таблица фактов содержит одно или несколько полей, на основании которых в дальнейшем будут получены агрегатные данные.

Таблицы измерений.

Таблицы измерений содержат неизменяемые либо редко изменяемые данные. Таблицы измерений содержат как минимум одно описательное поле (обычно с именем члена измерения) и, как правило, целочисленное ключевое поле (обычно это суррогатный ключ) для однозначной идентификации члена измерения. Если будущее измерение, основанное на данной таблице измерений, содержит иерархию, то таблица измерений также может содержать поля, указывающие на «родителя» данного члена в этой иерархии. Таблица измерений может содержать также дополнительные атрибуты членов измерений, содержавшиеся в исходной оперативной базе данных.

Способы реализации многомерной модели.

OLAP-серверы скрывают от конечного пользователя способ реализации многомерной модели. Существует три основных способа реализации –MOLAP,ROLAP,HOLAP.

-MOLAP(MultidimensionalOLAP)- исходные и агрегатные данные хранятся в многомерной базе данных. Хранение данных в многомерных структурах позволяет манипулировать данными как многомерных массивом, благодаря чему скорость вычисления агрегатных значений одинакова для любых из измерений. Однако в этом случае многомерная база данных оказывается избыточной, так как многомерные данные полностью содержат исходные реляционные данные.

-ROLAP(RelationalOLAP) –исходные данные остаются в той же реляционной базе данных, где они изначально и находились. Агрегатные же данные помещают в специально созданные для их хранения служебные таблицы в той же базе данных.

HOLAP(HybridOLAP) – исходные данные остаются в той же реляционной базе данных, где они изначально находились, а агрегатные данные хранятся в многомерной базе данных.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]