- •Хранение информации
- •Системы оперативной обработки информации
- •Обобщенная структура системы oltp
- •Системы поддержки принятия решений
- •Хранилища данных
- •Обобщенная концептуальная схема хд детализированные и агрегированные данные
- •Метаданные
- •Управление жизненным циклом информации
- •Фиксированный контент
- •Извлечение данных (etl)
- •Обобщенная структура процесса etl Архитектуры хранилищ данных
- •Шесть уровней архитектуры хранилища данных
- •Консолидация с использованием витрин данных
- •Реляционные хранилища данных
- •Многомерные хранилища данных
- •Гибридные хранилища данных
- •Гибридное хд
- •Анализ данных введение в olap
- •Эволюция понимания места olap в архитектуре
- •Принцип организации многомерного куба
- •Измерения и факты в многомерном кубе
- •Сечения гиперкуба
- •Двумерный срез куба для одного факта
- •Двумерный срез куба для нескольких фактов
- •Двумерный срез куба с несколькими измерениями на одной оси
Двумерный срез куба с несколькими измерениями на одной оси
Метки
Значения, "откладываемые" вдоль измерений, называются членами или метками (members). Метки используются как для "разрезания" куба, так и для ограничения (фильтрации) выбираемых данных - когда в измерении, остающемся "неразрезанным", нас интересуют не все значения, а их подмножество, например три города из нескольких десятков. Значения меток отображаются в двумерном представлении куба как заголовки строк и столбцов.
Иерархии и уровни
Метки могут объединяться в иерархии, состоящие из одного или нескольких уровней (levels). Например, метки измерения "Магазин" (Store) естественно объединяются в иерархию с уровнями:
All (Мир)
Country (Страна)
State (Штат)
City (Город)
Store (Магазин).
В соответствии с уровнями иерархии вычисляются агрегатные значения, например объем продаж для USA (уровень "Country") или для штата California (уровень "State"). В одном измерении можно реализовать более одной иерархии - скажем, для времени: {Год, Квартал, Месяц, День} и {Год, Неделя, День}.
Б) Транспонирование
Транспонирование (вращение) обычно применяется к плоским таблицам, полученным, например, в результате среза, и позволяет изменить порядок представления измерений таким образом, что измерения, отображавшиеся в столбцах, будут отображаться в строках, и наоборот. В ряде случаев транспонирование позволяет сделать таблицу более наглядной.
В) Свертка
Операции свертки (группировки) и детализации (декомпозиции) возможны только тогда, когда имеет место иерархическая подчиненность значений измерений. При свертке одно или несколько подчиненных значений измерений заменяются теми значениями, которым они подчинены. При этом уровень обобщения данных уменьшается. Так, если отдельные товары образуют группы, например Стройматериалы, то в результате свертки вместо отдельных наименований товаров будет указано наименование группы, а соответствующие им факты будут агрегированы.
Проиллюстрируем результаты свертки: в табл. 2 представлена исходная таблица, а в табл. 3 — результат ее свертки по измерению Товар.
Таблица 2. Исходная таблица
Группа |
Товар |
Сумма |
Стройматериалы |
Кирпич |
22 000 |
Цемент |
12 000 | |
Керамзит |
4500 | |
Доска |
7400 | |
Инструмент |
Отвертка |
1200 |
Электропила |
7600 | |
Дрель |
2450 | |
Шпатель |
780 |
Таблица 3. Результат свертки исходной таблицы по измерению «Товар»
Группа |
Сумма |
Стройматериалы |
45 900 |
Инструмент |
12 030 |
В) Детализация
Детализация — это процедура, обратная свертке; уровень обобщения данных уменьшается. При этом значения измерений более высокого иерархического уровня заменяются одним или несколькими значениями более низкого уровня, то есть вместо наименований групп товаров отображаются наименования отдельных товаров.
Например, если при анализе данных о продажах в Северной Америке выполнить операцию детализации для измерения "Регион", то будут отображены такие элементы, как "Канада", "Восточные штаты США" и "Западные штаты США". В результате дальнейшей детализации элемента "Канада" будут отображены элементы "Торонто", "Ванкувер" и т.д.