- •Аналитические базы данных
- •Содержание
- •Введение
- •Гипотеза — модель — решение.
- •Лекция 1 Эволюция корпоративных информационных систем
- •Лекция 2 olap системы на железнодорожном транспорте.
- •Лекция 3 Основные понятия olap
- •Общие свойства хранилищ
- •Ориентированность на предметную область
- •Интегрированность
- •Зависимость от времени
- •Постоянство
- •Данные хранилища
- •Источники данных
- •Хранилище данных (в узком смысле)
- •Оперативный склад данных (Operational Data Store - ods)
- •Витрины данных (Datamart)
- •Метаданные
- •Компоненты хранилища
- •Подсистема загрузки данных
- •Подсистема обработки запросов и представления данных
- •Подсистема администрирования хранилища
- •Лекция 4 Методика (методология) построения хранилищ данных
- •Постановка задачи Системно-аналитическое обследование
- •Техническое задание
- •Проектирование
- •Автоматизируемые процессы и функции
- •Информационное обеспечение
- •Компонентная архитектура
- •Техническая архитектура
- •Реализация
- •Внедрение
- •Выбор метода реализации Хранилищ данных
- •Лекция 5 Рынок bi
- •Продукция Microsoft
- •Аналитическая платформа Deductor
- •Лекция 6olapкуб. Построение, работа с элементамиOlap-куба
- •Invoices.Customers.CompanyName as
- •Invoices.OrderDate, Categories.CategoryName,
- •Invoices.ProductName,
- •Invoices.Shippers.CompanyName as
- •Некоторые термины и понятия
- •Типичная структура хранилищ данных
- •Таблицы измерений
- •Olap на клиенте и на сервере
- •Технические аспекты многомерного хранения данных
- •Лекция 7 Data mining
- •Условные сокращения и обозначения
- •Словарь
Продукция Microsoft
Фирма Microsoftтвердо
убеждена, что ее продукты позволяют
значительно усовершенствовать процесс
создания хранилища данных. Она разработалапродукт DataWarehousing
Framework, в котором
объединены различные технологии (доступ
к данным, метаданные, преобразования,
запрос конечного пользователя и т.д.)
во всех
В СУБД MicrosoftSQLServer 7.0предусмотрено много средств, которые могут помочь в построении хранилища данных. Поддержка больших баз данных, оптимизация запросов и репликация — все эти функции делаютSQLServerмощным инструментом для создания хранилища или витрины данных (рис. 5.1). Гетерогенные запросы позволяют объединить результирующие наборы из нескольких источников данныхOLEDBили ODBC. Кроме того, к вашим услугам службы преобразования данных (DTS), склад (Repository) для хранения метаданных,OLAP-средства для принятия решений (DecisionSupportServices) иMicrosoftEnglishQuery(выполнение запросов на английском языке) [10].
Рис. 5.1 Схема работы с хранилищем данных при помощи продукции Microsoft
Службы преобразования данных (DataTransformationServices–DTS) – это универсальный набор инструментов, встроенный вSQLServer7.0. Он позволяет легко импортировать, экспортировать и преобразовывать данные, перемещая их между любыми двумя источниками, которые поддерживаютOLEDB. В каком-то смыслеDTS— это своего рода насос данных, с помощью которого можно перемещать исходные записи с одного места на другое с помощью простого интерфейса мастера.
В DTSпредусмотрены службы импорта и экспорта данных из различных источников:
источников данных, поддерживающих OLEDB:Oracle,SQLServer4.2, 6.5 и др.;
источников данных, поддерживающих ODBC:DB2 наMVS, данныхAS400,Informix,MicrosoftAccess,MicrosoftExcelи др.;
текстовых ASCII-файлов, содержащих поля фиксированной длины или разделенных символами-ограничителями.
Приложение MicrosoftRepository— это инфраструктура для хранения и совместного использования метаданных. Оно позволяет простым способом описывать данные, находящиеся в хранилище. С помощью склада информационные структуры данных можно хранить отдельно от самих данных; к этим структурам также можно обращаться из других компонентов архитектуры хранилища данных. Склад хранилища данных обладает следующими возможностями:
сохраняет модели данных со звездообразной структурой;
заносит в каталог связи между элементами данных и исходными СУБД;
регистрирует преобразования данных и родословные данных:
сохраняет правила выборки данных и репликации;
поддерживает работу команды разработчиков.
Службы поддержки принятия решений фирмы Microsoft (MicrosoftDecisionSupportServices)— это инструменты, позволяющие сделать общедоступными возможностиOLAPи информацию, находящуюся в хранилище. С их помощью можно представить информацию из хранилища в виде многомерных кубов, что способствует проведению анализа данных.
Главные особенности и преимущества MicrosoftDSS:
доступ к любому поддерживающему OLEDBисточнику данных;
поддержка MOLAP(многомерной интерактивной аналитической обработки),ROLAP(реляционнойOLAP) иHOLAP(гибрида первых двух);
объединение возможностей хранения данных SQLServerи анализа данныхExcelпутем поддержки средств создания свободных таблиц;
возможность проведения анализа данных в автономном режиме, например во время передвижения в автомобиле, самолете и т.д.
возможность перехода от настольной системы к общей модели для всего предприятия.