Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции по КИТ для МАЗ.doc
Скачиваний:
27
Добавлен:
29.02.2016
Размер:
313.86 Кб
Скачать

6.3 Системы обработки распределенных бд

6.3.1 Архитектура системы обработки РаБд

В этих системах реализуется децентрализованная обработка данных, т.е. базы данных находятся на компьютерах сети, на них устанавливаются локальные СУБД и можно обрабатывать данные в автономном режиме. Однако в компьютерной сети может быть создана «виртуальная» БД, объединяющая БД различных компьютеров. Она называетсяраспределенной базой данных (РаБД). Системы управления РаБД (СУРБД) объединяют локальные БД, и любой пользователь компьютерной сети имеет доступ к ним как к единой БД.

Информация о местоположении каждой из частей РаБД находится в глобальном словаре данных, который может храниться на одном из компьютеров сети или быть распределенным.

РаБД можно разделить на гомогенные, когда все локальные БД имеют одинаковые модели данных и управляются однотипной СУБД, игетерогенные, имеющие разные модели данных и типы СУБД. Объединение гетерогенных БД является очень сложной проблемой.

6.4 Хранилища данных

Традиционный анализ данных осуществляется на основе набора готовых отчетов, а его результат – принятие определенного бизнес-решения. Для принятия эффективных управленческих решений руководителю может потребоваться исследование десятков тысяч комбинаций данных, не укладывающихся в имеющийся набор готовых отчетов. Эти проблемы легко решаются при использовании ХД.

Хранилище данных (ХД)– совокупность данных, ориентированная на предметную область, интегрированная, статичная, не разрушаемая, предназначенная для поддержки принятия решений.

Предметная ориентированность означает, что хранилище предоставляет данные, связанные с одним организационным процессом. Например, компания предоставляет клиентам услуги городской телефонной связи, мобильной связи и Интернет. Каждым видом услуг занимаются разные отделы, имеющие свои БД и создающие свои отдельные отчеты. Создание общего ХД о клиентах может обеспечить единый взгляд на приобретаемые услуги. Из него исключаются ненужные для анализа данные (индексы, номера телефонов и т.д.). Основываясь на демографических данных клиентов и тенденциях их покупательского поведения в прошлом, компания может предложить им новые услуги.

Интегрированность означает применение единых законов именования и способов вычисления значений данных, полученных из разных источников. Например, могут использоваться несколько разных форматов представления дат или один и тот же показатель может называться по-разному, («дата выполнения» и «дата исполнения»). При записи (погружении) в ХД такие несоответствия устраняются автоматически. В процессе погружения данные:

1) очищаются – устраняется ненужная или служебная информация;

2) агрегируются – вычисляются суммы, средние значения и т.д.;

3) изменяются – происходит преобразование типов данных, реорганизация структур хранения;

4) объединяются из разных источников;

5) синхронизируются – приводятся к одному моменту времени.

Статичность (независимость от времени) означает, что ХД содержит как исторические данные, так и данные, которые имели статус текущих при последнем погружении. Временные рамки данных изменяются в пределах от нескольких месяцев до нескольких лет.

Неразрушаемая совокупность данных означает, что в ХД помещается большой объем данных, которые никогда больше не подвергаются изменениям. Т.о. пользователи, выполняющие один и тот же запрос к ХД, получат один и тот же результат.

В настоящее время кроме ХД создаются витрины данныхиликиоски данных.

Киоск данных– это небольшое ХД, обслуживающее одно из направлений бизнеса компании или одно ее структурное подразделение. Стоимость разработки киоска в десятки и сотни раз ниже стоимости корпоративного хранилища данных, а результат его внедрения окупается очень быстро.