Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
стоэи.doc
Скачиваний:
187
Добавлен:
16.03.2016
Размер:
476.67 Кб
Скачать

Раздел 5.

28. Типовая структура и особенности аналитических информационных систем.

Информационно-аналитические системы (ИАС) – особый класс информационных систем, предназначенных для аналитической обработки данных. В настоящее время данный класс систем является одним из наиболее востребованных на рынке программного обеспечения, это связано с глобальным процессом автоматизации информационной деятельности целых отраслей.

Создание информационно-аналитических систем позволяет значительно увеличить количество обрабатываемых данных и более оперативно предоставлять необходимые сведения. ИАС позволяют существенно увеличить скорость обработки и передачи данных.

Назначением любой современной информационно-аналитической системы (ИАС) является обеспечение руководителей, аналитиков и менеджеров информацией о всех аспектах деятельности компании для ее последующей оценки и анализа.

Задачами любой информационно-аналитической системы являются эффективное хранение, обработка и анализ данных. Эффективное хранение информации достигается наличием в составе информационно-аналитической системы целого ряда источников данных. Обработка и объединение информации достигается применением инструмента извлечения, преобразования и загрузки данных. Анализ данных осуществляется при помощи современных инструментов делового анализа данных.

Создание информационно-аналитических систем позволяет значительно увеличить количество обрабатываемых данных и более оперативно предоставлять необходимые сведения.

Функцию сбора и хранения информации с сопутствующей доработкой в ИАС, выполняют информационные хранилища (DataWarehouse).

В связи с большим объемом и сложностью анализ данных имеет два направления – оперативный анализ данных (информации), широко распространена англоязычная аббревиатура названия On-line Analytical Processing (OLAP). Основной задачей оперативного, или OLAP-анализа является быстрое (в пределах секунд) извлечение необходимой аналитику для обоснования или принятия решения информации. Эту функцию выполняют всевозможные OLAP-средства.

Интеллектуальный анализ информации – имеет также широко распространенное в русской специальной литературе англоязычное название Data Mining. Он предназначен для фундаментального исследования проблем в той или иной предметной области.

Типовая архитектура информационно-аналитической системы:

Источники данных – Извлечение, преобразование и загрузка данных – Хранилище данных – Витрины данных (ROLAP, MOLAP, HOLAP) – Аналитический инструментарий (регламентированная отчетность, произвольные отчеты, интерактивные отчеты, извлечение знаний Data Mining)

29. Понятие и концепция хранилищ данных.

Хранилище данных (DataWarehouse) – это предметно-ориентированный, интегрированный, неизменчивый, поддерживающий хронологию набор данных, организованный для целей поддержки управления.

Свойства хранилищ данных:

-предметная ориентация;

-интегрированность данных;

-инвариантность во времени;

-стабильность информации;

-минимизация избыточности информации.

Основные требования к хранилищам данных:

-высокая скорость извлечения данных из хранилища;

-внутренняя непротиворечивость данных;

-возможность получения и сравнения данных;

-наличие удобных утилит просмотра данных хранилища;

-полнота и достоверность хранимых данных;

-поддержка процесса качественного пополнения данных.

Попав однажды в хранилище, данные уже никогда не изменяются, а только пополняются новыми данными из оперативных систем, где данные постоянно меняются. Новые данные по мере поступления обобщаются с уже накопленной информацией в хранилище данных.

Использование технологии хранилищ данных предполагает наличие в системе следующих компонентов:

-оперативных источников данных;

-средств переноса и трансформации данных;

-метаданных – включают каталог хранилища и правила преобразования данных при загрузке их из оперативных баз данных;

-реляционного хранилища;

-OLAP-хранилища;

-средств доступа и анализа данных.

Назначение перечисленных компонентов таково. Оперативные данные собираются из различных источников. Поступившие оперативные данных очищаются, интегрируются и складываются в реляционные хранилища. Они уже доступны для анализа при помощи средств построения отчетов. Затем дынные (полностью или частично) подготавливаются с использованием средств переноса и трансформации данных для OLAP-анализа. При этом они могут быть загружены в специальную базу данных OLAP или оставаться в реляционном хранилище.

Важнейшим элементов хранилища являются метаданные, т.е. данные о структуре, размещении, трансформации данных, которые используются любыми процессами хранилища. Метаданные могут быть востребованы для различных целей, например, извлечения и загрузки данных, обслуживании хранилища и запросов. Метаданные для различных процессов могут иметь различную структуру, т.е. для одного и того же элемента данных может существовать несколько вариантов метаданных.

Таким образом, хранилища данных являются структурированными. Они содержат базовые данные, которые образуют единый источник для обработки данных во всех системах поддержки принятия решений. Элементарные данные, присутствующие в хранилищах, могут быть представлены в различной форме. Хранилища данных исключительно велики, поскольку в них содержатся интегрированные и детализированные данные.

Хранилище данных (Data Warehouse) по сути, представляет собой центр, в который собирается вся необходимая информация из различных подразделений предприятия. Единожды занесенные в Data Warehouse данные затем многократно извлекаются из него и используются для анализа. Отсюда вытекает одно из основных преимуществ использования DataWarehouseв работе предприятия – контроль за критически важной информацией, полученной из различных источников, как за производственным ресурсом.

Наиболее уязвимым местом использования Data Warehouse является корректность его данных, полученных из разных источников.

Типичное хранилище данных, как правило, отличается от обычной реляционной базы данных. Во-первых, обычные базы данных предназначены для того, чтобы помочь пользователям выполнять повседневную работу, тогда как хранилища данных предназначены для принятия решений. Во-вторых, обычные базы данных подвержены постоянным изменениям в процессе работы пользователей, а хранилище данных относительно стабильно: данные в нем обычно обновляются согласно расписанию. Например, ежедневно, еженедельно или ежечасно в зависимости от потребностей. В идеале процесс пополнения представляет собой просто добавление новых данных за определенный период времени без изменения прежней информации, уже находящейся в хранилище.

Преимущества хранилищ данных:

-единый источник информации.

-производительность.

-быстрота разработки.

-интегрированность;

-историчность и стабильность.

-независимость.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]