Содержание
Введение................................................................................2
Понятие о хранилищах данных...........................................3
Архитектуры хранилищ данных.........................................5
Недостатки современных хранилищ данных.....................8
Преимущества хранилищ данных.......................................9
Реализации хранилищ данных............................................10
Область применения хранилищ данных............................14
Заключение………………………………………………...15
Приложение………………………………………………..16
Список литературы………………………………………..17
Введение
Ключевым фактором рыночного успеха в сегодняшних условиях высокой конкуренции становится оперативное принятие эффективных деловых решений. Однако естественное стремление многих организаций усовершенствовать свои процессы принятия решений может натолкнуться на труднопреодолимое препятствие - огромный объем и высокая сложность данных, содержащихся в разнообразных оперативных и производственных системах этих организаций. Сделать такую информацию доступной более широкому кругу бизнес-пользователей - вот одна из наиболее серьезных проблем, стоящих сегодня перед профессионалами в области информационных технологий.
Многие организации для решения этой задачи избирают путь построения хранилища данных (data warehouse), позволяющего "высвободить" информацию из жестких рамок оперативных систем и лучше осознать проблемы реального бизнеса. Хранилище данных - это интегрированный накопитель информации, собранной из других систем, на основе которого строятся процессы принятия решений и анализа данных. На сегодняшний день большинство компаний активно применяют хранилища данных, чтобы добиться преимущества в конкурентной борьбе и получить значительно большую отдачу от своих инвестиций.
Понятие о хранилищах данных
Хранилище данных - это предметно-ориентированное, привязанное ко времени и неизменяемое собрание данных для поддержки процесса принятия управляющих решений. Схему хранилища данных можно представить следующим образом:
Данные в хранилище попадают из оперативных систем, которые предназначены для автоматизации бизнес-процессов. Кроме того, хранилище может пополняться за счет внешних источников, например статистических отчетов, различных справочников и т.д. Хранилище данных кроме детализированной информации содержит в себе агрегаты, т.е. обобщающую информацию, например суммы продаж, количество, общие расходы и т.д.
Отличие хранилищ данных от обыкновенных баз данных, используемых в системах обработки транзакций (транзакция – это последовательный набор команд, образующий логически завершенный блок, который выполняется как единое целое), состоит в том, что в хранилищах находятся редко изменяемые данные (обновляющиеся с заданной периодичностью). Эти данные используются для пользовательских запросов и формирования отчетов. В одном хранилище может находиться информация по всем аспектам деятельности предприятия, но также на предприятии может существовать несколько хранилищ данных, в которых находится архив информации, накопленной различными службами и подразделениями. Создается репозиторий данных, содержащий долговременную информацию, отражающую ситуацию в предыдущие периоды. Данные, находящиеся в хранилище, используются для анализа и как основа системы поддержки принятия решений на многих уровнях, для стратегического планирования и просто для ускорения операций выборки данных и формирования отчетов. Основные требования к данным в хранилище данных:
Предметная ориентированность. Все данные о некотором предмете (бизнес-объекте) собираются (обычно из множества различных источников), очищаются, согласовываются, дополняются, агрегируются и представляются в единой, удобной для их использования в бизнес-анализе форме.
Интегрированность. Все данные о разных бизнес-объектах взаимно согласованы и хранятся в едином общекорпоративном хранилище.
Неизменчивость. Исходные данные, после того как они были согласованы, верифицированы и внесены в общекорпоративное хранилище, остаются неизменными и используются исключительно в режиме чтения.
Поддержка хронологии. Данные хронологически структурированы и отражают историю, за достаточный для выполнения задач бизнес-анализа и прогнозирования период времени.