Правительство Российской Федерации
Государственное образовательное бюджетное учреждение
высшего профессионального образования
«Государственный университет -
Высшая школа экономики»
Факультет бизнес-информатики
Кафедра бизнес-аналитики
Реферат
на тему
«Продукты Oracle для построения корпоративной информационно-аналитической системы»
Выполнил:
Хандархаев Сергей Алексеевич
Группа 373
e-mail: khandarkhaevsa@gmail.com
Проверил:
Герасимов Николай Александрович
Оглавление
Оглавление 3
Введение 4
Глава 1. Архитектура решения 6
Глава 2. Методология создания хранилищ данных 9
Глава 3. Инструментальная среда 12
Выводы 13
Список литературы 14
Введение
К настоящему времени многие организации владеют колоссальными объемами накопленной информации, на основе которой может быть решен целый спектр аналитических и управленческих задач. На данный момент наиболее острой является проблема обработки и хранения аналитической информации.
Для того чтобы наладить эффективное управление бизнесом, аналитики и управляющие должны иметь доступ ко всей интересующей их информации, а интерфейс для предоставления данной информации должен быть удобным и простым в обращении.
Основная проблема сбора информации и предоставления ее в нужном виде заключается в том, что сведения приходится собирать из различных источников, отличающихся друг от друга структурой и форматом данных. Такие данные часто не согласуются между собой, и без должной обработки несут в себе небольшую ценность.
Именно на решение данных задач направлены технологии, объединенные под общим названием «Хранилища данных». В основе концепции хранилищ данных лежит идея интеграции разъединенных данных, поступающих из внешних источников, в единую базу данных, приведение этих данных к единому формату и агрегацию.
Корпорация Oracle занимается развитием технологий хранилищ данных в течение нескольких лет и считает данное направление одним из приоритетных в своей деятельности. Oracle предложила ряд интересных решений и технологий для построения информационно-аналитических систем.
К настоящему моменту сформировался ряд требований, ставший общепринятым стандартом для оценки функциональности информационно-аналитических систем. Полномасштабная информационно-аналитическая система должна выполнять такие функции как:
-
сбор данных из различных источников;
-
согласование собранных данных;
-
приведение данных к единому формату (преобразование);
-
загрузку данных в хранилище;
-
хранение аналитической информации;
-
выгрузку регламентной отчетности (форма отчетности должна быть локализована и соответствовать местному законодательству/бизнес требованиям);
-
поддерживать произвольные запросы;
-
поддерживать многомерный анализ.
Большинство решений не содержат полного функционала, и для покрытия всех требований приходится использовать разные продукты (что неизбежно приводит к усложнению архитектуры системы). Для решения данной проблемы корпорация Oracle создала единую и функционально полную платформу, в основе которой лежит система управления базами данных Oracle Database.
Глава 1. Архитектура решения
Корпоративная информационно-аналитическая система построена в соответствии со сложившимися в отрасли стандартами и имеет архитектуру с тремя ярко выраженными слоями (рисунок 1):
-
слой извлечения, преобразования и загрузки данных (ETL-layer);
-
слой хранения данных;
-
слой анализа данных.
Данные, поступающие из различных внутрикорпоративных транзакционных систем, подчиненных структур, или внешних источников, проверяются, согласуются и помещаются в хранилище. Хранилище данных через витрины данных предоставляет необходимую информацию пользователям.
Слой извлечения, преобразования и загрузки данных включает подразделения и структуры организации всех уровней, использующих базы данных оперативного доступа для выполнения своих повседневных задач. Данный уровень представляет собой разрозненные источники информации. С технической точки зрения данный уровень представляет собой набор программно-аппаратных комплексов, соединенных (или не соединенных) между собой в корпоративную информационную систему. Отдельные узлы данной системы могут быть серверами реляционных баз данных (SQL-ориентированные БД под управлением операционных систем семейства Windows, UNIX или других), файловыми серверами (BTrieve), или персональных баз данных (Paradox, FoxPRO).
Из источников данных информация поступает в центральное хранилище. При этом данные проходят обработку, так как перед загрузкой в хранилище вся поступающая информация должна быть согласована, чтобы обеспечить целостность данных и их непротиворечивость.
Рисунок 1. Архитектура корпоративной информационно-аналитической системы.
Второй слой предназначен для хранения агрегированных данных, очищенных и приведенных к нужному формату.
Само по себе хранилище данных не ориентировано определенной аналитической задачи. Оно лишь обеспечивает целостность и поддерживает хронологию корпоративных данных. Хранилище данных является нейтральным по отношению к приложениям. Поэтому для решения конкретных аналитических задач создаются витрины данных – небольшие функционально-ориентированные хранилища данных, хранящих особым образом обработанную тематическую информацию.
В витрины данных информация может попадать как из хранилища, так и напрямую из оперативных или внешних систем.
В случае, когда источником данных для витрины служит хранилище данных, такая витрина называется зависимой.
Витрины, источником для которых служат оперативные и внешние системы, называются независимыми и, как правило, используются в качестве временного решения на ранних стадиях разработки хранилища данных.
Хранилище реализуется в виде реляционной базы данных, работающей под управлением мощной реляционной СУБД. Витрины данных строятся как на основе реляционных баз данных, так и на основе многомерной технологии баз данных, реализованной в архитектуре OLAP (On-Line Analytical Processing – аналитической обработки в реальном времени), ROLAP (Relational OLAP – реляционной OLAP) или HOLAP (Hybrid OLAP – гибридной OLAP).
Слой анализа данных решает прикладные аналитические задачи, набор которых достаточно разнообразен и определяется сферой деятельности компании, организационными особенностями и степенью подготовленности аналитиков. Для построения отчетов, графиков, прогнозов создаются витрины данных и специализированные рабочие места. В настоящее время различают четыре основных вида аналитической деятельности (рисунок 1):
-
стандартная отчетность;
-
нерегламентированные запросы;
-
многомерный анализ (OLAP);
-
извлечение знаний (Data Mining).
Решения задач каждой из видов аналитической деятельности поддерживается специализированной инструментальной средой.