Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
473_Хандархаев[1].doc
Скачиваний:
1
Добавлен:
14.11.2018
Размер:
309.76 Кб
Скачать

Правительство Российской Федерации

Государственное образовательное бюджетное учреждение

высшего профессионального образования

«Государственный университет -

Высшая школа экономики»

Факультет бизнес-информатики

Кафедра бизнес-аналитики

Реферат

на тему

«Продукты Oracle для построения корпоративной информационно-аналитической системы»

Выполнил:

Хандархаев Сергей Алексеевич

Группа 373

e-mail: khandarkhaevsa@gmail.com

Проверил:

Герасимов Николай Александрович

Оглавление

Оглавление 3

Введение 4

Глава 1. Архитектура решения 6

Глава 2. Методология создания хранилищ данных 9

Глава 3. Инструментальная среда 12

Выводы 13

Список литературы 14

Введение

К настоящему времени многие организации владеют колоссальными объемами накопленной информации, на основе которой может быть решен целый спектр аналитических и управленческих задач. На данный момент наиболее острой является проблема обработки и хранения аналитической информации.

Для того чтобы наладить эффективное управление бизнесом, аналитики и управляющие должны иметь доступ ко всей интересующей их информации, а интерфейс для предоставления данной информации должен быть удобным и простым в обращении.

Основная проблема сбора информации и предоставления ее в нужном виде заключается в том, что сведения приходится собирать из различных источников, отличающихся друг от друга структурой и форматом данных. Такие данные часто не согласуются между собой, и без должной обработки несут в себе небольшую ценность.

Именно на решение данных задач направлены технологии, объединенные под общим названием «Хранилища данных». В основе концепции хранилищ данных лежит идея интеграции разъединенных данных, поступающих из внешних источников, в единую базу данных, приведение этих данных к единому формату и агрегацию.

Корпорация Oracle занимается развитием технологий хранилищ данных в течение нескольких лет и считает данное направление одним из приоритетных в своей деятельности. Oracle предложила ряд интересных решений и технологий для построения информационно-аналитических систем.

К настоящему моменту сформировался ряд требований, ставший общепринятым стандартом для оценки функциональности информационно-аналитических систем. Полномасштабная информационно-аналитическая система должна выполнять такие функции как:

  • сбор данных из различных источников;

  • согласование собранных данных;

  • приведение данных к единому формату (преобразование);

  • загрузку данных в хранилище;

  • хранение аналитической информации;

  • выгрузку регламентной отчетности (форма отчетности должна быть локализована и соответствовать местному законодательству/бизнес требованиям);

  • поддерживать произвольные запросы;

  • поддерживать многомерный анализ.

Большинство решений не содержат полного функционала, и для покрытия всех требований приходится использовать разные продукты (что неизбежно приводит к усложнению архитектуры системы). Для решения данной проблемы корпорация Oracle создала единую и функционально полную платформу, в основе которой лежит система управления базами данных Oracle Database.

Глава 1. Архитектура решения

Корпоративная информационно-аналитическая система построена в соответствии со сложившимися в отрасли стандартами и имеет архитектуру с тремя ярко выраженными слоями (рисунок 1):

  1. слой извлечения, преобразования и загрузки данных (ETL-layer);

  2. слой хранения данных;

  3. слой анализа данных.

Данные, поступающие из различных внутрикорпоративных транзакционных систем, подчиненных структур, или внешних источников, проверяются, согласуются и помещаются в хранилище. Хранилище данных через витрины данных предоставляет необходимую информацию пользователям.

Слой извлечения, преобразования и загрузки данных включает подразделения и структуры организации всех уровней, использующих базы данных оперативного доступа для выполнения своих повседневных задач. Данный уровень представляет собой разрозненные источники информации. С технической точки зрения данный уровень представляет собой набор программно-аппаратных комплексов, соединенных (или не соединенных) между собой в корпоративную информационную систему. Отдельные узлы данной системы могут быть серверами реляционных баз данных (SQL-ориентированные БД под управлением операционных систем семейства Windows, UNIX или других), файловыми серверами (BTrieve), или персональных баз данных (Paradox, FoxPRO).

Из источников данных информация поступает в центральное хранилище. При этом данные проходят обработку, так как перед загрузкой в хранилище вся поступающая информация должна быть согласована, чтобы обеспечить целостность данных и их непротиворечивость.

Рисунок 1. Архитектура корпоративной информационно-аналитической системы.

Второй слой предназначен для хранения агрегированных данных, очищенных и приведенных к нужному формату.

Само по себе хранилище данных не ориентировано определенной аналитической задачи. Оно лишь обеспечивает целостность и поддерживает хронологию корпоративных данных. Хранилище данных является нейтральным по отношению к приложениям. Поэтому для решения конкретных аналитических задач создаются витрины данных – небольшие функционально-ориентированные хранилища данных, хранящих особым образом обработанную тематическую информацию.

В витрины данных информация может попадать как из хранилища, так и напрямую из оперативных или внешних систем.

В случае, когда источником данных для витрины служит хранилище данных, такая витрина называется зависимой.

Витрины, источником для которых служат оперативные и внешние системы, называются независимыми и, как правило, используются в качестве временного решения на ранних стадиях разработки хранилища данных.

Хранилище реализуется в виде реляционной базы данных, работающей под управлением мощной реляционной СУБД. Витрины данных строятся как на основе реляционных баз данных, так и на основе многомерной технологии баз данных, реализованной в архитектуре OLAP (On-Line Analytical Processing – аналитической обработки в реальном времени), ROLAP (Relational OLAP – реляционной OLAP) или HOLAP (Hybrid OLAP – гибридной OLAP).

Слой анализа данных решает прикладные аналитические задачи, набор которых достаточно разнообразен и определяется сферой деятельности компании, организационными особенностями и степенью подготовленности аналитиков. Для построения отчетов, графиков, прогнозов создаются витрины данных и специализированные рабочие места. В настоящее время различают четыре основных вида аналитической деятельности (рисунок 1):

  • стандартная отчетность;

  • нерегламентированные запросы;

  • многомерный анализ (OLAP);

  • извлечение знаний (Data Mining).

Решения задач каждой из видов аналитической деятельности поддерживается специализированной инструментальной средой.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]