Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Презентация ИС 2013_1

.pdf
Скачиваний:
75
Добавлен:
23.02.2015
Размер:
11.2 Mб
Скачать

Бизнес-аналитика

(Business intelligence - BI)

BI – это методы и инструменты для построения отчётов, необходимых для принятия управленческих решений.

BI – это инструменты, используемые для преобразования, хранения, анализа, моделирования, доставки информации в ходе работы над задачами, связанными с принятием решений на основе фактических данных.

В BI входят средства ETL, аналитические хранилища данных и средства Data Mining.

101

Средства ETL

ETL (от англ. Extract, Transform, Load «извлечение,

преобразование, загрузка») - один из основных процессов в управлении хранилищами данных, который включает в себя:

извлечение данных из внешних источников;

трансформация и очистка данных в соответствии с нуждами бизнес-модели;

загрузка в хранилище данных.

OLTP 1

ETL OLAP

OLTP 2

OLTP n

Интеллектуальный анализ данных

(Data Mining)

Data Mining переводится как “добыча” или “раскопка данных”.

Также используют термины “обнаружение знаний в базах данных” и “интеллектуальный анализ данных” - ИАД.

ИАД – это:

1.поиск функциональных и логических закономерностей в накопленной информации;

2.построение моделей, которые прогнозируют развитие некоторых процессов.

ИАД выполняется на основе многомерных хранилищ данных для решения задач:

прогнозирования;

стратегического планирования;

анализа рисков.

103

Отличие Data Mining от OLAP

Если в OLAP обычно формулируются вопросы типа

Каково среднее число неоплаченных счетов заказчиками данной услуги?”,

то в Data Mining - вопросы типа ”Существует ли типичная категория клиентов, не оплачивающих счета?”.

Термин “Data Mining” обозначает сам процесс поиска тенденций, взаимосвязей и закономерностей

посредством различных математических и статистических алгоритмов:

кластеризации, создания субвыборок, регрессионного и корреляционного анализа.

104

Сферы применения ИАД

Методы ИАД используют коммерческие предприятия, развертывающие проекты на основе ИХ данных.

Опыт таких предприятий показывает, что отдача от использования ИАД может достигать 1000%.

Например, годовая экономия за счет внедрения ИАД в сети универсамов в Великобритании составила 700 тыс. долл. ИАД может использоваться в:

розничной торговле – анализ покупательской корзины, прогноз характера потребностей отдельных категорий покупателей и т. д.;

банковском деле – выявление мошенничества с кредитными карточками, прогнозирование изменений клиентуры и т. д.;

cтраховании – выявление мошенничества, анализ

риска и т. д.

105

Концепция Хранилищ Данных (ХД)

Данные в ХД (Data Warehouse) представляют собой

пополняемый набор, единый для всего предприятия и

позволяющий восстановить картину деятельности предприятия на любой момент времени.

Автором концепции является Б. Инмон, который определил следующие характеристики для хранящихся наборов данных:

предметно-ориентированные;

интегрированные;

неизменчивые;

поддерживающие хронологию;

организованные для целей поддержки управления.

ХД обеспечивают менеджеров и аналитиков достоверной

информацией, необходимой для оперативного

 

анализа и принятия решений.

106

Концепция Хранилищ Данных (ХД)

Все данные о бизнес объекте собираются (обычно из множества различных источников), очищаются, согласовываются (согласование определяет достоверность данных), агрегируются и представляются в единой, удобной для их использования в бизнес анализе форме.

Исходные (исторические) данные, после того как они были согласованы и внесены в общекорпоративное хранилище, остаются неизменными и

используются только в режиме чтения.

Без поддержки хронологии (наличия исторических данных) не могут быть решены задачи прогнозирования и анализа тенденций.

107

Хранилища данных (DWH)– источник данных для BI

Основополагающие идеи концепции Хранилищ Данных

1.Интеграция ранее разъединенных детализированных данных (исторические архивы, данные из традиционных СОД, данные из внешних источников) в едином ХД.

2.Разделение наборов данных, используемых для

операционной обработки, и наборов данных,

используемых для решения задач анализа.

3.Хранение данных в многомерном информационном пространстве (также как в OLAP).

Концепция ХД – это концепция подготовки данных для анализа.

В ХД содержатся гигабайты и терабайты информации.

109

Витрины Данных (ВД)

Концепция Витрин Данных (Data Mart) была предложена в 1991 г.

ВД – это множество тематических БД, содержащих информацию, относящуюся к отдельным аспектам деятельности организации.

Витрина данных (Data Mart) может представляет собой узкоспециализированную подсистему хранилища данных (Data Warehouse), его отдельный элемент.

В этом случае под витриной данных понимается хранилище данных, обслуживающее одно из направлений деятельности компании.

110

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]