Презентация ИС 2013_1
.pdfБизнес-аналитика
(Business intelligence - BI)
BI – это методы и инструменты для построения отчётов, необходимых для принятия управленческих решений.
BI – это инструменты, используемые для преобразования, хранения, анализа, моделирования, доставки информации в ходе работы над задачами, связанными с принятием решений на основе фактических данных.
В BI входят средства ETL, аналитические хранилища данных и средства Data Mining.
101
Средства ETL
ETL (от англ. Extract, Transform, Load «извлечение,
преобразование, загрузка») - один из основных процессов в управлении хранилищами данных, который включает в себя:
извлечение данных из внешних источников;
трансформация и очистка данных в соответствии с нуждами бизнес-модели;
загрузка в хранилище данных.
OLTP 1
ETL OLAP
OLTP 2
OLTP n
Интеллектуальный анализ данных
(Data Mining)
Data Mining переводится как “добыча” или “раскопка данных”.
Также используют термины “обнаружение знаний в базах данных” и “интеллектуальный анализ данных” - ИАД.
ИАД – это:
1.поиск функциональных и логических закономерностей в накопленной информации;
2.построение моделей, которые прогнозируют развитие некоторых процессов.
ИАД выполняется на основе многомерных хранилищ данных для решения задач:
прогнозирования;
стратегического планирования;
анализа рисков.
103
Отличие Data Mining от OLAP
Если в OLAP обычно формулируются вопросы типа
“Каково среднее число неоплаченных счетов заказчиками данной услуги?”,
то в Data Mining - вопросы типа ”Существует ли типичная категория клиентов, не оплачивающих счета?”.
Термин “Data Mining” обозначает сам процесс поиска тенденций, взаимосвязей и закономерностей
посредством различных математических и статистических алгоритмов:
кластеризации, создания субвыборок, регрессионного и корреляционного анализа.
104
Сферы применения ИАД
Методы ИАД используют коммерческие предприятия, развертывающие проекты на основе ИХ данных.
Опыт таких предприятий показывает, что отдача от использования ИАД может достигать 1000%.
Например, годовая экономия за счет внедрения ИАД в сети универсамов в Великобритании составила 700 тыс. долл. ИАД может использоваться в:
розничной торговле – анализ покупательской корзины, прогноз характера потребностей отдельных категорий покупателей и т. д.;
банковском деле – выявление мошенничества с кредитными карточками, прогнозирование изменений клиентуры и т. д.;
cтраховании – выявление мошенничества, анализ
риска и т. д. |
105 |
Концепция Хранилищ Данных (ХД)
Данные в ХД (Data Warehouse) представляют собой
пополняемый набор, единый для всего предприятия и
позволяющий восстановить картину деятельности предприятия на любой момент времени.
Автором концепции является Б. Инмон, который определил следующие характеристики для хранящихся наборов данных:
предметно-ориентированные;
интегрированные;
неизменчивые;
поддерживающие хронологию;
организованные для целей поддержки управления.
ХД обеспечивают менеджеров и аналитиков достоверной
информацией, необходимой для оперативного |
|
анализа и принятия решений. |
106 |
Концепция Хранилищ Данных (ХД)
Все данные о бизнес объекте собираются (обычно из множества различных источников), очищаются, согласовываются (согласование определяет достоверность данных), агрегируются и представляются в единой, удобной для их использования в бизнес анализе форме.
Исходные (исторические) данные, после того как они были согласованы и внесены в общекорпоративное хранилище, остаются неизменными и
используются только в режиме чтения.
Без поддержки хронологии (наличия исторических данных) не могут быть решены задачи прогнозирования и анализа тенденций.
107
Хранилища данных (DWH)– источник данных для BI
Основополагающие идеи концепции Хранилищ Данных
1.Интеграция ранее разъединенных детализированных данных (исторические архивы, данные из традиционных СОД, данные из внешних источников) в едином ХД.
2.Разделение наборов данных, используемых для
операционной обработки, и наборов данных,
используемых для решения задач анализа.
3.Хранение данных в многомерном информационном пространстве (также как в OLAP).
Концепция ХД – это концепция подготовки данных для анализа.
В ХД содержатся гигабайты и терабайты информации.
109
Витрины Данных (ВД)
Концепция Витрин Данных (Data Mart) была предложена в 1991 г.
ВД – это множество тематических БД, содержащих информацию, относящуюся к отдельным аспектам деятельности организации.
Витрина данных (Data Mart) может представляет собой узкоспециализированную подсистему хранилища данных (Data Warehouse), его отдельный элемент.
В этом случае под витриной данных понимается хранилище данных, обслуживающее одно из направлений деятельности компании.
110