- •Бизнес-аналитика. Основные понятия, определения. Роль аналитических систем в общей архитектуре корпоративной информационной системы уровня предприятия.
- •Хранилище данных. Концепция построения и использования. Архитектура физической и виртуальной реализации Хранилища данных. Витрина данных.
- •Организация Хранилища данных, детальные данные, агрегированные данные, метаданные. Извлечение, преобразование, загрузка данных в Хранилища данных (etl процесс).
- •Возможная архитектура реализации хранения данных в системе olap (molap, holap или rolap). Сравнительные преимущества и недостатки для выбора.
- •Назначение оlap системы, основные пользователи, многомерная модель данных, рынок по. Признаки, определяющие принадлежность системы к классу оlap систем.
- •Интеллектуальный анализ данных, определение, основные особенности. Классификация задач Data Mining
- •Практическое применение Data Mining – прикладные задачи для банков, используемые методы.
- •Задачи кластеризации. Постановка задачи, базовые алгоритмы решения, достоинства и недостатки. Применение задачи кластеризации в банковской сфере.
- •Этапы методики извлечения знаний. Особенности и значимость каждого этапа.
- •Платформа Deductor. Возможности, архитектура, решаемые задачи.
Бизнес-аналитика. Основные понятия, определения. Роль аналитических систем в общей архитектуре корпоративной информационной системы уровня предприятия.
Бизнес-аналитика— это методы и инструменты для построения информативных отчётов о текущей ситуации.Бизнес-аналитика— это инструменты, используемые для преобразования, хранения, анализа, моделирования, доставки и трассировки информации в ходе работы над задачами, связанными с принятием решений на основе фактических данных. Итак,бизнес-аналитика – это представление некоторого явления нашей жизни (в нашем случае бизнеса, организации) в виде модели, отражающей его структуру, для облегчения понимания всеми заинтересованными сторонами.
Основная идея BI: - организация доступа конечного пользователя к информации - анализ структурированных данных и информации о бизнесе.
Методы анализа данных – направляется пользователем. Средства для анализа:
- Пакеты статистического анализа
- Средства моделирования
- Пакеты для нейронных сетей
- Средства нечеткой логики и экспертные системы.
Методы разведки данных (datamining) – специализированные алгоритмы, устанавливающие взаимоотношения и тенденции свободные от мнения пользователя. (отбор признаков, кластеризация, стратификация, визуализация и регрессия)
Бизнес - игра, в которой нет и не может быть единственно правильных ходов.
Накоплен набор возможных ситуаций и процедур их реализации. (Формализация - алгоритм)
Для конфликтных, незапланированных ситуаций приходится импровизировать. (На любом уровне управления)
Регулярный менеджмент - это не панацея от всех бед, а работа по принятию решений на основе располагаемой информации.
Для принятия решений есть общие принципы и подходы, которые следует учитывать. (Необходимо знать «7 нот менеджмента», но не достаточно ...)
Архитектура современной иас
Аналитические технологии- это методики, которые на основе каких-либо моделей, алгоритмов, математических теорем позволяют по известным данным оценить значения неизвестных характеристик и параметров.
Аналитические технологии нужны в первую очередь людям, принимающим важные решения - руководителям, аналитикам, экспертам, консультантам.
Доход компании в большой степени определяется качеством этих решений - точностью прогнозов, оптимальностью выбранных стратегий.
Прогнозирование:
курсов валют
цен на сырье
спроса
дохода компании
уровня безработицы
числа страховых случаев
Оптимизация:
расписаний
маршрутов
плана закупок
плана инвестиций
стратегии развития
Хранилище данных. Концепция построения и использования. Архитектура физической и виртуальной реализации Хранилища данных. Витрина данных.
В результате успешного функционирования OLTP-систем было собрано много данных. Собранные данные хранили информацию, которая могла служить основой анализа для целей стратегического совершенствования бизнеса. Появилась необходимость создания систем, которые были нацелены на накопление данных и операции их последующей обработки.
Хранилище данных– разновидность систем хранения, ориентированная на поддержку процесса анализа данных, обеспечивающая целостность, непротиворечивость и хронологию данных, а также высокую скорость выполнения аналитических запросов.
Определение Инмона- предметно-ориентированный, интегрированный,
неизменяемый и поддерживающий хронологию набор данных, предназначенный для обеспечения принятия управленческих решений.
В основе концепции ХД лежат следующие положения:
интеграция и согласование данных из различных источников, таких как обычные системы оперативной обработки, базы данных, учетные системы, офисные документы, электронные архивы, расположенные как внутри предприятия, так и во внешнем окружении;
разделение наборов данных, используемых системами выполнения транзакций и СППР.
Архитектура физ и вирт реализации.
Виртуальное хранилище данных – это система, представляющая интерфейсы и методы доступа к регистрирующей системе, которые эмулируют работу с данными в этой системе, как с хранилищем данных. Виртуальное хранилище данных можно организовать, создав ряд представлений (view) в базе данных, либо применив специальные средства доступа, например продукты класса Desktop OLAP, к которым относится, например, BusinessObjects, Brio Enterprise и другие.
Достоинства:
Простота создания
Работа на данных малого объема и низкого качества
Возможность использования экспертных знаний
Недостатки:
Неспособность обрабатывать большие объемы
Неспособность анализа сложных закономерностей
Сильная зависимость от конкретного эксперта
Отсутствие возможности тиражирования
Виртуальные ХД не являются хранилищами данных в привычном понимании. В таких системах работа ведется с отдельными источниками данных, но при этом эмулируется работа обычного ХД. Иначе говоря, данные не консолидируются физически, а собираются непосредственно в процессе выполнения запроса.
Витрина данных (кубы)– срез хранилища данных, представляющий собой массив тематической, узконаправленной информации, ориентированный, например, на пользователей одной рабочей группы или департамента. По сути дела, ВД - это облегченный вариант ХД, существенно меньше по объему, чем корпоративный ХД, и для его реализации не требуется особо мощная вычислительная техника. При этом главная идея заключалась в том, что ВД максимально приближены к конечному пользователю и содержат только тематические подмножества заранее агрегированных данных, по размерам гораздо меньшие, чем общекорпоративное ХД, и, следовательно, требующие менее производительной техники для поддержания. Концепция ВД ориентирована исключительно на хранение, а не на обработку корпоративных данных.