Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

2_Анализ бизнес информации - основные принципы

.pdf
Скачиваний:
36
Добавлен:
06.05.2015
Размер:
1.35 Mб
Скачать

1 Характеристика методов решения аналитических задач

2 Методика извлечения знаний из баз данных

1 Характеристика методов решения аналитических задач

Выдвижение гипотез

Сбор и систематизация данных

Построение модели, объясняющей имеющиеся факты

Тестирование модели и интерпретация результатов

Применение полученной модели

Главным лицом в процессе анализа данных является эксперт – специалист в предметной области.

Несмотря на то, что существует большое количество аналитических задач, методы их решения можно поделить на 2 категории:

Извлечение и визуализация данных

Построение и использование моделей

предметной области)

предположение)

Построение моделей: прогнозирование, кластеризация, классификация…

результатов

В случае визуализации эксперт формулирует некоторым образом запрос к системе, извлекает нужную информацию из различных источников и просматривает полученные результаты.

На основе имеющихся сведений он делает выводы, которые и являются результатом анализа. Существует множество способов визуализации данных:

OLAP (кросс-таблицы и кроссдиаграммы)

Таблицы, диаграммы, гистограммы Карты, проекции, срезы и прочие

Достоинства:

Простота создания

Работа на данных малого объема и низкого качества

Возможность использования экспертных знаний

Недостатки:

Неспособность обрабатывать большие объемы

Неспособность анализа сложных закономерностей

Сильная зависимость от конкретного эксперта

Отсутствие возможности тиражирования

2 Методика извлечения знаний из баз данных

Построение моделей является универсальным способом изучения окружающего мира. Этот способ позволяет обнаруживать зависимости, прогнозировать, разбивать на группы и решать множество других интеллектуальных задач.

Но самое главное, что полученные таким образом знания можно тиражировать, т.е. построенную одним человеком модель могут применять другие без необходимости понимания методик, при помощи которых эти модели построены.

Несмотря на большое количество разнообразных бизнес-задач почти все они решаются по единой методике. Эта методика называется Knowledge Discovery in Databases.

Она описывает не конкретный алгоритм или математический аппарат, а последовательность действий, которую необходимо выполнить для построения модели (извлечения знания). Данная методика не зависит от предметной области, это набор атомарных операций, комбинируя которые можно получить нужное решение.

Источники данных

Исходные данные

Выборка

Очищенные данные

Очистка

Трансформированные данные

Трансформация

(шаблоны)

Data Mining

Знания

Интерпретация

Первым шагом в анализе является получение исходной выборки. На основе этих данных и строятся модели. На этом шаге необходимо активное участие эксперта для выдвижения гипотез и отбора факторов, влияющих на анализируемый процесс. Желательно, чтобы данные были уже собраны и консолидированы. Крайне необходимо наличие удобных механизмов подготовки выборок.

Чаще всего в качестве источника рекомендуется использовать специализированное хранилище данных, агрегирующее всю необходимую для анализа информацию.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]