Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ИТ экзамен.docx
Скачиваний:
213
Добавлен:
13.06.2017
Размер:
891.15 Кб
Скачать

67. Технологии Data Mining. Уровни знаний, извлекаемых из данных с использованием субд, olap, Data Mining.

Data Mining - это технология анализа информации с целью нахожденияв уже накопленных предприятием данныхранее неизвестных, но практически полезных знаний, необходимых для принятия решений в различных областях человеческой деятельности.

Data Mining( переводится как “добыча” или “раскопка данных”) -это процесс нахождения скрытых закономерностей в уже существующих данных.

делает все вместо аналитика

Эта технология Data Mining предназначена для решения задач интеллектуального анализа данных.

Data Mining- процесс обнаружения данных в:

  1. ранее неизвестных и нетривиальных;

  2. практически полезных и доступных интерпретаций знаний;

  3. необходимых для принятия решения.

На рисунке 32 представлены уровни знаний, которые можно извлечь из данных с использованием СУБД, OLAP, Data Mining.

Рисунок 32 - Уровни знаний, извлекаемых из данных

68. Технологии Data Mining. Типы закономерностей, которые позволяют выявлять методы Data Mining.

Data Mining - это технология анализа информации с целью нахожденияв уже накопленных предприятием данныхранее неизвестных, но практически полезных знаний, необходимых для принятия решений в различных областях человеческой деятельности.

Data Mining( переводится как “добыча” или “раскопка данных”) -это процесс нахождения скрытых закономерностей в уже существующих данных.

делает все вместо аналитика

Эта технология Data Mining предназначена для решения задач интеллектуального анализа данных.

Data Mining- процесс обнаружения данных в:

  1. ранее неизвестных и нетривиальных;

  2. практически полезных и доступных интерпретаций знаний;

  3. необходимых для принятия решения.

Типы закономерностей, которые позволяют выявлять методы Data Mining

Методы Data Mining позволяют выявлять пять стандартных типов закономерностей:

Ассоциация. Ассоциацияуказывает на связь между несколькими событиями, объектами, товарами. Используя ассоциативную связь между объектами, можно выявить, например, «связанные» товары, т.е. товары, которые покупают друг с другом. Это поможет использовать информацию для маркетинговых кампаний.

Последовательность.Предполагает, что существует цепочка объектов или событий, которая связана по времени. Используя последовательные правила, можно выявить связанные объекты и собятия, следующие друг за другом. Например, новоселы по статистике после покупки квартиры вначале покупают холодильник (в течение 2 недель), потом кухонную плиту (в течении месяца).

Классификация.Предполагает отнесение объектов к разным группам на основе классификационных признаков (признаков сходства или различия). Первоначально выявляются признаки сходства или различия, которые характеризуют группу, далее отбираются принадлежащие к группе объекты. Классы, к которым может быть отнесен тот или иной объект, заранее известны.

Кластеризация. С помощью методов кластеризации выделяются различные однородные группы данных. Существуют разные алгоритмы кластеризации и все они разделяют множества на подмножества и оценивают параметры распределения каждого подмножества. Кластеризация похожа на классификацию, но отличается от нее тем, что сами группы данных заранее не заданы.

Прогнозирование. Для прогнозирования используют статистические и математические методы, экспертные методы. Они основаны на работе с ретроспективной, исторической информацией, хранящейся в различных Базах данных, или, что еще лучше, в Хранилищах данных. Алгоритмы прогнозирования помогают отразить динамику поведения показателей и с их помощью адекватно предсказать поведение объектов в будущем.