Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Ставропольский Государственный Аграрный Университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

3_Необходимость анализа данных

.pdf

Скачиваний:

Добавлен:

06.05.2015

Размер:

3.11 Mб

Скачать

☆

<<< < Предыдущая 12 / 42 3 4 > Следующая >>>

Поиск прибыльных	Потребности
клиентов	клиентов

	Упреждение смены	Предсказание
	клиентов (анализ
		продаж
	лояльности)

Ton 10 бизнес		Ранг	Ton 10 ИТ приоритетов		Ранг
приоритетов 2013		Ранг	2013		Ранг
приоритетов 2013			2013

Повышение	темпов роста	1	Аналитика и BI		1
компании		1	Аналитика и BI		1

Достижение операционных		2	Мобильные технологии		2
результатов		2	Мобильные технологии		2

Снижение	издержек	3	Облачные	вычисления	3
компании		3	(SaaS, IaaS, PaaS)		3

Привлечение	и удержание	4	Технологии	совместной	4
клиентов		4	работы		4

Улучшение ИТ-приложений		5	Модернизация		5
и инфраструктуры		5	существующих решений		5

Создание новых продуктов		6	ИТ-управление		6
и услуг (новаторство)		6	ИТ-управление		6

Повышение эффективности		7	CRM		7

Привлечение	и удержание	8	Виртуализация		8
сотрудников		8	Виртуализация		8

Внедрение	аналитики и		Безопасность
систем	обработки	9	Безопасность		9
больших данных

Выход на новые рынки и		10	ERP-приложения		10
расширение географии		10	ERP-приложения		10

Методика извлечения знаний

Несмотря на разнообразие бизнес-задач почти все они могут решаться по единой методике. Эта методика, зародившаяся в

1989 г., получила название Knowledge Discovery in Databases

– извлечение знаний из баз данных. Она описывает не

конкретный алгоритм или математический аппарат, а

последовательность действий, которую необходимо выполнить для обнаружения полезного знания. Методика не зависит от предметной области; это набор атомарных

операций, комбинируя которые, можно получить нужное

решение. KDD включает в себя этапы подготовки данных, выбора информативных признаков, очистки, построения моделей, постобработки и интерпретации полученных результатов. Ядром этого процесса являются методы Data

Mining, позволяющие обнаруживать закономерности и знания

(рис. 2).

Knowledge Discovery in Databases – процесс получения из данных знаний в виде зависимостей, правил, моделей, обычно состоящий из таких этапов, как выборка данных, их

очистка и трансформация, моделирование и интерпретация

полученных результатов.

Этапы KDD

Решение подавляющего большинства бизнес-задач сводится к процессу KDD.

Data Mining

Термин Data Mining дословно переводится как «добыча данных» или «раскопка данных» и имеет в англоязычной среде несколько определений.

Data Mining – обнаружение в «сырых» данных ранее

неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности.

Нередко KDD отождествляют с Data Mining. Однако правильнее считать Data Mining шагом процесса

KDD.

Data Mining – это не один метод, а совокупность большого числа различных методов обнаружения знаний. Существует несколько условных

классификаций задач Data Mining.

Мы будем говорить о четырех базовых классах задач:

Классификация – это установление зависимости дискретной выходной переменной от входных переменных.

Регрессия – это установление зависимости непрерывной выходной переменной от входных переменных.

Кластеризация – это группировка объектов (наблюдений, событий) на основе данных, описывающих свойства объектов. Объекты внутри кластера должны быть похожими друг на друга и отличаться от других, которые вошли в другие кластеры.

Ассоциация – выявление закономерностей между связанными событиями. Примером такой закономерности служит правило, указывающее, что из события X следует событие Y. Такие правила называются ассоциативными. Впервые эта задача была предложена для нахождения типичных шаблонов покупок, совершаемых в супермаркетах, поэтому иногда ее называют анализом рыночной корзины (market basket analysis). Если же нас интересует последовательность происходящих событий, то можно говорить о последовательных шаблонах – установлении закономерностей между связанными во времени событиями. Примером такой закономерности служит правило, указывающее, что из события X спустя время t последует событие Y.

Для решения вышеперечисленных задач используются

различные методы и алгоритмы Data Mining. Ввиду того что Data Mining развивается на стыке таких дисциплин, как математика, статистика, теория информации, машинное обучение, теория баз данных, программирование,

параллельные вычисления, вполне закономерно, что

большинство алгоритмов и методов Data Mining были разработаны на основе подходов, применяемых в этих дисциплинах

На сегодняшний день наибольшее распространение

в Data Mining получили методы машинного обучения: деревья решений, нейронные сети, ассоциативные правила и т. д.

Машинное обучение (machine learning) – обширный

подраздел искусственного интеллекта, изучающий методы построения алгоритмов, способных обучаться на данных.

Общая постановка задачи обучения следующая. Имеется множество объектов (ситуаций) и множество возможных ответов (откликов, реакций). Между ответами и объектами существует некоторая зависимость, но она неизвестна. Известна только

конечная совокупность прецедентов – пар вида

«объект – ответ», – называемая обучающей выборкой. На основе этих данных требуется обнаружить зависимость, то есть построить модель,

способную для любого объекта выдать достаточно

точный ответ. Чтобы измерить точность ответов, вводится критерий качества.

Decision Association Clustering

Trees Rules

Naïve	Sequence	Time Series
Bayes	Clustering

Neural	Linear	Logistic
Nets	Regression	Regression

<<< < Предыдущая 12 / 42 3 4 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
12.04.201567.07 Кб123 Спланхнология..doc
#
16.07.2019182.46 Кб5309326.rtf
#
12.04.201539.7 Кб1331-60_bukh_uchetu (1).docx
#
12.04.201549.29 Кб535-50.docx
#
10.11.2019466.47 Кб3362981.rtf
#
06.05.20153.11 Mб173_Необходимость анализа данных.pdf
#
01.08.201984.48 Кб544_eshe_otvety.doc
#
12.04.201517.59 Кб185 вопрос методы финансового анализа.docx
#
12.04.2015496.73 Кб47519883.rtf
#
12.04.2015174.59 Кб1153 гос. регистр.doc
#
10.11.2019785.71 Кб6570512.rtf