Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Технологии интеллектуального анализа данных.docx
Скачиваний:
78
Добавлен:
03.09.2019
Размер:
118.34 Кб
Скачать

Национальный авиационный университет

Факультет компьютерных наук

Кафедра информационных технологий

Курсовая работа

по дисциплине: «Сетевые информационные технологии»

на тему: «Технологии интеллектуального анализа данных или Data mining технологии»

Выполнила: студентка ФКН УС-502 Морарь Ю.В.

Проверила: Климова А.С.

Киев-2012 Содержание

Введение_________________________________________________3

1. Почему растет популярность Data Mining?_________________________4

2. Определение Data Mining_________________________________________6

3. Области применения Data Mining__________________________________8

4. Типы закономерностей__________________________________________14

5. Классы систем Data Mining______________________________________15

6. Инструментарий технологии Data Mining__________________________20

7. Важное положение Data Mining__________________________________22

8. Специальные приложения________________________________________23

8.1. Медицина______________________________________________23

8.2 Молекулярная генетика и генная инженерия_________________23

8.3 Прикладная химия________________________________________24

9. Data Mining. Мультидисциплинарная область_______________________18

10. Класиффикация стадий Data Mining______________________________26

10.1. Свободный поиск (Discovery)_____________________________26

10.2. Прогностическое моделирование__________________________28

10.3. Анализ исключений (forensic analysis)_______________________31

11. Класиффикация методов Data Mining____________________________32

11.1. Статистические методы Data mining______________________35

11.2. Кибернетические методы Data Mining_____________________37

Выводы_________________________________________________38

Список литературы______________________________________41

Введение

Data Mining - это процесс обнаружения в сырых данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности. Суть и цель технологии Data Mining можно охарактеризовать так: это технология, которая предназначена для поиска в больших объемах данных неочевидных, объективных и полезных на практике закономерностей. Неочевидных - это значит, что найденные закономерности не обнаруживаются стандартными методами обработки информации или экспертным путем. Объективных - это значит, что обнаруженные закономерности будут полностью соответствовать действительности, в отличие от экспертного мнения, которое всегда является субъективным. Практически полезных - это значит, что выводы имеют конкретное значение, которому можно найти практическое применение. (Григорий Пиатецкий-Шапиро)

Традиционные методы анализа данных (статистические методы) и OLAP в основном ориентированы на проверку заранее сформулированных гипотез (verification-driven data mining) и на "грубый" разведочный анализ, составляющий основу оперативной аналитической обработки данных (OnLine Analytical Processing, OLAP), в то время как одно из основных положений Data Mining - поиск неочевидных закономерностей. Инструменты Data Mining могут находить такие закономерности самостоятельно и также самостоятельно строить гипотезы о взаимосвязях. Поскольку именно формулировка гипотезы относительно зависимостей является самой сложной задачей, преимущество Data Mining по сравнению с другими методами анализа является очевидным.