- •Курсовая работа
- •Киев-2012 Содержание
- •8.1. Медицина______________________________________________23
- •8.2 Молекулярная генетика и генная инженерия_________________23
- •8.3 Прикладная химия________________________________________24
- •Введение
- •1. Почему растет популярность Data Mining?
- •2. Определение Data Mining
- •3. Области применения Data Mining
- •4. Типы закономерностей
- •5. Классы систем Data Mining
- •6. Инструментарий технологии Data Mining
- •8. Специальные приложения
- •8.1. Медицина
- •8.2. Молекулярная генетика и генная инженерия
- •8.3. Прикладная химия
- •9. Data Mining. Мультидисциплинарная область
- •10. Класиффикация стадий Data Mining
- •10.1. Свободный поиск (Discovery)
- •10.2. Прогностическое моделирование (Predictive Modeling)
- •Сравнение свободного поиска и прогностического моделирования с точки зрения логики
- •10.3. Анализ исключений (forensic analysis)
- •11. Класиффикация методов Data Mining.
- •Список литературы
Национальный авиационный университет
Факультет компьютерных наук
Кафедра информационных технологий
Курсовая работа
по дисциплине: «Сетевые информационные технологии»
на тему: «Технологии интеллектуального анализа данных или Data mining технологии»
Выполнила: студентка ФКН УС-502 Морарь Ю.В.
Проверила: Климова А.С.
Киев-2012 Содержание
Введение_________________________________________________3
1. Почему растет популярность Data Mining?_________________________4
2. Определение Data Mining_________________________________________6
3. Области применения Data Mining__________________________________8
4. Типы закономерностей__________________________________________14
5. Классы систем Data Mining______________________________________15
6. Инструментарий технологии Data Mining__________________________20
7. Важное положение Data Mining__________________________________22
8. Специальные приложения________________________________________23
8.1. Медицина______________________________________________23
8.2 Молекулярная генетика и генная инженерия_________________23
8.3 Прикладная химия________________________________________24
9. Data Mining. Мультидисциплинарная область_______________________18
10. Класиффикация стадий Data Mining______________________________26
10.1. Свободный поиск (Discovery)_____________________________26
10.2. Прогностическое моделирование__________________________28
10.3. Анализ исключений (forensic analysis)_______________________31
11. Класиффикация методов Data Mining____________________________32
11.1. Статистические методы Data mining______________________35
11.2. Кибернетические методы Data Mining_____________________37
Выводы_________________________________________________38
Список литературы______________________________________41
Введение
Data Mining - это процесс обнаружения в сырых данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности. Суть и цель технологии Data Mining можно охарактеризовать так: это технология, которая предназначена для поиска в больших объемах данных неочевидных, объективных и полезных на практике закономерностей. Неочевидных - это значит, что найденные закономерности не обнаруживаются стандартными методами обработки информации или экспертным путем. Объективных - это значит, что обнаруженные закономерности будут полностью соответствовать действительности, в отличие от экспертного мнения, которое всегда является субъективным. Практически полезных - это значит, что выводы имеют конкретное значение, которому можно найти практическое применение. (Григорий Пиатецкий-Шапиро)
Традиционные методы анализа данных (статистические методы) и OLAP в основном ориентированы на проверку заранее сформулированных гипотез (verification-driven data mining) и на "грубый" разведочный анализ, составляющий основу оперативной аналитической обработки данных (OnLine Analytical Processing, OLAP), в то время как одно из основных положений Data Mining - поиск неочевидных закономерностей. Инструменты Data Mining могут находить такие закономерности самостоятельно и также самостоятельно строить гипотезы о взаимосвязях. Поскольку именно формулировка гипотезы относительно зависимостей является самой сложной задачей, преимущество Data Mining по сравнению с другими методами анализа является очевидным.