Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Kniga_Osnovy_informatiki_i_informatsionnyh_tehn....doc
Скачиваний:
46
Добавлен:
21.04.2019
Размер:
2.84 Mб
Скачать

11.2.4. Системы извлечения знаний

Деятельность любой крупной организации во многом зависит от положения, складывающегося на финансовых и товарных рынках как внутри страны, так и за ее пределами, а также от изменений в социальной и общественно-политической сферах жизни общества. Своевременность и объективность информации, получаемой руководством компании, во многом определяют качество управления и стратегического планирования. В настоящее время существует огромное количество источников информации (Internet, радио, телевидение, печатные издания и т.д.), темпы ее появления и изменения очень высокие, поэтому обработка ее ручным способом становится невозможной.

В связи с этим очень важную роль начинают играть информационные ресурсы (под ИР понимается совокупность информации как продукт интеллектуальной деятельности населения) и особенно системы их анализа и обработки. Без эффективного управления накопленной стратегической и оперативной информацией никакая компания не сможет сегодня выдержать новых условий рынка. Необходимы аналитические решения на базе информационных складов, которые позволят оперативно отвечать на текущие вопросы, поддерживать бизнес-процессы и распознавать возможности их совершенствования.

Для осмысленного использования информации стали незаменимыми новые интеллектуальные технологии анализа данных, которые дают возможность извлекать информацию (знания) из баз данных большого объема и глобальных информационных сетей. Для их обозначения используют такие названия, как «системы извлечения знаний», «системы добычи знаний», «DM-системы» (date mining) и некоторые другие.

Рассмотрим основные особенности таких систем:

Обеспечение автоматического выявления причинно-следственных связей между атрибутами в реляционных БД. С их помощью можно получить ответы на такие вопросы, как: Какие факторы способствуют увеличению числа продаж того или иного товара? Какие события влияют на изменения котировок ценных бумаг? Если контролируемым параметром выступает время, то тогда появляется возможность отображать динамику валютных торгов, прогнозы пополнения сырьевых запасов и т.д. Кроме того, современные системы извлечения знаний способны не только находить корреляционные зависимости, но и оценивать вероятность каждой гипотезы. Наиболее мощные системы используют аппарат нечеткой логики и оперируют как количественными, так и качественными параметрами – «популярный», «прибыльный», «стабильный» и др.

Автоматическая кластеризация данных для ответов. Например, можно получить ответы на такие вопросы: «На какие группы делятся клиенты банка?», «Какая группа наиболее представительна?». Пользователи могут также узнать параметры кластеризации такие, как количество и размер кластеров, черты типичного представителя данного класса объектов, четкость границ и др.

 Возможность автоматизированной обработки неструктурной текстовой информации.

 Способность к генерации итоговых отчетов в форме, максимально приближенной к тексту на естественном языке.

 Широта возможностей визуализации информации.

Самые сложные системы (например, Prism фирмы Nestor) включают в себя все известные виды интеллектуальных программ: экспертные системы, нечеткую логику, нейронные сети, генетические алгоритмы, теорию хаоса, поэтому хорошо зарекомендовали себя в условиях неполноты, зашумленности, противоречивости информационных потоков.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]