- •Информатика курс лекций Оглавление
- •Общая характеристика процессов сбора, передачи, обработки и накопления информации
- •Информатика и информационные технологии
- •Назначение и области применения эвм. Персональный компьютер
- •Классификация по типоразмерам
- •Классификация по совместимости
- •Классификация по типу используемого процессора
- •Состав вычислительной системы
- •Аппаратное обеспечение
- •Устройства ввода данных
- •Устройства вывода данных
- •Устройства хранения данных
- •Устройства обмена данными
- •Программное обеспечение. Уровни программного обеспечения
- •Базовый уровень
- •Системный уровень
- •Сервисный уровень
- •Прикладной уровень
- •Система bios
- •Системные программы
- •Сервисные программные средства
- •Операционные системы
- •Состав операционной системы
- •Назначение программ оболочек
- •Операционная среда
- •Архитектура клиент-сервер, рабочая группа
- •Операционные среды сервера и рабочей станции
- •Метафора рабочего стола в Windows
- •Основные термины Windows и их значение
- •Значки и ярлыки объектов
- •Функции операционной среды
- •Прочие функции операционных систем
- •Стандартные программы в составе Windows
- •Новые версии ос
- •Информационные технологии создания и обработки текстовых документов. Текстовые редакторы и процессоры
- •Web-документы
- •Текстовые документы
- •Таблицы
- •Создание электронных презентаций средствами Microsoft PowerPoint
- •Обработка данных средствами электронных таблиц ms Excel
- •Табличные процессоры
- •Основные понятия электронных таблиц
- •Ввод, редактирование и форматирование данных
- •Вычисления в электронных таблицах
- •Ссылки абсолютные и относительные
- •Копирование содержимого ячеек
- •Автоматизация ввода
- •Использование стандартных функций
- •Построение диаграмм и графиков
- •Технологии анализа данных в Microsoft Excel
- •Технология подбора параметра
- •Сценарный подход
- •Таблицы подстановки
- •Поиск решения
- •Статистический анализ и прогнозирование
- •Построение базы данных
- •Базы данных. Microsoft Access
- •1. Краткая характеристика Microsoft Access
- •2. Функциональные возможности ms Access
- •3. Характеристика сферы применения «настольных» субд
- •Локальные и глобальные компьютерные сети
- •Общие сведения о сетевых взаимодействиях
- •Локальные вычислительные сети
- •Назначение и тип сервера
- •Корпоративные сети
- •Интернет
- •Услуги Интернет
- •Браузер и его назначение
- •Электронный адрес
- •Службы Интернет
- •Основные понятия www
- •Основы и методы защиты информации
- •Компьютерная безопасность
- •Методы защиты от компьютерных вирусов
- •Несанкционированное проникновение
- •Защита от удаленного администрирования
- •Средства защиты данных на путях транспортировки
- •Алгоритмизация и программирование
- •Решение задачи на эвм
- •Этапы создания программных средств
- •Языки программирования
- •Компиляторы и интерпретаторы
- •Уровни языков программирования
- •Поколения языков программирования
- •Языки программирования высокого уровня
- •Языки программирования баз данных
- •Языки программирования для Интернета
- •Интегрированные системы программирования
- •Среды быстрого проектирования
- •Архитектура программных систем
- •Объектно-ориентированное программирование
- •Проектирование программ
- •Использование универсальных пакетов
- •Системы обработки данных
- •Основные тенденции и перспективы развития информатики и информационных технологий
- •Искусственный интеллект
- •Экспертные системы
- •Нейронные системы
- •Системы извлечения знаний
- •Краткий словарь терминов
- •Список сокращений
Системы извлечения знаний
Прорыв в области высокоскоростных коммуникаций, ориентация сети Internetна реализацию коммерческих приложений привели к тому, что объем данных, требующих осмысленной обработки, возрос настолько, что появилась реальная потребность в недорогих, простых в обращении, но достаточно гибких программах для осмысленного анализа лавинообразного потока «сырой» информации. В результате этого спроса возник рынок интеллектуальных систем нового поколения. Стали появляться программы, способные самостоятельно, без предварительного обучения на опыте эксперта, извлекать информацию (знания) из баз данных большого объема и глобальных информационных сетей. Многие из этих программ были выпущены на рынок не совсем доработанными, что объясняется стремлением их производителей закрепиться в новой рыночной нише, однако темпы роста нового рынка и интерес, проявляемый к нему со стороны бизнесменов и политиков, позволяют специалистам предсказывать ему большое будущее.
В настоящее время нет строго определенного термина, обозначающего новый класс интеллектуальных систем.
Чаще всего в литературе для их обозначения используется англоязычное словосочетание «datamining». В русскоязычном варианте можно встретить названия: «системы добычи данных (знаний)», «системы извлечения знаний», DM-системыи некоторые другие.
Наиболее важными отличительными особенностями систем, относимых к DM-системам.
1.Прежде всего, DM-системыобеспечивают автоматическоевыявление корреляций между различными атрибутами элементов данных в реляционных БД.С их помощью можно получить ответы, например, на такие вопросы, как: «Какие факторы способствуют увеличению числа продаж того или иного товара? Какие события влияют на изменения котировок ценных бумаг? Какова общая картина политических симпатий избирателей по регионам?» Часто в качестве одного из контролируемых параметров выступает шкала времени, тогда система имеет возможность отображать динамику валютных торгов, прогнозы пополнения сырьевых запасов, эволюцию взглядов электората.
Современные DM-системыспособны не только находить корреляционные зависимости, но и оценивать вероятность каждой гипотезы. А наиболее мощные системы, использующие аппарат нечеткой логики, способны оперировать как количественными, так и качественными параметрами —«популярный», «прибыльный», «стабильный» и др.
2.Важной функцией DM-системявляется автоматическая кластеризация данныхдля ответов, например, на такие вопросы: «На какие группы делятся клиенты страховой компании?» «Какая группа наиболее представительна?» «Какая наиболее доходна?» Обычно пользователей интересует не только количество и размер кластеров, но и расположение их центров, характеризующее черты типичного представителя данного класса объектов, четкость границ и многие другие параметры.
3.Следующим важным атрибутом больших DM-систем является возможность автоматизированной обработки неструктурированной текстовой информации.
4.Еще одна важная особенность —каждая DM-системав той или иной степени обладаетспособностью генерировать итоговые отчеты в форме, максимально приближенной к тексту на естественном языке.
Для решения основной задачи DM-систем —выделения корреляционных зависимостей между данными —чаще всего используются три подхода:многомерный корреляционный анализ, обработка гипотез по принципу «запрос-отчет»и так называемые«интеллектуальные агенты».
Основными потребителями систем искусственного интеллекта в настоящее время являются военно-промышленные комплексы, а также финансовые и банковские структуры. Индустриальные компании, обладающие исследовательским потенциалом, обычно идут по пути создания собственных систем для обработки технической, управленческой и маркетинговой информации.