- •Оглавление
- •Введение
- •Распределение часов курса по темам и видам работы
- • Литература
- •Конспект лекций
- •Вопрос 3. Классификация ис. Фактографические и документальные ис. Все многообразие ис классифицируется по присущим им признакам:
- •Лекция 3 Информационно-поисковые языки
- •Вопрос 2. Упорядочение лексических единиц ипя. Для упорядочения лексических единиц ипя служат парадигматические отношения, которые фактически определяют и задают структуру языка.
- •Вопрос 3. Требования к ипя. При разработке конкретного ипя учитываются:
- •Классификация информационно-поисковых языков
- •Вопрос 3. Методика построения и грамматика ипя дескрипторного типа. Разработка ипт осуществляется на основе следующих этапов:
- •Распределенные информационные системы
- •Вопрос 2. Система World Wide Web.
- •Экспертные системы
- •Вопрос 3. Виды эс. Экспертные системы создаются для решения разного рода проблем, но основные типы их деятельности можно сгруппировать в следующие категории:
- •Тематический поиск информации в сети интернет
- •Разработка структуры и создание базы данных "кадры"
- •Тестовые задания по курсу
- • Вопросы к зачету
Литература
Абдеев Р. Ф. Философия информационной цивилизации: Диалектика прогрессивной линии развития как гуманная общечеловеческая философия для XXI в.: Учебное пособие. — М.: ВЛАДОС, 1994.
Информатика. Практикум по технологии работы на компьютере / Под ред. И.В.Макаровой. – М.: Финансы и статистика, 2000.
Информатика: Учебник / Под ред. И.В.Макаровой. – М.: Финансы и статистика, 2001.
Криницкий Н.А., Миронов Г.А., Фролов Г.Д. Автоматизированные информационные системы. – Москва, 1982. – 384 с.
Попов И.И., Храмцов П.Б. Мировые информационные ресурсы и сети (методы доступа к ним): Учеб./ Под ред К.И. Курбакова. – Москва, 1999.
Ракитов А.И. Философия компьютерной революции. — М.: Политиздат, 1991.
Романенко А.Г., Самойлюк О.Ф. Информационно-поисковые системы. – Москва, 1998.
Сэлтон Г. Автоматическая обработка, хранение и поиск информации. – Москва, 1973.
Уэно Х., Кояма Т., Окамото Т. и др. Представление и использование знаний / Под ред. Х.Уэно, М.Исидзука / Пер. с япон. – М.: Мир, 1989.
Хохлов, Устименко Информатика. – Минск, 1991
Конспект лекций
ЛЕКЦИЯ 1
ИНФОРМАЦИОННЫЕ ПРОЦЕССЫ
Учебная презентация
Вопросы:
Источники информации. Основные понятия и определения.
Документальные информационные потоки (ДИП).
Понятие информационного процесса (сбор, обработка, хранение и поиск информации).
Вопрос 1. Источники информации. Основные понятия и определения. Источники информации подразделяются на документальные и фактографические. Документальный источник (документ) — это источник информации о фактах, событиях, явлениях реального мира и мыслительной деятельности человека, закрепленных различными способами на специальном носителе. Фактографический источник (фактографическое сообщение) — источник информации о конкретных фактах, фактических событиях или их совокупности, зафиксированных в определенной знаковой форме на каком-либо носителе. Любое фактографическое сообщение представлено в виде документа, но соотносится с ним как часть и целое.
Кроме фактографических сообщений существуют фактологические информационные сообщения, создаваемые путем последующей логической обработки фактографических сообщений и содержащие факты, которые отсутствуют в явном в виде в исходных материалах.
Документы, обращающиеся в сфере управления и коммуникаций, могут быть различных видов. В зависимости от знаковой формы представления информации различают документы:
текстовые (знак — алфавит естественного языка);
иконические (знак подобен обозначаемому объекту). Например, рисунки, фотографии, диапозитивы;
идеографические (знак — условное обозначение объекта). Как-то: географические карты, атласы, чертежи, схемы;
трех измерений (знак — сам материальный объект). Это — музейные экспонаты, исторические реликвии, образцы пород;
машиночитаемые (знак — специально разработанные коды). Например, перфоленты, магнитные диски, CD-диски. Кроме данного термина, существуют: виртуальный, цифровой, электронный документ;
аудиальные (звучащие, фонетические). Различные виды звукозаписи.
В свою очередь, текстовые документы подразделяются на первичные и вторичные. Первичные источники фиксируют результат человеческой деятельности. Дифференциация первичных источников происходит по различным аспектам: по способу размножения (опубликованные и неопубликованные); объему (микро и макроформные, промежуточные); по виду носителя (традиционные и нетрадиционные); содержанию (научные, технические, справочные, делопроизводственные и т.д.).
Вторичные документы и источники вторичной информации возникают в результате обработки и анализа первичных документов в различных информационных службах (аннотации, рефераты, библиографические описания, информационные издания и т.п.).
Вопрос 2. Документальны информационные потоки. Все множество первичных и вторичных документов, а также источников информации, целенаправленно передающихся по информационным каналам от отправителя к потребителю называется документальным информационным потоком.
Изучение ДИП в различных отраслях деятельности составляет одно из важных направлений документационного обеспечения управления, так как практически все процессы информационного обслуживания осуществляются на документальной основе. А исследование закономерностей потоков может содействовать повышению эффективности и оптимизации процессов управления.
Наибольшее распространение изучение ДИП получило в 1960-70-ых гг. в работах зарубежных ученых: Дж.Бернал, А.Лотка, Д.Прайс, российских: П.Рачков, Г.Добров.
Динамика роста ДИП характеризуется экспонентой и записывается формулой:
y=y0ekt
где y — количество документов в потоке;
y0 — их число в начале отсчета;
е=2,718 и составляет основание натурального логорифма;
t — временной интервал;
k — интенсивность прироста.
Экспоненциальный закон прироста документов был подтвержден многими исследованиями. В 1960-ых гг. мировой ДИП удваивался каждые 10-15 лет, в начале 1980-ых гг. -–через 12 лет, к середине 1980-ых гг. — через каждые 5 лет. В 1990ых гг. удвоение происходило каждые два года. В 2000 г.отечественный ДИП достиг примерно 8 млрд. единиц.
Это способствовало появлению так называемого "информационного взрыва" ("кризиса информации"). Данный термин относится не столько к чисто количественному росту потока, сколько к трудностям, которые возникают пути получения, обработки и освоения информации. Решение проблемы лежит в области разработки, внедрения компьютерных информационных систем (КИС, встречаются различные названия: информационно-поисковые системы, автоматизированные поисковые системы, информационные системы).
Вопрос 3. Понятие информационного процесса (сбор, обработка, хранение и поиск информации). Любая система действует в постоянной взаимосвязи с внешней средой. Осуществляется данная взаимосвязь посредством информации, которая по потокам прямой связи передает цель функционирования, команды управления от системы высокого уровня к системе более низкого звена, а по потокам обратной связи — все сведения, необходимые для регулирования процесса управления. Таким образом, взаимосвязь осуществляется с помощью информационных процессов. Под информационным процессом понимают взаимодействие между сообщением и отправителем/потребителем информации.
Совокупность сложных человеко-машинных информационных систем является важнейшей составляющей инфраструктуры общества, где информация выступает одним из главных его ресурсов. Поэтому является чрезвычайно важным понимание сути сложного технологического процесса сбора, передачи и обработки информации.
Сбор информации — процесс получения информационными службами сообщений всех видов по различным каналам связи. Система сбора информации представляет собой сложный программно-аппаратный комплекс. Как правило, современные системы не только обеспечивают кодирование информации и ее ввод в ЭВМ, но и выполняют первичную (предварительную) обработку этой информации.
К техническим средствам сбора информации относятся: алфавитно-цифровая клавиатура, сканеры и дигитайзеры, цифровые фотоаппараты и видеокамеры. В конечном счете любая информация попадает в ЭВМ в виде цифрового кода.
Информация очень разнообразна, сложна по структуре, размещается на различных носителях, может находиться в статичном и динамичном состояниях, поэтому каждый вид информации имеет свои технологии обработки, смысловую ценность, требования к точности, достоверности, формам представления.
Информационные сообщения, собранные по различным каналам связи, в дальнейшем подвергаются технической и научной обработке. Техническая обработка информации заключается в учете и регистрации поступающих сообщений. Научная обработка представляет собой информационный анализ и синтез сообщений и включает: синтаксический анализ — установление важнейших параметров информационного потока, включая необходимые количественные характеристики, для выбора технических средств последующей передачи, обработки, хранения информации; семантический анализ — изучение информации с точки зрения смыслового содержания ее отдельных элементов; прагматический анализ — определение полезности информации, используемой для управления.
Технология электронной обработки информации — это процесс исполнения взаимосвязанных операций, протекающих в установленной последовательности с целью преобразования первичной информации. Внутримашинная технология обработки информации реализует следующие типовые процессы преобразования первичной информации: формирование новых массивов информации, упорядочение информации, выборка из массива некоторых частей записи по условиям, по реквизитам, слияние и разделение массивов, внесение изменений, выполнение арифметических действий над данными или реквизитами.
ЛЕКЦИЯ 2
Информационная система
как средство реализации информационного поиска
Учебная презентация
Вопросы:
Информационный поиск.
Информационная система (ИС): понятие и структура.
Классификация ИС. Фактографические и документальные ИС.
Вопрос 1. Информационный поиск. Процесс, связанный с обеспечением сохранности собранных и обработанных данных, сведений для передачи их в пространстве и времени называется хранением информации. Сообщения, реализованные в определенной материальной форме, могут храниться в службах: документальной информации (книгохранилищах, музеях, архивов и т.л.); фактографической информации (редакции газет, телевидение, адресных столах, службах стандартов и т.д.); концептографической информации (службы патентной экспертизы, прогнозирования).
Документы, поступившие в информационные службы, подвергаются обработке и отправляются в хранилища, где располагаются в зависимости от принятой системы расстановки — формальной (алфавитная, хронологическая, языковая, номерная) или содержательной.
В результате аналитико-семантической переработки информации возникают вторичные документы, а также источники вторичной информации, которые также составляют содержание банков данных.
Для того, чтобы получить необходимые сведения осуществляют информационный поиск. Термин "информационный поиск" в научный обиход впервые ввел К. Муерс. Он понимал его как процесс поиска и выдачи информации в соответствии с ее тематическим содержанием. В настоящее время под информационным поиском понимается процесс нахождения в определенном упорядоченном множестве сообщений тех, которые соответствуют запросам потребителя или содержат необходимые потребителю факты и данные.
Информационный поиск реализуется с помощью информационных систем. Объектом информационного поиска могут быть первичные, вторичные документы, информационные издания, фактографические описания, прогнозы, научно-исследовательские обзоры в целом или в виде отдельных фрагментов. Другими словами, объектом информационного поиска является как сам материальный объект, так и его описание.
В зависимости от цели информационный поиск делится на адресный и семантический. От объекта — документальный и фактографический.
Адресный поиск — процесс разыскания информационных сообщений по чисто формальным признакам. Основное условие — наличие точного адреса (заголовок, инвентарный номер, авторский знак)
Семантический поиск — процесс разыскания информационных сообщений по их смыслу, содержанию. Одним из условий осуществления семантического поиска является перевод содержания информационного сообщения с естественного языка на информационно-поисковый язык.
При адресном поиске информационное сообщение рассматривается как объект (с точки зрения формы), а при семантическом — как носитель знания (с точки зрения содержания). Цель адресного поиска — нахождение объекта. Цель семантического поиска — нахождение информации по заданной теме, конкретному вопросу.
Документальный поиск — процесс разыскания первичных и вторичных источников информации, соответственно запросу потребителя.
Фактографический поиск — процесс извлечения фактографической информации.
Основу документального поиска составляет документ, а фактографического — факт.
Эффективность информационного поиска определяется прежде всего показателями, характеризующими процесс нахождения релевантных документов, т.е. семантическими показателями полноты и точности выдачи информации.
Полнота выдачи информации — количественная характеристика информационного поиска, определяемая отношением между числом выданных на данный запрос релевантных документов (а) и общим числом релевантных документов в информационном массиве (а+с). П=а/(а+с).
Точность выдачи информации — количественная характеристика информационного поиска, определяемая между числом релевантных документов (а) и общим количеством всех документов, выдаваемых в ответ на запрос (а+в). Т=а/(а+в).
Полнота и точность выдачи информации зависят от ряда факторов: типа информационно-поискового языка, метода индексирования документа и запросов, стратегии поиска, режима реализации поиска.
Кроме семантических критериев эффективности поиска, используются такие показатели, как оперативность, стоимость и трудоемкость поиска. Их называют технико-экономическими критериями.
Оперативность поиска — среднее время ответа на запрос.
Стоимость — совокупность денежных и материальных затрат на информационный поиск одного документа.
Трудоемкость поиска — затраты труда на поисковые операции при поиске одного документа.
Использование совокупности показателей эффективности информационного поиска является одним из направлений оптимизации работы информационных систем.
Вопрос 2. Информационные системы: понятие и структура. Основная задача курса состоит в том, чтобы познакомиться с принципами организации и обработки больших массивов данных об объектах и явлениях реального мира. Такие массивы данных вместе с программно-аппаратными средствами для их обработки называют информационными системами (ИС).
Для выполнения любого вида информационного поиска в состав ИС должны входить следующие элементы:
информационный массив объектов — совокупность текстов документов, записей, фактографических описаний, данных, где происходит информационный поиск;
логико-семантический аппарат, состоящий из информационно-поискового языка, методов индексирования и поиска информации;
средства реализации — совокупность технических устройств, с помощью которых осуществляется хранение и поиск информации;
люди, взаимодействующие с системой (пользователи, администраторы и т.д.)