Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
22
Добавлен:
23.05.2017
Размер:
2.53 Mб
Скачать

ление (построение) информационного пространства (среды), вклю-

чающей:

-информационные ресурсы, содержащие данные, сведения и знания, зафиксированные на соответствующих носителях информации;

-организационные структуры, обеспечивающие функционирование и развитие информационного пространства, в частности, сбор, обработку, хранение, распространение, поиск и передачу информации;

-средства поддержки информационного взаимодействия, в том числе программно-технические средства и организационнонормативные документы, обеспечивающие доступ к информационным ресурсам на основе соответствующих информационных технологий, рассматриваемых в контексте условия наследования особенностей существующего положения и требования преемственности будущих решений.

Изложенные выше аспекты позволяют выделить три уровня задач организации, создания и использования информационных ресурсов:

1)Уровень взаимодействия пользователей с ресурсами – задачи организации работы пользователей с информационными ресурсами (свойства и характер используемых ресурсов, интерфейсы и технологии поиска, справочно-обучающая поддержка и т.д.).

2)Уровень системной организации информационного пространства – задачи, связанные со структурой информационного пространства.

3)Организационно-технологический уровень - задачи функционирования и сопровождения информационного ресурса на протяжении всего его жизненного цикла (выбор источников, средства создания и ведения баз данных, выбор стандартов хранения информации, протоколов взаимодействия и доступа и т.д.).

Необходимо отметить, что все компоненты и задачи тесно связаны между собой и должны рассматриваться параллельно и в контексте конечной цели – такой организации взаимодействия компонент совокупной человеко-машинной системы (взаимодействия пользователя с распределенным информационным ресурсом), которая обеспечит эффективность процесса генерации нового знания. Причем, автоматизация информационной деятельности и управления информационными ресурсами на всех уровнях обуславливает необходимость разработки общих принципов и теоретических основ моделирования информационных ресурсов, которые, во-первых, охватывали бы максимальное количество типов и уровней информационных процессов и технологий управления ИР, а во-вторых – были бы работоспособны с позиций реализации конкретных систем.

Информационные системы, как и базы данных, составляющие их основу – это уже достаточно хорошо проработанная научная дисциплина. Существует множество, в том числе и фундаментальных, работ и

учебников (на материал которых авторы опирались при подготовке этого учебника, и убедительно рекомендуют их тем, кто серьезно интересуется этой проблематикой), среди которых в первую очередь необходимо выделить такие монографии, как «Основы информатики» Михайлова А.И, Черного А.И., Гиляревского Р.С., «Динамические библиотечноинформационные системы» Дж. Солтона, «Теоретические основы науч- но-технической информации» Т.В. Муранивского.

В своей работе авторы руководствовались и тем, что материал должен не только представлять существо конкретной темы, но и подвести читателя к пониманию обоснованности (или условности) того или иного решения. Авторы сознательно избегали описаний языков и технологий, применяемых в конкретных системах, предполагая, что полноценное освоение материала курса связано с практикой и, соответственно, с неизбежным изучением конкретных подходов, языков и технологий, свойственных выбранной системе, и изложенных в специальных пособиях, учебниках и руководствах.

Материал курса, представленный в восьмии главах и приложении, условно можно отнести к следующим разделам:

-введение в информатику и информационные системы;

-теоретические основы информационно-поисковых систем;

-лингвистическое обеспечение;

-когнитивные модели и особенности человеко-машинного взаимодействия в процессах информационного поиска;

-технологии и средства информационного поиска.

Впервой главе введены основные понятия, относящиеся к информатике: информация, данные, знания; определены основные свойства информации.

Во второй главе определены состав и структура информационной системы, рассматриваемой как средство автоматизированной обработки данных. С точки зрения общей теории систем рассмотрена информационная модель управления в системах материальных преобразований и систем генерации знаний.

Втретьей главе определены основные понятия, относящиеся к базам данных. Рассмотрен важнейший вопрос семантики баз данных в контексте информационных систем и определено соотношение понятий «информация» и «данные». Представлены базовые технологии машинной обработки данных и рассмотрены ключевые моменты, определяющие эффективность процессов управления данными. Приведены примерные схемы управления данными в документальных информационных системах.

Вчетвертой главе приведены математические модели поиска информации. Вводятся формальные меры оценки технической эффективности поиска документальной информации. Представлена система ма-

тематических моделей механизмов поиска в документальных базах данных.

Впятой главе рассматривается лингвистическое обеспечение информационных систем. Даны основные понятия и типология методов описания содержания документов. Описаны классификационные и дескрипторные языки. Рассмотрены особенности использования терминологических структур в технологиях документального поиска.

Вшестой главе в рамках обобщенной модели воспроизводства информации определены требования к представлению информации на разных уровнях. На основе типологии информационной неопределенности и видов поисковых задач определены особенности реализации поисковых процессов. Вводятся определения основных компонент информационного поиска.

Вседьмой главе рассматриваются модели и технологии поиска в документальных базах данных научной информации. Процесс поиска, представляемый как управляемое средствами интерфейса взаимодействие двух систем (человек – АИС), рассматривается на двух уровнях: внутрисистемного представления информации и особенностей восприятия информации пользователем с учетом когнитивных и поведенческих аспекты деятельности человека. Вводится схема типизации поведения пользователей при поиске. Подробно рассмотрены основные компоненты и технология информационного поиска.

Ввосьмой главе приведены примерные реализации интерфейсных решений процессов подготовки и развития поискового запроса.

1. Информация. Основные свойства и определения

Информатизация общества является стратегическим фактором развития цивилизации, который, благодаря особым свойствам информации, дает человечеству определенные шансы решить глобальные проблемы и перейти к новой парадигме устойчивого развития. При этом информационные системы и технологии становятся теми средствами, которые человек может использовать как для расширения, так и для развития своих собственных способностей: памяти, логики, пространственного воображения.

1.1.Информация как основной предмет информатики

Вкачестве источников информатики как теоретической платформы информационных систем обычно называют две науки — документалистику и кибернетику, возниковение которых было тесно связано с бурным развитием производственных систем и технологий. Основным предметом документалистики стало изучение рациональных средств и методов повышения эффективности документооборота как информационной основы накопления и поиска информации. Понятие информации составило также и основу кибернетики, как науки о методах анализа и синтеза систем эффективного управления.

Развитие средств вычислительной техники и широкое ее использование в различных областях человеческой деятельности привело к тому, что с понятием «информатика» стала тесно связана и другая область —

наука о средствах вычислительной техники (Computer Science). И сего-

дня предмет информатики, рассматриваемой уже как совокупность информационных ресурсов и технологий, в общем случае составляют такие понятия, как:

средства вычислительной техники;

программное обеспечение средств вычислительной техники;

методы взаимодействия человека с вычислительной техникой и программными средствами (программным обеспечением);

информационные ресурсы5 (ИР), в том числе средства создания, хранения, поиска информации;

средства итехнологии доступа к распределенным информационным ресурсам;

методы и средства взаимодействия человека с информационными ресурсами на базе вычислительной техники с использованием программного обеспечения;

инструментальные технологии, обеспечивающие жизненный цикл ИР.

5 В [Громов, Попов96] к информационным ресурсам относят не только информационные продукты, но и средства и технологии их создания и использования

Информатика занимается не собственно вычислениями, а обработкой информации (представленной, преимущественно, в числовой и символьной форме), а само содержание термина «вычисления» в информатике расширяется, охватывая наряду с собственно вычислительными процессами также и те, которые связаны с кодированием и обработкой текстов, их поиском и передачей по различным каналам связи. Это обеспечивает возможность для уменьшения разнообразия и сложности знаковых средств, используемых для представления информации при сохранении ее количества. Современные формы представления информации (искусственные языки, модели, коды, символы, формулы и т.п.) позволяют минимумом знаковых средств выразить максимум содержания информации. Одна и та же по содержанию и объему информация может быть представлена более емко или менее емко в зависимости от того, какими знаками она выражена [Аветисян99].

Однако концентрация информации - это не только выбор системы знаков для ее более компактного выражения. Непрерывный процесс концентрации информации - это процесс постоянного ее обобщения, сведение разрозненных фактов и данных в более емкие и вместе с тем более богатые, глубокие, зачастую фундаментальные и методологические знания, из которых могут выводиться конкретные следствия или предположения. Это позволяет отказаться от запоминания и фиксирования исходных или выводимых составных элементов концентрированной информации, т.к. они всегда могут быть получены из более общего знания, более общей информации.

Приведем определение основного предмета информатики (определяющего основные объекты информационных коммуникаций), данное в предисловии к первому изданию одного из первых фундаментальных трудов в области автоматизированных информационных систем – «Основы научной информации» [Михайлов68]: «…научная информация захватывает три совершенно различные области человеческой деятельности. Первая – это мало исследованная область творческого мышления человека и организация умственного труда. Проблема поиска необходимых специалисту сведений может быть успешно решена лишь при условии, что будут изучены логические операции, производимые ученым при поиске нужной ему информации. … Вторая часть предмета – это довольно широкий комплекс вопросов, связанных с различными научными документами. Существующие виды научных документов сложились эмпирически, …. однако основания думать, что ученые располагают иными возможностями для распространения и сохранения во времени результатов своего труда, являются в значительной степени умозрительными. … Третий комплекс вопросов относится к созданию технических средств, необходимых для успешной научной деятельности».

Определение предмета информатики, приведенное выше, не потеряло актуальности. В рамках обобщенной информационной системы «поставщик – потребитель информации», где взаимосвязь понятий «по-

ставщик», «потребитель» и «информационная система» укрупненно отражаются схемой на рис. 1.1, произошло только некоторое изменение содержания понятий и смещение акцентов.

Источник

 

 

 

Потребитель

 

Средства, обеспечиваю-

 

(генератор)

 

щие доступность инфор-

 

(получатель)

информации

 

мации

 

информации

 

 

 

 

 

 

 

 

 

 

Рис. 1.1. Обобщенная схема взаимосвязи «поставщик – потребитель информации»

Источник, понимаемый на начальной стадии развития информатики (документалистике), как документ - физический носитель информации, обрел обобщенную форму – «генератор информации», что совокупно отражает не только форму представления информации, но и процесс или контекст ее получения. Практически не изменилось содержание блока средств, обеспечивающих доступность информации: это те же информационно-поисковые системы и лингвистическое обеспечение. В то же время «потребитель информации» определяется уже не только тематикой предметной области, но и особенностями восприятия и особенностями когнитивного процесса преобразования полученной информации. Т.е. с точки зрения процесса человеко-машинного взаимодействия не менее важными факторами, чем эффективность организации данных, становится эффективность организации интерфейса, не только адекватно представляющего потенциально полезные возможности системы, но и учитывающего психологические особенности восприятия информации человеком.

1.2. Соотношение понятий «информация», «данные», «знания»

Понятие "информация " достаточно широко используется в обычной жизни современного человека. Значение информации в жизни общества стремительно растет, меняются методы работы с информацией, расширяются сферы применения информационных технологий. Динамизм информатики как науки отражается и в постоянном появлении новых определений и толкований основного понятия информатики - информации.

Исходя из того, что определение научного понятия – это рабочая модель исследуемого объекта, отражающая основные составляющие и связи этого объекта (которые собственно и являются исследуемыми предметами, а в последствии – и в практической деятельности), рассмотрим некоторые определения понятий «информация», «данные», «знания» и их взаимосвязь.

1.2.1. Информация

Наиболее часто термин «информация» употребляется в его исходном значении (от латинского слова informatio) - это сведения, сообщения о каком-либо событии, деятельности и т.д. При этом в других областях знаний вводятся и другие определения этого понятия.

Следует, однако, отметить, что разнообразие определений тем не менее соответствует двум следующим концепциям: 1) Атрибутивная концепция рассматривает информацию как фундаментальную естественнонаучную категорию, находящуюся рядом с такими категориями как

"вещество" и "энергия", 2) Функционально–кибернетическя - как неотъ-

емлемый элемент управляемых или самоуправляемых систем (технических, биологических, социальных), как функцию этих систем. То есть, в зависимости от области знаний, где вводится понятие информации, его определение будет отражать специфику как области, так и задачи исследования. Рассмотрим далее наиболее извесные определения.

Вестественных науках информация выступает в качестве меры сложности структур (Моль) и меры разнообразия (Эшби): чем выше упорядоченность (организованность) системы (объекта), тем больше в ней содержится "связанной" информации.

Вфизике информация определяется, как отрицание энтропии - меры неопределенности, учитывающей вероятность появления тех или иных сообщений (Бриллюэн).

Вгенетике понятие информации определяется как программа (генетический код) биосинтеза белков, материально представленная полимерными цепочками ДНК.

Втеории информации, как науки об оптимальном кодировании сообщений и передачи сигналов по техническим каналам связи, понятие информации определяется как коммуникация, связь, в процессе которой устраняется неопределенность (Шеннон). Каждому сигналу приписывалась априорная вероятность его появления. Чем меньше вероятность появления того или иного сигнала, тем больше информации он несет для потребителя (т.е. чем неожиданнее сигнал, тем больше его информативность). Шеннон же предложил и единицу измерения информации –

«бит», а количество информации определяется по формуле I = - ∑pi Log pi где pi - вероятность появления i-го сигнала из n возможных. Количество информации равно нулю, когда возможно только одно событие.

Сростом числа событий количество информации увеличивается и достигает максимального значения, когда события равновероятны.

Отметим, что такой подход позволил ввести и другое определение: информация - это результат (вероятность) выбора из набора возможных альтернатив (Яглом).

Дальнейшее развитие математического подхода к определению понятия "информация " нашло в работах логиков (Карнап, Бар-Хиллел) и математиков (А.Н. Колмогоров). Здесь понятие информации не связы-

вается ни с формой, ни с содержанием сообщений, передаваемых по каналам связи, и определяется как абстрактная величина, не существующая в физической реальности, также как не существует мнимое число или точка, не имеющая линейных размеров.

Информация в кибернетических системах – это основа функционирования самоуправляемых систем (технических, биологических, социальных), и она рассматривается как обозначение содержания сигнала, полученного системой из окружающего мира в процессе взаимодействия системы с ним (Н. Винер).

Объединяющим (по крайней мере, с философской точки зрения) определением является следующее: «Информация – это отраженное разнообразие» (А.Д. Урсул). Разнообразие и отражение в развивающемся материальном мире неразрывно связаны и взаимно определяют друг друга: чем выше внутреннее разнообразие системы, тем более адекватно отражение ею внешнего мира. А чем больше возможность отражения (восприятия и понимания взаимодействия с окружающей средой), тем больше у системы возможностей адаптироваться – развиваться и увеличивать свое разнообразие.

Информация является одним из основных универсальных свойств материи. То есть, в самом общем смысле информация есть обозначение некоторой формы связей или зависимостей объектов, явлений, мыслительных процессов. Информация - это понятие, абстракция, относящееся к определенному классу закономерностей материального мира и его отражения в человеческом сознании.

Таким образом, можно сделать вывод, что в естественных науках понятие информации отождествляется с сигналами, которые наблюдаются в технических и биологических системах, и могут быть измерены, т.е. представлены как «рабочее тело», которое можно обрабатывать и хранить. Это тело состоит из упорядоченных дискретных или непрерывных сигналов, с которыми и имеет дело информационная технология.

Приведем далее несколько следующих «социальнокоммуникационных» и гуманитарных определений понятия "информация":

информация - сведения, передаваемые одними людьми другим людям устным, письменным или каким-нибудь другим способом

[БСЭ1980]

информация - содержание сообщения или сигнала; сведения, рассматриваемые в процессе их передачи или восприятия, позволяющие расширить знания об интересующем объекте [Терминологический сло-

варь1991].

Справовой точки зрения информация определяется как "некоторая совокупность различных сообщений о событиях, происходящих в правовой системе общества, ее подсистемах и элементах и во внешней по отношению к данным правовым информационным образованиям среде,

об изменениях характеристик информационных образований и внешней среды, или как мера организации социально-экономических, политических, правовых, пространственных и временных факторов объекта. Она устраняет в правовых информационных образованиях, явлениях и процессах неопределенность и обычно связана с новыми, ранее неизвестными нам явлениями и фактами" [Рассолов1998].

В экономике информацию рассматривают как сведения, которые необходимо фиксировать, передавать, хранить и обрабатывать для использования в управлении как хозяйством страны в целом, так и отдельными его объектами. Информация позволяет получить решение, как эффективнее и экономически выгоднее организовать производство товаров и услуг.

Таким образом, можно сказать, что определения понятия информации, представленные в гуманитарных областях, не противоречат приведенным ранее естественнонаучным точкам зрения.

В заключение приведем научно-методологическое определение информации, данное Д.И. Блюменау и А.В.Соколовым, важное для понимания предмета информатики: "информация - это продукт научного познания, средство изучения реальной действительности в рамках, допустимых методологией одного из информационных подходов к исследованию объектов различной природы (биологических, технических, социальных). Подход предполагает описание и рассмотрение этих объектов в виде системы, включающей в себя источник, канал и приемник управляющих воздействий, допускающих их содержательную интерпретацию".

1.2.2. Данные

Рассмотрим понятие "данные", которое, например, в [Информатика1999] вводится следующим образом: "Мы живем в материальном мире. Все, что нас окружает, и с чем мы сталкиваемся, относится либо к физическим телам, либо к физическим полям. Все объекты находятся в состоянии непрерывного движения и изменения, которое сопровождается обменом энергией и ее переходом из одной формы в другую. Все виды энергообмена сопровождаются появлением сигналов. При взаимодействии сигналов с физическими телами в последних возникают определенные изменения свойств – это явление называется регистрацией сигналов. Такие изменения можно наблюдать, измерять или фиксировать теми или иными способами - при этом возникают и регистрируются новые сигналы, т.е. образуются данные".

Известны также и другие трактовки, как, например, данные - это: факты, цифры, и другие сведения о реальных и абстрактных лицах, предметах, объектах, явлениях и событиях, соответствующих определенной предметной области, представленные в цифровом, символь-

ном, графическом, звуковом и любом другом формате;

информация, представленная в виде, пригодном для ее передачи

иобработки автоматическими или автоматизированными средствами (при возможном участии человека).

1.2.3. Знания

Переходя к рассмотрению роли понятия «информация» в челове- ко-машинных и социальных системах, необходимо определить понятие "знания".

В [Урсул1976] понятие «знания» определяется следующим образом: «Научное знание – вся совокупность сведений, являющаяся результатом отражения материальной и нематериальной действительности в человеческом сознании».

С другой стороны, как вводится в [Муранивский1982], научнотехническая информация- это задокументированное научное знание, введенное в оборот, участвующее в функционировании и развитии общества». То есть, знание, являющееся достоянием чьего-либо сознания и не получившее «толчка» для циркулирования в обществе, не может рассматриваться как информация. Откуда следует, что информация не существует без материального носителя, обеспечивающего ее передачу. Существование информации не зависит от вида носителя и формы представления, однако от этого зависит возможность и эффективность ее использования. Например, информация, представленная в знаковой системе, не знакомой получателю, или на носителе который не может быть доступен, не будет использована.

Основываясь на приведенных трактовках, можно констатировать условность превращения знания в это информацию и информации в знание. Информация выступает как форма знания, отчужденная от его носителя (сознания субъекта), и обобществляющая его для всеобщего использования: информация - это динамическая форма существования знаний, обеспечивающая его распространение и социальное функционирование. Получая информацию, пользователь превращает ее путем интеллектуального усвоения (информационно-когнитивного процесса) в свои новые личностные знания, т.е. происходит воссоздание знаний на основе информации.

Таким образом, фиксируемые/воспринимаемые сигналы (факты) окружающего мира представляют собой объективно существующие данные.

Информация появляется при использовании данных в процессе решения конкретных задач – формирования нового знания субъекта. Результаты решения задач, обобщения в виде законов, теорий, совокупностей взглядов и представлений, выступающие как истинная, проверенная информация, образуют обобществленные знания, отчужденные от субъекта их сформировавших и представленные обычно в форме доку-