Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
22
Добавлен:
23.05.2017
Размер:
2.53 Mб
Скачать

Ассоциации по контрасту характеризуются тем, что представление одного предмета или явления может вызвать представление другого предмета или явления, обладающего по сравнению с первым противоположными свойствами. Примеры ассоциаций по контрасту: тяжелый - легкий, прозрачный - непрозрачный и т.д.

Кроме простых ассоциаций (по смежности, сходству и контрасту) существуют также сложные - по смыслу. Главными из смысловых, составляющих основу наших знаний, являются следующие ассоциации вид - род, часть - целое и причина - следствие.

Таким образом, единицы информации обладают свойством вызывать по ассоциации в сознании воспринимающих их индивидуумов новые единицы информации, хотя результат восприятия (в зависимости от интересов, образования, рода занятий, психического склада ума и многих других факторов) может быть различными у разных людей. Это относится не только к словам, терминам, понятиям, но также к единицам информации более высоких уровней.

Рассеяние информации - это свойство информации, вытекающее из ее межотраслевого характера и противоположно концентрации информации. Как и концентрация, рассеяние информации - сложный, диалектически противоречивый процесс: по мере концентрации информации в более емкие информационные единицы возрастает ее межотраслевое значение и, следовательно, усиливается тенденция к ее рассеянию.

В строгом смысле рассеяние информации означает, что информация, которая была бы полезной для решения данной проблемы, может оказаться в документах, относящихся к совершенно другой предметной области.

Другим проявлением свойства рассеяния может быть рассредоточение информации по документам, относящимся к разным предметным областям, т.е. дублирование информации. Процесс рассеяния имеет устойчивые закономерности. Журналы, которые посвящены непосредственно данной отрасли или предмету, образуют некоторое ядро, вокруг которого можно построить кольцевые зоны, содержащие столько же публикаций, по данному вопросу, что и ядро. Этот закон С.Брэдфорд сформулировал следующим образом: "Если научные журналы расположить в порядке уменьшения числа помещенных в них статей по какомулибо заданному предмету, то в полученном списке можно выделить ядро журналов, посвященных непосредственно этому предмету, и несколько групп, каждая из которых содержит столько же статей, что и ядро. Тогда

число журналов в ядре и в последующих группах будет относиться как

1 : n : n2…».

Закон Брэдфорда не содержит объяснения причин рассеяния информации. Он отражает лишь то, что уменьшение количества научных публикаций по мере удаления от профильного ядра есть следствие ослабления связей, которые существуют между профильной для данной проблемы областью и другими областями. Рассеяние собственно ин-

формации основывается не на ослаблении, а на усилении межотраслевых связей в условиях научно-технического прогресса. Поэтому при изучении характера рассеяния информации следует рассматривать не столько рассредоточение профильных для какой-либо отрасли науки или техники публикаций, сколько возможность появления потенциально полезной информации для решения той или иной задачи в других, даже весьма отдаленных отраслях. Причем, такая информация может существовать как в явной, так и в латентной форме.

1.4. Информационные единицы

Связывание понятий информация и знание в информатике означает, что при поиске единицы информации, следует идти по пути поиска единицы знания, представленной в виде информационного сообщения. То есть, единица научно-технической информации может быть определена следующим образом [Муранивский1982]: «… в качестве единицы информации может рассматриваться любое (сколь угодно широкое или узкое) информационное сообщение или знание, которое имеет самостоятельное значение и выражено в доступной для восприятия и практического использования форме». Например, единицами информации являются сообщения о научных фактах, описания экспериментов, их методов или результатов, определения, закономерности, суждения, умозаключения, гипотезы, теории, законы, а также чертежи или описания конструкций, узлов, приборов, машин, технологических процессов и т.п. Другими словами, единица информации — это единица знания, выраженная в форме письменных или каких-либо других документов или их фрагментов.

В качестве единицы научной информации может выступать и краткое или пространное сообщение, и отдельный научный факт, и научная теория, и совокупность фактов, гипотез, концепций, теорий и законов, образующих основу какой—либо отрасли науки. Самостоятельными единицами технической информации в такой отрасли, как машиностроение, могут быть описания конструкции детали, узла, машины или устройства, системы машин и т.п. Какую единицу выбирать, зависит от конкретных условий: от отрасли знания, интересов потребителя информации и других факторов, В одних случаях достаточно сообщить об отдельных результатах экспериментального исследования, а в других потребуется обоснование тенденций развития целой отрасли или группы отраслей.

Предлагаемое толкование единицы информации основывается на методологическом принципе относительности элементарного.

Из истории развития науки можно привести немало примеров, когда на место дискретного элемента, выступающего в качестве объекта научного исследования, со временем приходит непрерывная единица. Например, вплоть до XVII века математика ограничивалась изучением

постоянных величин и фиксированных зависимостей между ними. Когда запросы астрономии и механики выдвинули проблему математического отображения процессов и движения, она стала исследовать переменные величины. А когда их изменяемость была распространена до бесконечно малого и бесконечно большого, возникло дифференциальное и интегральное исчисление.

Всовременной науке сложная структура элементарных образований различных материальных уровней, своеобразие законов их функционирования и развития приводят к уточнению общего понятия элемента. Простоту элемента следует понимать не абсолютно, а относительно изучаемой целостной системы. Множественности форм и уровней организации в природе соответствует множественность элементарных образований, каждое из которых является элементарным лишь по отношению к системам более высокого уровня (например, в живой природе – это клетка и клеточный организм, организм и популяция, вид популяции и биоценоз и т.д.).

Всемиотике, как языковой системе, осуществляющей функции обмена информацией, рассматривается несколько структурновзаимосвязанных уровней информации: уровень букв и элементарных знаков; уровень слов, чисел, классификационных шифров; уровень высказываний (показателей и других единиц языка, которые имеют форму наименований некоторых величин и их значений); уровень документов. Каждый из этих уровней, соответственно, может иметь свою единицу информации.

Любой процесс (событие, действие) существует не сам по себе, а непременно во взаимосвязи с другими процессами, причем связи эти многолики: причина и следствие, прошлое - настоящее - будущее, укрупнение или дробление и т.п. Закономерности взаимосвязей и непрерывного изменения объектов и процессов полностью распространяются и на научнотехническую информацию: одни и те же единицы информации могут быть включены в различные процессы и способны выполнять различные функции, непрерывно адаптируясь к новым условиям существования.

Следовательно, в качестве единицы информации в информационной теории целесообразно рассматривать единицу знания, которая имеет относительный характер и может менять свои функции в зависимости от конкретных условий ее практического использования.

Из относительного характера единицы информации следует ее дис- кретно-непрерывный характер. Это свойство проявляется, например, в текстах: отдельные слова одновременно образуют предложения, из которых составляются отрывки текста и т.п., причем в каждом случае относительно элементарные единицы одновременно образуют более сложные.

Точно такие же трудности наблюдаются при изучении единиц информации, являющихся составной частью более широких систем (например, фактические данные в теоретической концепции или гипотезе). Кроме того, одни и те же факты не привязаны жестко к одному и тому же материальному носителю могут входить во многие теоретические обобщения и играть в каждом из них различную роль, проявляя новые свойства (как, например, слова в различных контекстах).

Таким образом, дискретно-непрерывный характер информации заключается в том, что элементарные единицы информации одновременно могут быть составными частями более широких систем, которые в свою очередь могут также образовывать новые единицы, по отношению к которым они сами имеют условно-дискретную, элементарную форму, причем эти единицы информации в различных системах могут играть разную роль. Наконец, в ряде случаев бывает трудно (а иногда нецелесообразно или даже невозможно) четко вычленить элементарные единицы информации из сложных образований более высоких уровней.

Принятие в качестве единицы информации единицы знания является принципиальным, однако трудно измеримым. Во многих случаях единица информации совпадает с содержанием документа (например, описание объекта в авторском свидетельстве или патенте, учебник по какому-либо предмету и т.п.).

Например, в библиотековедении и документоведении в качестве единицы информации была предложена натуральная единица (НИТ) - число сообщений, документов, слов, букв, символов. В математической теории информации в качестве единицы измерения используется бит - информация, содержащаяся в одном двоичном разряде, определяемая как количество информации, получаемой при выборе одного из двух равновероятных состояний.

С другой стороны, содержание информации, как уже отмечалось, не зависит ни от языка, ни от вида носителя: оно может быть выражено на различных языках и представлено в виде самых разнообразных документов. Другими словами информация инварианта по отношению к ее носителю. Поэтому отношение документа, как физической единицы, и единицы информации, содержащейся в нем, — это отношение формы и содержания, явления и сущности. Соответственно, существуют и разрабатываются методы и средства извлечения информации из данных, например, средства аналитической обработки баз данных, методы автоматического реферирования и индексирования и т.д. Отметим, что работа этих автоматизированных методов аналогична тому, что делает человек: путем всестороннего изучения явления (текста документа) проникает в сущность, выявляя и извлекая из текста нужную информацию.

Контрольные вопросы

1.Охарактеризуйте соотношение понятий «информация», «данные», «знания».

2.Дайте определение понятия «информация».

3.Охарактеризуйте прагматические свойства информации.

4.Перечислите атрибутивные свойства информации.

5.Назовите и охарактеризуйте формы концентрации информации.

6.Приведите примеры проявления свойства старения информа-

ции.

7.Охарактеризуйте свойство рассеяния информации.

8.Дайте определение единицы информации.

2. Информационные системы и технологии обработки информации

Широко используемое понятие «информационные системы», тем не менее, практически не имеет единого концептуального определения. Наиболее часто это понятие трактуется согласно определению, данному в [Криницкий1982], как «…комплекс, состоящий из информационного фонда и процедур: управляющей, обновления, информационного поиска и завершающей обработки, - позволяющего накапливать, хранить, корректировать и выдавать информацию».

Процедуры обработки информации могут быть автоматизированными или нет. В настоящее время наиболее эффективным является вариант, основанный на использовании вычислительных машин. С другой стороны, практически любая целенаправленная деятельность человека в той или иной мере связана с обработкой информации. Таким образом, автоматизированная информационная система (АИС), как специализированная подсистема эффективной обработки данных, является обязательной составной частью практически любой системы управления, будь то управление производством, научные исследования или проектные работы, экономические или социальные системы. И, как следует из существа самого понятия «информация», именно сфера управления является главной областью применения АИС.

Приведенное выше определение информационной системы «вытекает» и связано с устоявшейся и уже привычной, но, тем не менее, особой формой целенаправленной деятельности человека - обработкой информации, как сведений о чем-то, материально представленных на традиционных или машиночитаемых носителях, и обеспечивающих эффективность решения задач его основной деятельности. Причем понятие «системности» здесь отражает существо функциональности: состав и структура ИС определяется, исходя из требований к уровню эффектив-

ности обслуживания информационных потребностей конечных пользо-

вателей, прежде всего в части нахождения в накопленных массивах тех записей (документов), которые содержат сведения, нужные для организации эффективного управления процессами в сфере основной деятельности.

2.1. Состав и структура информационной системы

Для определения состава и взаимосвязей компонентов системы приведем предварительно определения следующих основных понятий.

Система (от греч. systema – целое, составленное из частей соединение) – совокупность элементов, взаимодействующих друг с другом и образующих определенную целостность.

Элемент системы – часть системы, имеющая определенное функциональное назначение. Сложные элементы систем, в свою очередь состоящие из более простых взаимосвязанных элементов, часто называют

подсистемами9.

Организация системы – внутренняя упорядоченность, согласованность взаимодействия элементов системы (проявляющаяся, в частности, в ограничении разнообразия состояний элементов системы)

Структура системы – состав, порядок и принципы взаимодействия элементов системы, определяющие основные свойства системы.

Архитектура системы – совокупность свойств системы, существенных для организации взаимодействия ее составляющих.

Целостность системы – принципиальная несводимость свойств системы к сумме свойств отдельных ее элементов (эмерджентность) и, в то же время, зависимость свойств каждого элемента от его места и функции внутри системы.

С точки зрения формы существования системы выделяют абстрактные и материальные системы.

Абстрактные системы – это системы, которые имеют в качестве операционных объектов преимущественно идеализированные, например, знания, теории, гипотезы.

Материальные системы подразделяются на технические, эргатические и эргатехнические (смешанного типа). Именно эргатехнические системы - материальные системы «человек-машина», состоящие из эргатического элемента (человека-оператора) и технического элемента (машины), будут составлять основной предмет изучения.

Информационная система (ИС) – материальная система, организующая, хранящая и преобразующая информацию. Это система, основным предметом и продуктом труда в которой является информация.

Автоматизированная система обработки данных (СОД) - ком-

плекс взаимосвязанных методов и средств преобразования данных, необходимых пользователю. Здесь данные понимаются как информация, представленная в формализованном виде, пригодном для автоматической обработки при возможном участии человека.

9 Существенным фактором с точки зрения абстрактности (идеальности природы) определения понятия «система» является то, что отдельный элемент какой-либо системы (как и сама система) может также быть элементом другой системы.

Системы обработки знаний (СОЗ) - автоматизированные СОД,

имеющие специальное программное обеспечение для анализа семантики информации и ее гибкой логической структуризации.

В основу построения эффективных автоматизированных СОД (как систем наиболее эффективного типа) положены следующие принципы:

принцип интеграции – обрабатываемые данные, однажды введенные в систему, многократно используются для решения возможно большего числа задач, чем максимально устраняется дублирование данных и операций их преобразования;

принцип системности – обработка данных в различных «разрезах» с целью получения информации, необходимой для принятия решений на всех уровнях и во всех функциональных подсистемах управления;

принцип комплексности – механизация и автоматизация процедур преобразования данных на всех стадиях технологического процесса.

2.1.1. Классификация информационных систем

Понятие системы тесно связано с эффективностью обработки информации, что, в свою очередь, базируется на специализированности компонентов и процессов. Такая специализированность (ориентация на определенный класс задач) обусловлена обычно свойствами обрабатываемых объектов. Информация, как основной объект обработки, может быть классифицирована следующим образом:

по характеру, определяемому свойствами объектов предметной области – четкие или лингвистические10 переменные;

по принадлежности к подсистеме управления - информация по целевой подсистеме, по сопровождению системы, по связи с внешней средой, по обеспечивающей, управляемой и управляющей подсистемам;

по форме представления – числовая или вербальная (словесная);

по изменчивости во времени - условно-постоянная и условнопеременная;

по способу передачи (используемому носителю) - письменная или электронная, спутниковая или телефонная и т.д.;

по режиму передачи - в нерегламентные сроки, по запросу или принудительно;

по назначению - экономическая, техническая, социальная, организационная и т.д.;

10 Лингвистическими переменными называют величины, которые могут иметь несколько значений. Впервые это понятие было введено в лингвистике для обозначения свойств слов иметь несколько смыслов в зависимости от контекста, например, ключ для дверного замка и ключ – водный источник.

по стадиям жизненного цикла объекта – этап научноисследовательской или опытно-конструкторской работы, организацион- но-технологическая подготовка производства, эксплуатация и т.д.;

по отношению объекта управления к субъекту - между системой

ивнешней средой, по вертикали и горизонтали, между управляющей и управляемой подсистемой.

С точки зрения применения информационные системы могут классифицироваться:

1) по характеру использования результатной информации:

информационно-поисковые (сбор, хранение, выдача информации по запросу пользователя);

информационно-советующие (системы поддержки принятия решений);

информационно-управляющие (результатная информация непосредственно участвует в формировании управляющих воздействий);

2) по функциональному назначению:

производственные ИС;

коммерческие ИС;

маркетинговые ИС;

финансовые ИС и т.д.

3) по объектам управления

ИС автоматизированного проектирования;

ИС управления технологическими процессами;

ИС управления предприятием и т. д.

4) по степени автоматизации процессов обработки

ИС с ручной обработкой информации;

ИС механизированной обработки информации;

ИС автоматизированной обработки информации;

ИС автоматической обработки информации.

Другим аспектом типологии ИС является «информационный», что позволяет выделить следующие классы, определяющиеся, по существу, технологией создания и использования информации, основанной на концепции баз данных, свойства которых и переносятся на информационные системы.

По форме представляемой информации можно выделить факто-

графические, документальные, мультимедийные, что в той или иной степени соответствует цифровой, символьной и другим формам представления информации в вычислительной среде.

По типу хранимой (исключая мультимедийную) информации мож-

но выделить фактографические, документальные, лексикографические БД. Лексикографические базы – это классификаторы, кодификаторы, словари основ слов, тезаурусы, рубрикаторы и т.д., которые обычно ис-

пользуются в качестве справочных совместно с документальными или фактографическими БД. Документальные базы подразделяются по уровню представления информации – полнотекстовые (обрабатывающие так называемые «первичные» документы) и библиографическореферативные (обрабатывающие «вторичные» документы, отражающие на адресном и содержательном уровне первичный документ).

По типу используемой модели данных выделяют традиционно три класса БД: иерархические, сетевые, реляционные. Развитие технологий обработки данных привело к появлению постреляционных, объектноориентированных, многомерных БД, которые в той или иной степени соответствуют трем упомянутым классическим моделям.

По топологии хранения данных различают локальные и распределенные ИС.

По типологии доступа и характеру использования хранимой ин-

формации ИС могут быть разделены на специализированные и интегрированные11.

По функциональному назначению (характеру решаемых с помо-

щью ИС задач и, соответственно, характеру использования данных) можно выделить операционные и справочно-информационные. К последним можно отнести ретроспективные ИС (электронные каталоги библиотек, БД статистической информации и т.д.), которые используются для информационной поддержки основной деятельности и не предполагают внесение изменений в уже существующие записи, например, по результатам этой деятельности. Операционные ИС предназначены для управления различными технологическими процессами. В этом случае данные не только извлекаются из БД, но и изменяются (в том числе добавляются), в том числе в результате этого использования.

По сфере возможного применения можно различать универсальные и специализированные (или проблемно-ориентированные) системы.

По степени доступности можно выделить общедоступные и ИС с ограниченным доступом пользователей. В последнем случае говорят об управляемом доступе, индивидуально определяющем не только набор доступных данных, но и характер операций, которые доступны пользователю.

Следует отметить, что представленная классификация не является полной и исчерпывающей. Она в большей степени отражает исторически сложившееся состояние дел в сфере деятельности, связанной с разработкой и применением баз данных.

11 В последнем случае правильнее говорить об интегрированных информационных системах, объединяющих в общей среде разнородные данные, хранимые возможно в разнотипных базах, но используемые для решения одной прикладной задачи.

2.1.2. Основные компоненты ИС12

Как было сказано, ИС – это составная часть некоторой большей системы, обеспечивающая достижение какой-либо реальной цели в деятельности человека. Это уже предполагает, что всякая информационная система имеет некоторую материальную основу – носитель информации. Такими носителями, составляющими физический компонент системы (технические средства), являются как среда внешней памяти, так и технические и вычислительные средства, обеспечивающие непосредственно обработку и взаимодействие пользователя с АИС.

Второй компонент – это процедуры, обеспечивающие функционирование системы (программные средства), и в первую очередь – подсистемы управления данными, а также процедуры специализированной обработки, отражающие требования предметной области.

Однако существо информационной системы в наибольшей степени выражается третьим компонентом - информационным фондом, который характеризуется не только содержащейся информацией, но и способом ее организации (модель данных) и формой представления. Последнее в свою очередь определяется языком представления и управления информацией (лингвистическое обеспечение).

Примерная организационно-функциональная классификация АИС приведена на рис. 2.1.

12 Практически все современные ИС включают в свой состав вычислительные ма-

шины и поэтому являются информационно-вычислительными системами (ИВС).

Обычно функциями ИВС, управляющей крупным предприятием, являются следующие: вычислительная, коммуникационная, запоминающая, следящая, регулирующая, оптимизационная, прогнозирующая, анализирующая, контролирующая, документирующая.