Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Omelchenko_M_M_Informatsionnye_sistemy_i_tehnol....doc
Скачиваний:
3
Добавлен:
21.04.2019
Размер:
751.62 Кб
Скачать

1.3. Представление и измерение информации

Основной формой представления информации являются данные (зарегистрированные сигналы). Физический метод регистрации может быть любым: механическое перемещение физических тел, изменение их формы или параметров качества поверхности, изменение электрических, магнитных, оптических характеристик, химического состава и (или) характера химических связей, состояния электронной системы и т.п. В соответствии с методом регистрации данные могут храниться и транспортироваться на носителях различных видов.

Самым распространенным носителем данных, хотя и не самым экономичным, является бумага. На бумаге данные регистрируются путем изменения оптических характеристик ее поверхности. Изменение оптических свойств (изменение коэффициента отражения поверхности в определенном диапазоне длин волн) используется также в устройствах, осуществляющих запись лазерным лучом на пластмассовых носителях с отражающим покрытием (CD-ROM). В качестве носителей, использующих изменение магнитных свойств, можно назвать магнитные ленты и диски. Регистрация данных путем изменения химического состава поверхностных веществ носителя широко используется в фотографии. Накопление и передача данных в живой природе происходит на биохимическом уровне.

Любой носитель можно характеризовать параметром разрешающей способности (количеством данных, записанных в принятой для носителя единице измерения) и динамическим диапазоном (логарифмическим отношением интенсивности амплитуд максимального и минимального регистрируемого сигналов). От этих свойств носителя нередко зависят такие свойства информации, как полнота, доступность и достоверность.

В ходе информационного процесса данные преобразуются из одного вида в другой с помощью методов. В структуре возможных операций с данными можно выделить следующие методы:

• сбор данных – накопление информации с целью обеспечения достаточной полноты для принятия решений;

• формализация данных – приведение данных, поступающих из разных источников, к одинаковой форме, чтобы сделать их сопоставимыми между собой, т.е. повысить уровень их доступности;

• фильтрация данных – отсеивание «лишних» данных, в которых нет необходимости для принятия решений, при этом должен уменьшаться уровень «шума», а достоверность и адекватность данных должны возрастать;

• сортировка данных – упорядочение данных по заданному признаку с целью удобства использования, что повышает доступность информации;

• архивация данных – организация хранения данных в удобной и легкодоступной форме, служащая для снижения экономических затрат на хранение данных и повышающая общую надежность информационного процесса в целом;

• защита данных – комплекс мер, направленных на предотвращение утраты, воспроизведения и модификации данных;

• транспортировка данных – прием и передача данных между удаленными участниками информационного процесса; в этом случае источник данных в информатике принято называть сервером, а потребителя – клиентом;

• преобразование данных – перевод данных из одной формы в другую или из одной структуры в другую. Преобразование данных часто связано с изменением типа носителя. Необходимость в многократном преобразовании данных возникает также при их транспортировке, особенно если она осуществляется средствами, не предназначенными для транспортировки данного вида данных.

Логической формой представления информации (в экономической информационной сфере) является документ – информационная совокупность, имеющая самостоятельное смысловое значение и состоящая из логически связанных реквизитов. Информационная совокупность должна быть зафиксирована на материальном носителе в соответствии с существующими правилами и иметь юридическую силу.

Реквизит – логически неделимый элемент информационной совокупности (минимальная единица информации), он отражает определенные свойства объекта или процесса и имеет законченное смысловое содержание и потребительскую значимость. Реквизит нельзя разделить на более мелкие единицы без разрушения его смысла. Логически связанные реквизиты формируют информационную совокупность называемую показателем – составной единицей информации (СЕИ). Каждый показатель состоит из одного реквизита-основания и одного или нескольких реквизитов-признаков. Реквизит-основание характеризует, как правило, количественное значение показателя, реквизит-признак – смысловое значение показателя и определяет его наименование.

Информацию можно измерить. На синтаксическом уровне, где принято употреблять термин данные, для измерения информации часто используется понятие объема данных (число экземпляров документов, количество документострок, записей файлов, символов, байтов, битов и т.п.).

Объем данных сообщения измеряется количеством элементов (разрядов) в этом сообщении. В различных системах счисления один разряд имеет различный вес и в соответствии с ним меняется единица измерения данных:

• в двоичной системе счисления единица измерения – бит (bit – binary digit – двоичный разряд);

• в десятичной системе счисления единица измерения – дит (десятичный разряд).

Данные – это «сырье» для получения информации. Термин информация, как было показано выше, означает устранение неопределенности путем преобразования данных. Противоположный по смыслу термин – энтропия, является мерой этой неопределенности. Информативность сообщений (количество передаваемой информации) тем выше, чем более определенным становится для получателя информации состояние системы.

Энтропия системы, имеющей N возможных состояний, согласно формуле Шеннона,

H(а) = –ΣPilogaPi,

где Pi – вероятность того, что система находится в i-м состоянии; а – основание логарифма, определяющее систему единиц измерения количества информации – бит для двоичной и дит для десятичной систем.

Энтропия H равна нулю только тогда, когда все вероятности Pi, кроме одной, равны нулю, а эта единственная вероятность равна единице (полная определенность состояния системы). При заданном числе состояний системы N величина H максимальна и равна logaN, в случае, когда все Pi равны.

Семантическая мера информации – «содержательность» – основана на наличии тезауруса системы. Тезаурус включает взаимоувязанные понятия, термины, определения, согласованные структуры данных логического уровня представления (базы данных, формы документов, технико-экономические показатели). Тезаурус выражает «знания» о системе. Новая информация воспринимается через тезаурус, который может пополняться новыми элементами. Информативность сообщений (количество содержательной информации Ic) зависит во многом от получателя, способного расширить свой тезаурус.

Прагматическая мера информации определяет полезность информации (ценность) для достижения пользователем поставленной цели. Ценность информации целесообразно измерять в тех же самых единицах (или близких к ним), в которых измеряется целевая функция.

Структурная мера информации с увеличением объемов накапливаемой в компьютерах информации приобретает все большее значение, так как связана с проблемами хранения, реорганизации и извлечения информации. При структурном подходе абстрагируются от субъективности, относительной ценности информации и рассматривают лишь логические и физические структуры организации информации.

При машинном хранении (физическая организация информации) единицей информации является байт, содержащий восемь бит (двоичных единиц информации). Менее определенной, но также переводимой в байты является неделимая единица экономической информации – реквизит.

Реквизиты объединяются в показатели, показатели – в записи, записи – в массивы (документы), из массивов создаются комплексы массивов, а из комплексов – информационные базы (ИБ). Структурная теория позволяет на логическом уровне построить оптимальную структуру информационной базы, которая затем с помощью определенных средств реализуется на физическом уровне – уровне технических средств хранения информации. От выбранной структуры хранения зависит такой важный параметр, как время доступа к данным, так как структура влияет на время записи и считывания информации, а значит, и на время создания и реорганизации информационной базы.

Информационная база совместно с системой управления базой данных (СУБД) формирует банк данных (БД).

После преобразования информации в машинную форму ее аналитический и прагматический аспекты как бы уходят в тень, и дальнейшая обработка информации происходит по «машинным законам», одинаковым для информации любого смыслового содержания.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]