Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
лекции_ТЭИС.doc
Скачиваний:
3
Добавлен:
27.04.2019
Размер:
943.1 Кб
Скачать

3. Классификация и основные свойства единиц информации

Ранее уже отмечали основные единицы информации: атрибут и СЕИ.

Атрибут соответствует переменной в языках программирования. Характеризуется именем и значением. Имя - условное обозначение атрибута в процессах обработки данных. Значение - величина, характеризующая некоторое свойство объекта, явления, процесса в конкретных обстоятельствах. Все допустимые значения атрибута образуют множество, называемое доменом этого атрибута.

Формально атрибут с именем X представляет собой пару (x,z), где z - элемент множества Z. Z - домен (область определения) атрибута Х, z - значение атрибута X в заданный момент времени.

Определение домена предполагает указание его имени и списка значений. Если число значений в домене невелико, их список можно указать при объявлении переменных, например, в языке программирования Pascal:

type

day = 1..31;

month = 1..12;

year = 1900..2000;

Если элементы перечислить невозможно, для домена указываются тип и при необходимости длина значения, например:

Var

Family: string [20];

Summa: real;

В последнем случае в домен фамилий могут попасть элементы, заведомо непригодные (АВГР), но такие случаи при определении домена не учитываются.

Если в домене необходимо перечислить обозначения объектов из некоторого класса, то разрабатывается классификатор, содержащий условные обозначения (коды) отдельных объектов и классов, к которым эти объекты отнесены. Простейшие системы кодирования и классификации:

1. Классификация не требуется, тогда производится нумерация объектов, и кодом каждого объекта является его порядковый номер. Такая система кодирования называется порядковой.

2. Множество объектов классифицируется по одному признаку; коды объектов делятся на несколько частей (серий) по количеству значений признака, а в пределах каждой серии используются порядковые номера.

3. Используются несколько классификационных признаков, их взаимная подчиненность соответствует выделению классов объектов, подклассов внутри классов и т.д. Здесь удобна разрядная система кодирования.

Разрядная система кодирования применяется для кодирования объектов, определяемых несколькими соподчиненными признаками. Кодируемые объекты систематизируются по классификационным признакам на каждой ступени классификации. Каждому признаку отводится определенное число разрядов, в пределах которого кодирование начинается с единицы. Классификационные группировки по младшим признакам кодируются в зависимости от кода более старшего признака.

Если значения нескольких атрибутов определены на одном домене, такие атрибуты называются ролевыми. Так, на домене Family могут быть определены атрибуты с именами: СТУДЕНТ, РАБОЧИЙ, АВТОР, ИЗБИРАТЕЛЬ. Это ролевые атрибуты. Атрибуты ФАМИЛИЯ_РАБОЧЕГО и ТАБЕЛЬНЫЙ_НОМЕР_РАБОЧЕГО не ролевые, хотя могут описывать одного и того же человека.

Среди атрибутов, описывающих предмет, выделяют такие, значения которых однозначно различают предметы (атрибуты-идентификаторы). Они соответствуют идентифицирующим свойствам объектов. ФАМИЛИЯ - не идентификатор, ТАБЕЛЬНЫЙ_НОМЕР - идентификатор работника в пределах одного предприятия.

Составная единица идентификации (СЕИ) - это набор из атрибутов и, возможно, других СЕИ. Определение СЕИ рекурсивно. Отметим, что база данных - тоже единица информации (СЕИ).

Множество атрибутов объединяются в одну СЕИ по следующим признакам:

- соответствующие атрибуты описывают один и тот же факт или экономический процесс;

- значения атрибутов, входящих в СЕИ, возникают одновременно, связаны арифметическими или логическими соотношениями.

Простейшая характеристика СЕИ представлена именем, структурой и значением. Имя - обозначение СЕИ в процессах обработки информации. Структура - вхождение одних единиц информации в состав других единиц информации.

Аппарат СЕИ рассчитан на описание структур экономических документов. Документ - материальный носитель информации (обычно бумажный бланк), содержащий оформленные в надлежащем порядке сообщения и имеющий юридическую силу.

Описание структуры СЕИ:

для описания, не зависимого от конкретных языков программирования и СУБД, достаточно указывать после имени СЕИ список имен входящих в нее атрибутов и СЕИ. Список помещают в круглые скобки. Имя СЕИ может сопровождаться размерностью, т.е. указанием на количество одинаковых по структуре значений этой СЕИ. Размерность, если она не равна 1, указывается в скобках после имени СЕИ. Между описанием размерности и описанием структуры ставится точка.

Пример: ведомость на получение зарплаты

ВЕДОМ

ПОДР

ДАТА

067

20.12.1996

ФИО

ТАБ_НОМ

СУММА

Петров С.П.

67005

1 345 000

Сергеев И.А.

67014

1 541 327

Таблицы не имеют названий. Названия элементов документа требуются при машинной обработке. СЕИ ВЕДОМ содержит атрибуты ПОДР, ДАТА и таблицы ТАБЛ. В СЕИ ТАБЛ входят атрибуты ФИО. ТАБ_НОМ и СУММА.

Структура СЕИ:

ВЕДОМ: ВЕДОМ.(ПОДР, ДАТА, ТАБЛ(2)).(ФИО, ТАБ_НОМ, СУММА)

Определение значения СЕИ можно дать, опираясь на значения единиц информации, входящих в ее структуру. Значение атрибута, входящего в СЕИ, определяется непосредственно. Значение СЕИ, входящей в другую СЕИ, можно определить рекурсивно, однако надо учесть размерность СЕИ. Кроме того, для множества значений СЕИ в составе другой СЕИ необходимо другое понятие. Таким понятием является собрание - множество значений СЕИ в составе СЕИ более высокого уровня. Количество значений в собрании СЕИ равно ее размерности.

Окончательно, значением СЕИ называется набор значений непосредственно входящих в нее атрибутов и набор собраний непосредственно входящих в нее СЕИ. При хранении в памяти ЭВМ одно значение СЕИ часто называют записью.

Все современные языки программирования содержат средства описания структуры СЕИ. Проиллюстрируем эти описания средствами языка программирования Pascal и языка СУБД FoxPro.

Pascal FoxPro

Type

Tablica = Record Файл Vedom

FIO: String[20]; Podr - Numeric - 3

Tab_num: Word; Dat_ved - Data - 8

Summa: Real Inf - Character - 12

end;

Vedom = Record Файл Tabl

Podr: Word; FIO = Character - 15

Dat_ved: String[8]; Tab_num - Numeric - 6

Tabl: Tablica Summa - Numeric -8.2

end;

СЕИ имеют ряд разновидностей, которые подразделяются в соответствии с представлениями пользователей на документы и показатели, а в соответствии с представлениями проектировщиков ЭИС - на отношения и веерные отношения.

Базовые свойства единиц информации - имя, значение, структура - были определены выше. Операции над именем: переименование (объявление нового имени) и объявление синонима (установление равноценного нового имени). Операции на значениями: атрибута - перекодирование, СЕИ - выборка, корректировка.

При анализе экономических документов ставится задача разделения документа на элементарные осмысленные фрагменты, называемые показателями. Это позволяет установить смысловые взаимосвязи между различными документами, обеспечить одинаковое понимание всеми пользователями применяемых единиц информации и их единое обозначение, использовать полученные результаты для определения структуры БД.

Показатель - это полное описание количественного параметра, характеризующего некоторый объект или процесс. Соответствующее описание произвольного свойства (не обязательно количественного) называется атомарным фактом.

Материальные процессы имеют качественную и количественную характеристики. Соответственно разделяют атрибуты-признаки и атрибуты-основания, как информационное отображение качественного и количественного свойств некоторого объекта.

В состав показателя должны входить один атрибут-основание и несколько атрибутов-признаков, однозначно характеризующих условия существования основания. Как единица информации показатель является разновидностью СЕИ.

Структура показателя: П.(Р1, Р2,...,Рк, Q), где Q - атрибут-основание, Р1, Р2,...,Рк - атрибуты-признаки. Таким образом, в показателях отражаются количественные свойства объектов и процессов.

Существуют документы, не содержащие атрибутов-оснований (пример - анкеты кадрового учета), т.е. не вся экономическая информация может быть представлена в виде показателей.

Минимальный набор атрибутов показателя должен содержать:

1) атрибуты, отображающие идентификаторы объектов,

2) атрибуты, отображающие признак времени,

3) атрибут, отображающий некоторое количественное свойство объекта или взаимодействия.

Для того, чтобы определить атрибут как признак или основание, можно использовать следующие закономерности.

1) если значение атрибута является исходным данным или результатом арифметической операции, то это основание,

2) если значение атрибута текстовое - это признак,

3) если атрибут обозначает предмет - это признак,

4) если атрибут в некотором показателе является признаком, то он будет играть эту роль и в других показателях,

5) если показатели описывают сходные процессы, то их призначные части совпадают,

6) если основание показателя вычисляется по значениям других оснований, то набор признаков такого показателя есть объединение признаков, связанных с этими основаниями.

Критерием создания базы данных может служить минимальная избыточность хранимой информации, выражаемая принципом “Каждое сообщение хранится в БД один раз”.

Использование аппарата экономических показателей позволяет создать структуру БД с минимальной избыточностью, если сначала расчленить все сведения, циркулирующие в ЭИС на показатели, а потом объединить атрибуты родственных показателей по принципу “В память ЭВМ один файл отводится под группу показателей с одинаковым составом атрибутов-признаков.

Для примера, приведенного выше, один показатель:

П.(ПОДР, ДАТА, ФИО, ТАБ_НОМ, СУММА)

соответствует одному файлу в базе данных. В нем ПОДР, ДАТА, ФИО, ТАБ_НОМ - атрибуты-признаки, а СУММА - атрибут-основание.

Одной из причин выделения показателя в особую разновидность единиц информации является то, что показатель является минимальной группой атрибутов, сохраняющей информативность (осмысленность) и поэтому достаточной для образования самостоятельного документа.

Для показателей, описывающих экономические процессы (взаимодей­ствие объектов), можно классифицировать их составные части:

1) формальная характеристика, указывающая на алгоритм получения атрибута-основания в показателе;

2) перечень объектов, участвующих в процессе;

3) название процесса;

4) единица измерения атрибута-основания;

5) определение момента времени или периода времени;

6) название функции управления;

7) название экономической системы, в которой происходит описываемый процесс.

Указание всех этих частей необходимо для точного обозначения показателя. Атрибуты-признаки должны в обязательном порядке отображать лишь перечень объектов, участвующих в процессе, и момент (период) времени. Часто включается признак, отмечающий единицу измерения, а остальные характеристики показателя обычно указываются в его названии, а не в хранимых значениях.

Существует аналогия между экономическими показателями и переменными с индексами. В общем случае переменная обозначает признак-основание, а индексы - значения соответствующих атрибутов-признаков.

Пример: приходный ордер поступления товаров на склад

ПРИХ

ДАТА

ПОСТ

15.10.96

7581

НОМ

КОЛ

ЦЕНА

СУММА

3521

100

300

30000

4685

200

200

40000

7791

150

100

15000

ПРИХ

ДАТА

ПОСТ

10.11.96

7795

НОМ

КОЛ

ЦЕНА

СУММА

3521

50

300

15000

4685

100

200

20000

В этих документах приняты следующие обозначения: ПОСТ - код поставщика, НОМ - номенклатурный номер, КОЛ - количество единиц товара, ЦЕНА - цена единицы товара, СУМ - суммарная стоимость товара по ордеру, вычисляемая как СУМ = КОЛ * ЦЕНА.

Структура СЕИ, состоящей из двух приходных ордеров:

ПРИХ(2).(ДАТА, ПОСТ, ТАБЛ(3).(НОМ, КОЛ, ЦЕНА, СУММА))

Атрибуты: ДАТА, ПОСТ, НОМ, КОЛ, ЦЕНА, СУММА. Атрибутами-основаниями можно считать КОЛ, ЦЕНА, СУММА, атрибутами-признаками - ДАТА, ПОСТ, НОМ.

Используя эти атрибуты, получим следующие показатели (напомним, что в показателе может быть только один атрибут-основание):

П1.(НОМ, ПОСТ, ДАТА, КОЛ) - для атрибута КОЛ;

П2.(НОМ, ЦЕНА) - для атрибута ЦЕНА (считаем, что ЦЕНА не зависит от поставщика);

П3.(НОМ, ПОСТ, ДАТА, СУМ) - для атрибута СУМ, признаки показателя 3 получаются объединением показателей признаков П1 и П2, поскольку СУМ=КОЛ*ЦЕНА.

Указанные показатели образуют в базе данных 2 файла:

F1 с атрибутами НОМ, ЦЕНА;

F2 с атрибутами НОМ, ПОСТ, ДАТА, КОЛ.

Соответствующие переменные с индексами имеют вид:

П1: K(i,j,m) - количество товара с НОМ = i, код ПОСТ = j, ДАТА = m;

П2: С(i) - цена товара с i-м кодом НОМ;

П3: S(i,j,m) = K(i,j,m) * C(i) - расчетное соотношение.

Закономерности, установленные в математике для арифметических операций над переменными с индексами трансформируются в правила арифметических операций над показателями:

1. Пусть имеются показатель с числовым значением x и множеством индексов X и показатель с числовым значением y и множеством индексов Y, над которым выполняется арифметическая операция  . Тогда множество индексов Z у величины z=xy равно объединению множеств X и Y. Если множества X и Y содержат общие индексы, то необходимым условием корректности вычисления Z является совпадение значений таких индексов у переменных x и у.

2. Для операций сложения и умножения:

а) если суммирование ведется по двум различным индексам, независимых друг от друга, то порядок суммирования безразличен;

б) если пределы изменения одного индекса зависят от другого индекса суммирования, то при перемене порядка суммирования пределы изменения каждого из индексов меняются;

в) если индексы суммирования не указаны, то суммирование производится по всем индексам, которые под знаком суммы встречаются 2 раза. Индексы, по которым суммирование не ведется, называются свободными.

Показатели необходимы как средство описания информационных потребностей пользователей на этапе формулирования требований к системе, внешних представлений пользователей и исходных данных для разработки прикладных программ. Эти сведения объединяются в постановке экономических задач.

Постановка экономических задач содержит описания структуры исходных, нормативно-справочных, выходных и промежуточных показателей, а также расчетные соотношения для вычисления выходных и промежуточных показателей, дополненные графом взаимосвязи показателей.

При операциях над структурой СЕИ происходит изменение не только структуры СЕИ, но и множества ее значений.

Нормализация - операция перехода от СЕИ с произвольной структурой к СЕИ с двухуровневой структурой. Одновременно происходит перекомпоновка значений СЕИ. Общее число значений в нормализованной СЕИ равно произведению размерностей всех СЕИ в исходном описании структуры.

ПРИХ

ДАТА

ПОСТ

НОМ

КОЛ

ЦЕНА

СУМ

15.10.96

7581

3521

100

300

30000

15.10.95

7581

4685

200

200

40000

15.10.95

7581

7791

150

100

15000

10.11.95

7795

3521

50

300

15000

10.11.95

7795

4685

100

200

20000

Структура нормализованного приходного ордера:

ПРИХ(6).(ДАТА, ПОСТ, НОМ, КОЛ, ЦЕНА, СУМ)

Свертка - преобразование СЕИ с двухуровневой структурой в СЕИ с произвольной многоуровневой структурой. Свертка нормализованной структуры может быть произведена в исходную, в этом смысле нормализация и свертка - взаимно обратные операции.

Свернем нормализованную СЕИ ПРИХ в карточку складского учета со структурой

КАРТ(3).(НОМ, ЦЕНА, ТАБЛ(2).(ДАТА, ПОСТ, КОЛ, СУМ))

КАРТ

НОМ

ЦЕНА

3521

300

ДАТА

ПОСТ

КОЛ

СУМ

15.10.96

7581

100

30000

10.11.96

7795

50

15000

Изображена одна карточка по атрибуту НОМ=3521. По другим номерам получим аналогичные карточки.

Декомпозиция - операция преобразования исходной СЕИ в несколько СЕИ с различными структурами. Множество атрибутов СЕИ до декомпозиции должно совпадать с множеством атрибутов после декомпозиции. Например, СЕИ ПРИХ можно разделить на две СЕИ:

ПРИХ1(5).(ДАТА, ПОСТ, НОМ, КОЛ, СУМ)

ЦЕНЫ(3). (НОМ, ЦЕНА)

ПРИХ1

ДАТА

ПОСТ

НОМ

КОЛ

СУМ

15.10.96

7581

3521

100

30000

15.10.95

7581

4685

200

40000

15.10.95

7581

7791

150

15000

10.11.95

7795

3521

50

15000

10.11.95

7795

4685

100

20000


ЦЕНЫ

НОМ

ЦЕНА

3521

300

4685

200

7791

100


Композиция - операция преобразования нескольких СЕИ с различными структурами в одну СЕИ. В принципе операция композиции точно определяется только для нормализованных исходных СЕИ. Она обратна декомпозиции.

Выборка - операция выделения подмножества значений СЕИ, которая удовлетворяет заранее поставленным условиям выборки.

Корректировка - выполнение одной из операций - добавление нового значения СЕИ, исключение существующего значения СЕИ, замена некоторого значения СЕИ на новое значение. Возможны и более сложные режимы корректировки, например, внесение изменений в несколько СЕИ одновременно.