Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
лекции_дополнит.doc
Скачиваний:
5
Добавлен:
27.04.2019
Размер:
555.52 Кб
Скачать

9. Классификация и основные свойства единиц информации

В экономике используют две основные единицы информации: атрибут и СЕИ. Атрибут соответствует понятию «переменные» в языках программирования и «реквизиты» в бухучете. Характеризуется именем и значением. Именем атрибута наз. его условное обозначение в процессах обработки данных. Значение атрибута – величина, характеризующая некоторые свойства объекта, явления, процесса в конкретных обстоятельствах. Все допустимые значения атрибута образуют множество – домен этого атрибута. Формально атрибут с именем Х можно представить как пару (Х, z), где z – элемент Z, который называется доменом значений, или областью определения Х, z- значение атрибута Х в заданный момент времени. Определение домена предполагает знание его имени из списка значений. Если число значений в домене не велико, то список можно указать при объявлении домена в программе. Но зачастую невозможно перечислить все значения домена, тогда указывается тип и длина значений. Наиболее употребительны текстовые (символьные), символьные, логические, а также значения дат и др. специальные типы значений. Множество входящих в домен значений задается с помощью перечисления допустимых значений. Если в домене надо перечислить обозначения объектов из некоторого класса, то разрабатывается классификатор, содержащий условные обозначения (коды) отдельных объектов и классов, к которым они отнесены.

10. Классификация и кодирование

Рассмотрим системы классификаций и кодирований, применяемых для обозначения объектов в БД вместо их полных названий.

    1. Если классификация вообще не требуется, то производится нумерация и кодом каждого объекта служит его порядковый номер N. Такая система кодирования – порядковая.

    2. Если все множество объектов классифицировано по одному признаку, то коды целесообразно разделить на несколько частей (серий) по количеству значений этого признака и в пределах каждой пользоваться последовательными номерами.

Когда используется несколько классификационных признаков и их взаимная подчиненность соответствует определению классов объектов, далее подклассов внутри каждого класса и т.д., то удобно использовать разрядную систему кодирования.

Пример. Рассмотрим различные системы кодирования значений атрибута с именем Код студента, Порядковый номер студента. 3 формы обучения: заочная, дневная и вечерняя. Предположим, что необходимо их различать с использованием серийной системы кодирования.

1 -1000

1001 – 2000

2001 – 3000

Можно ввести признак – вид обучения, выбрать первый разряд кода и номер обучения 1-1000. Можно ввести еще 1 признак – курс обучения.

В разрядном коде можно учесть больше признаков:

код 1) отделения;

2) факультета;

3) курса;

4) группы;

5) порядковый номер студента в группе .

  • При увеличении числа различимых признаков в коде увеличивается и длина значения атрибута с именем, код студента.

Разрядная система кодирования применяется для кодирования объектов, определяемых несколькими соподчиненными признаками. Кодируемые объекты систематизируются по классификационным признакам для каждой ступени классификации. Каждому признаку классификации отводится определенное число разрядов, в пределах которых кодирование начинается с 1, с младшего признака кодирования.

Если значения нескольких атрибутов определены на одном домене, то они наз. ролевыми атрибутами.

На домене с именем ФИО могут быть определены атрибуты с именами Студент, Преподаватель, Сотрудник. Атрибуты с именами Фамилия рабочего и Табельный номер – не ролевые, хотя и описывают одних и тех же людей.

Домен значений, как правило не храниться в БД как самостоятельный информационный объект, однако среди ролевых атрибутов домена в БД безусловно существует атрибут с наиболее полным перечнем знании, именно его необходимо использовать для контроля достоверности любой вводимой информации.

Пример. На предприятии наиболее полный список сотрудников должен храниться в БД отдела кадров.

СЕИ наз. набор из атрибутов и возможно др. СЕИ. Определение СЕИ построено рекурсивно, но противоречия здесь нет, поскольку «др. СЕИ» в конце концов будут состоять только из атрибутов в виду конечности сообщений. Множество атрибутов объединяются в одну СЕИ по след. признакам:

  1. соответствующие атрибуты описывают один и тот же факт или экономический объект;

  2. значения атрибутов, входящих в СЕИ возникают одновременно и связаны логически или арифметическими соотношениями.

Простейшие характеристики СЕИ:

- имя;

- структура;

- значение.

Имя СЕИ – условное обозначение в процессе обработки;

- вхождение одних СЕИ в другие.

Аппарат СЕИ рассчитан на описание структуры экономических документов.

Документ – материальный носитель информации, содержащий в установленном порядке сообщения, имеющие юридическую силу.

Существует много способов описания структуры СЕИ для описания независимых от конкретных языков программирования и СУБД. Достаточно указать после имени СЕИ список имен, входящих в нее атрибутов и др. СЕИ. Такой список помещают в «( )», перечисляя имена внутри через запятую, т.е. имя СЕИ сопровождается размерностью, т.е. указанием на количество одинаковых по структуре СЕИ. Размерность указывается в скобках после имени.

Пример. Документ «Приходный ордер» с сокращенным составом АТР.

ПРИХ

 

 

 

 

 

ДАТА

ПОСТ

СКЛАД

 

01.10.1993

1728

2

 

 

ННМ

Кво-док

Кво-пр

ЦЕНА

СУММА

26114

16

10

6.00

60.00

48712

10

8

8.00

64.00

 

 

 

 

 

ПРИХ

 

 

 

 

 

ДАТА

ПОСТ

СКЛАД

 

07.10.1993

3470

2

 

 

ННМ

Кво-док

Кво-пр

ЦЕНА

СУММА

49712

12

10

8.00

80.00

72428

8

8

8.00

64.00

28114

6

6

6.00

36.00

ПОСТ – код поставщика

ННМ – номенклатурный номер материалов

Кво-док – количество материалов, принятое по товарно-транспортной накладной

Кво-пр – количество материалов, принятых на склад

Сумма – Кво-пр * Цена

Прих (2). (Дата, Пост, Склад, Табл (ННМ, Кво-док, Квл-пр, Цена, Сумма)

Определение значения составной единицы информации можно дать, опираясь на значение единицы информации, входящей в структуру рассматриваемой единицы информации. При этом значения атрибутов, входящих в составную единицу информации, определяются непосредственно. Значение составной же единицы информации (СЕИ), входящую в другую составную единицу информации можно определять рекурсивно. Однако, для множества значений таких составных единиц информации, входящих в другие, необходимо дать самостоятельное понятие.

Собранием составных единиц информации наз. множество значений составной единицы информации более высокого уровня.

Значением составной единицы информации наз. набор значений непосредственно входящих в нее атрибутов и набор собраний, непосредственно входящих в нее составных единиц информации.

В рассматриваемом примере, одно значение СЕИ приходного ордера содержит по одному значению атрибутов (Дата, Пост, Склад и собрание СЕИ Табл.)

Собрание ТАБЛ включает в себя несколько значений атрибутов ННМ, Кво-док, Кво-пр, Цена, Схема. Одно значение СЕИ при хранении в ЭВМ и памяти часто наз. записью. Отметим, что все языки программирования содержат средства описания структуры СЕИ.

С СЕИ можно выполнять определенные действия:

1) переименование единицы информации (присвоение нового имени, объявление синонима – установление второго, третьего и т.д. равноценного имени для единицы информации);

2) операция над значением атрибута всего одна – перекодирование (замена существующего кода значений на новый для всех значений);

3) выборка – выделение подмножества значений СЕИ, которые удовлетворяют заранее поставленным условиям выборки;

4) корректировка – выполнение одной из операций:

а) добавление нового значения СЕИ;

б) исключение существующего значения;

в) замена некоторого значения СЕИ на новое значение;

5) декомпозиция – преобразование исходной СЕИ в несколько единиц информации с различными структурами. Декомпозиция приходного ордера может привести, например, к двум следующим СЕИ:

Цены (ННМ, Цена)

Приход (Дата, Пост, Склад, ННМ, Кво-док, Кво-пр, Цена, Сумма)

Декомпозиция, как и др. операции, одновременно производит преобразование всего множества значений.

  1. композиция – преобразование нескольких единиц информации с различными структурами в одну СЕИ. Декомпозиция и композиция – взаимообратные операции.

  2. Нормализация – операция перехода от СЕИ с произвольной структурой к единице информации с 2-х уровневой структурой. Так нормализация приходного ордера приводит к следующему результату:

ПОСТ

СКЛАД

ННМ

КВО-ДОК

КВО-ПР

ЦЕНА

СУММА

01.10.1993

1728

2

26114

16

600

 

01.10.1993

1728

2

48714

10

700

 

07.10.1993

3470

2

49712

12

800

 

07.10.1993

3470

2

72123

8

700

 

07.10.1993

3470

2

85645

6

800

 

8) свертка – операция преобразования СЕИ с двухуровневой структурой в СЕИ с произвольно многоуровневой структурой. Так свертка нормализированного приходного ордера может быть произведена в исходную структуру, а так же в другие документы, имеющие экономический смысл (карточку складского учета).

КАРТ

 

 

 

 

 

 

 

СКЛАД

ПОСТ

ЦЕНА

 

2

2614

5.00

 

 

 

ПОСТ

ДАТА

КВО-ДОК

КВО-ПР

СУММА

 

 

1728

01.10.1993

16

16

20-00

 

 

3476

07.10.1993

5

5

25-00

 

 

 

 

 

 

 

 

КАРТОЧКА СКЛАДСКОГО УЧЕТА