Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ПИС.doc
Скачиваний:
19
Добавлен:
26.04.2019
Размер:
313.86 Кб
Скачать

7. Системы кодирования, принципы построения кодов в различных системах кодирования. Классификаторы, используемые в информационных системах. Состав и содержание операций проектирования классификаторов.

Для полной формализации экономической информации недостаточно простой классификации, поэтому проводят следующую процедуру - кодирование.

Код - это условное обозначение объектов или группировок в виде знака или группы знаков в соответствии с принятой системой.

Кодирование – это процесс присвоения условных обозначений объектам и классификационным группам по соответствующей системе кодирования.

Система кодирования – это совокупность правил обозначения объектов и группировок с использованием кодов.

Код базируется на определенном алфавите (некоторое множество знаков). Число знаков этого множества называется основанием кода. Различают следующие типы алфавитов: цифровой, буквенный и смешанный.

Код повторения (мнемокод) - это буквенные или буквенно-цифровые коды, которые характеризуются тем, что в структуру кода переносят часть символьных обозначений объектов с целью повышения мнемоничности кода или для сокращения его длины.

Код характеризуется следующими параметрами:

  • длиной (L);

  • основанием кодирования (A);

  • структурой кода, под которой понимают распределение знаков по признакам и объектам классификации;

  • степенью информативности (I) , рассчитываемой как частное от деления общего количества признаков (R) на длину кода (L): I=R/L;

  • коэффициентом избыточности (Kизб), который определяется как отношение максимального количества объектов (Qmax) к фактическому количеству объектов (Qфакт): Kизб= Qmax/ Qфакт.

Можно выделить две группы методов, используемых в системе кодирования (рис.2.7), которые образуют:

классификационную систему кодирования, ориентированную на проведение предварительной классификации объектов либо на основе иерархической системы, либо на основе фасетной системы;

регистрационную систему кодирования, не требующую предварительной к лассификации объектов.

Регистрационные системы кодирования используются для однозначной идентификации объектов и не требуют предварительной классификации объектов. Различают порядковую и серийную систему.

Порядковая система кодирования предполагает последовательную нумерацию объектов числами натурального ряда. Этот порядок может быть случайным или определяться после предварительного упорядочения объектов, например по алфавиту. Этот метод применяется в том случае, когда количество объектов невелико, например кодирование названий факультетов университета, кодирование студентов в учебной группе.

Серийная система кодирования предусматривает предварительное выделение групп объектов, которые составляют серию, а затем в каждой серии производится порядковая нумерация объектов. Каждая серия также будет иметь порядковую нумерацию. По своей сути серийная система является смешанной: классифицирующей и идентифицирующей. Применяется тогда, когда количество групп невелико.

Классификационные системы кодирования

Классификационные системы кодирования применяются после проведения классификации объектов. Различают позиционные и комбинированные системы кодирования.

Позиционные системы кодирования используются для иерархической классификационной структуры. Суть метода заключается в следующем: сначала записывается код старшей группировки 1-го уровня, затем код группировки 2-го уровня, затем код группировки 3-го уровня и т.д. В результате получается кодовая комбинация, каждый разряд которой содержит информацию о специфике выделенной группы на каждом уровне иерархической структуры. Позиционная система кодирования обладает теми же достоинствами и недостатками, что и иерархическая система классификации.

Комбинированная система кодирования характеризуется тем, что часть признаков кодируются с использованием одной системы кодирования, а часть – с использованием другой.

Выбор конкретной системы кодирования зависит от объема кодируемой номенклатуры, ее стабильности, от задач, стоящих перед системой, и от показателей эффективности обработки информации при использовании какой-либо системы.

Состав и содержание операций проектирования классификаторов

Все классификаторы, разрабатываемые и используемые в ЭИС, имеют эталонную и рабочую формы.

Эталонная форма классификатора – это официальное издание классификатора на бумажном носителе, удобное для осуществления его ведения.

Рабочая форма классификатора - это весь классификатор или его раздел, занесенный на машинный носитель и удобный для обработки информации.

Весь процесс разработки системы классификаторов для ЭИС можно разбить на четыре этапа.

На первом этапе «Разработка ТЗ на проектирование» выполняется два вида работ:

1. Определение состава, назначения и сферы действия классификаторов, используемых в системе. Перечень классификаторов определяется на основе анализа реквизитного состава первичных и результатных документов и выделения всей совокупности реквизитов-признаков.

По назначению выделяют следующие виды классификаторов:

  • для однозначной идентификации объекта;

  • для передачи информации на расстояние по каналам связи;

  • для поиска и логической обработки первичной информации с целью получения и выдачи результатной информации.

По сфере действия выделяют следующие виды классификаторов: общероссийские, межотраслевые, отраслевые, региональные и локальные.

2. Определение состава исходных данных и требований к разрабатываемым классификаторам. К исходным данным, используемым в процессе проектирования классификаторов, относятся:

  • состав задач, для которых разрабатывается классификатор;

  • состав объектов классификации и мощность исходного множества;

  • состав признаков классификации и число значений каждого признака.

Требования, предъявляемые к классификаторам:

  • полнота охвата объектов и признаков классификации;

  • согласованность признаков деления множеств объектов с алгоритмами обработки информации;

  • взаимная однозначность наименований объектов и их кодовых обозначений;

  • простота кодирования и возможность автоматизации процесса классификации и кодирования;

  • возможность увязки с другими классификаторами и системами обозначений.

На втором этапе «Разработка методических материалов проектирования», выполняется разработка основных критериев и принципов построения каждого классификатора.

Критерии построения классификатора:

  • критерий отнесения того или иного объекта к конкретному классифицируемому множеству;

  • степень охвата кодируемого множества объектов.

Принципы построения классификатора определяются структурой классификатора, т.е. количеством ветвей, выходящих из каждой классификационной группировки, количеством ступеней и числом уровней классификации.

Классификатор считается однородным, если на каждой ступени из каждой классификационной группировки выходит одинаковое количество ветвей.

Далее разрабатывается система взаимодействия классификаторов разных уровней и транслятор перехода от одного классификатора к другому.

Существуют следующие системы взаимодействия:

  • система равноправных классификаторов характеризуется тем, что на каждом уровне управления используется свой классификатор, а для получения или передачи информации из внешней среды используется соответствующий транслятор. Недостаток: чем больше количество потоков информации на входе, тем больше трансляторов следует разработать.

  • система приоритетных классификаторов применяется для предприятий одной отрасли. На каждом предприятии отрасли и на каждом уровне управления имеются локальные классификаторы. Обмен информацией осуществляется в терминах классификатора вышестоящего уровня. В результате уменьшается количество трансляторов, однако трудности возникают при передаче потоков информации между предприятиями, относящимися к разным отраслям.

  • система классификаторов-посредников применяется при межотраслевом управлении. На каждом объекте любого уровня управления обработка ведется в терминах своего локального классификатора, а обмен - в терминах одного классификатора-посредника. Преимущество: необходимо создать только один транслятор для каждого предприятия.

  • система единого классификатора для обработки информации на всех предприятиях возможна только гипотетически, но реально ее нельзя осуществить из-за необходимости кодирования всей информации, существующей в стране, используя очень громоздкие классификаторы.

На третьем этапе «Организация сбора и обработки исходных данных»:

  • определяется перечень решаемых задач, использующих классификаторы;

  • выделяются классифицируемые объекты;

  • определяется состав признаков классификации и значения признаков;

  • производится лингвистическая обработка этих данных (удаление синонимов, омонимов, антонимов и др.);

  • производится согласование используемой терминологии в исходных данных с ГОСТами.

На четвертом этапе «Составление классификаторов и системы их ведения» осуществляется построение эталонной и рабочей формы классификатора и системы ведения классификатора,

Эталонный классификатор должен быть согласован, отпечатан типографским способом и распространен всем пользователям для кодирования информации первичных документов.

Рабочие классификаторы наносятся на машинные носители, передаются пользователям и заносятся в файлы справочников баз данных для выполнения процедуры автоматического заполнения машинных форм первичных документов и для раскодирования результатной информации, получаемой после ее обработки.

К задачам, решаемым системой ведения классификатора, относятся:

  • актуализация классификатора, т.е. постоянное пополнение и изменение объектов классификации и кодирования;

  • своевременное оповещение всех пользователей о происходящих изменениях;

  • реструктуризация, или пересмотр структуры классификатора.

Все работы по проектированию классификаторов заканчиваются экспериментальной проверкой и внесением коррективов, утверждением, изданием и рассылкой классификаторов всем пользователям.