Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Дополнительно_ГИС_Шипулин

.pdf
Скачиваний:
32
Добавлен:
21.02.2016
Размер:
4.94 Mб
Скачать

3.2.1.4 Значение классификации для геоинформационных систем

Отсутствие классификаций объектов и свойств является непреодолимым препятствием в создании эффективных информационных систем. Особенно это относится к геоинформационным системам, которые оперируют с огромными совокупностями и большим разнообразием объектов реального мира, их свойствами, связями и отношениями. Классификация лежит в основе эффективной работы ГИС.

В объектно-ориентированном анализе определение общих свойств объектов помогает найти общие ключевые абстракции и механизмы, что, в свою очередь, приводит к более простому проекту системы. Классификация затрагивает многие аспекты объектноориентированного проектирования. Она помогает определить обобщенную, специализированную и собирательную иерархию классов. Определение общих форм взаимодействия объектов позволяет найти механизм, который может стать стержнем реализации проекта и анализа. Она помогает правильно определять модульную структуру. Расположение объектов в одном или разных модулях зависит от степени общности объектов.

Основным средством обеспечения непротиворечивого описания данных является стандартизация и унификация средств и методов их представления. Средством стандартизации и унификации данных является классификация объектов, свойств и отношений. Стандартизация, унификация и классификация объектов, свойств и отношений лежат в основе информационной совместимости разных информационныхсистем.

3.2.2. Базовые понятия единой системы классификации технико-экономической информации

Основу компьютерной информационной системы составляет информационная база, которая являет собой совокупность упорядоченной информации, используемой при функционировании информационной системы. Информационная база имеет целью обеспечить взаимообмен информацией между структурными единицами компьютерной информационной системы, а также информационной системой разныхуровней управления.

161

Успех создания единой информационной базы в значительной мере определяется унификацией и стандартизацией ее составляющей. Здесь классификации и кодировке технико-экономической информации отводится особенная роль, поскольку они являются средствами, которые обеспечивают взаимный обмен информацией между человеком и компьютером. Классификация и кодировка — это две неотделимые части одного процесса — перевода разнообразной информации из естественного языка на формализованный язык компьютерной информационной системы.

Государственный стандарт 17369-85 устанавливает основные термины и определения понятий, применяемых в единой системе классификации и кодирования технико-экономической информации

(ЕСКК ТЭИ) [40].

3.2.2.1 Термины и определения классификации

В ГОСТ 17369-85 определены следующие термины и определения классификации.

Классификация - разделение множества объектов на подмножества по их сходству или различию в соответствии с принятыми методами.

Система классификации - совокупность методов и правил классификации, а также ее результат.

Объект классификации - элемент классифицируемого множества.

Признак классификации - свойство или характеристика объекта, по которому производится классификация.

Значение признака классификации - качественное или количественное выражение признака классификации.

Классификационная группировка - подмножество объектов, полученное в результате классификации.

Иерархический метод классификации - последовательное разделение множества объектов на подчиненные классификационные группировки.

Фасетный метод классификации - параллельное разделение множества объектов на независимые классификационные группировки

Ступень классификации - этап классификации при иерархическом методе, в результате которого получается совокупность классификационных группировок.

Глубина классификации - число ступеней классификации.

162

3.2.2.2 Термины и определения кодирования

В ГОСТ 17369-85 определены следующие термины и определения кодирования.

Код - знак или совокупность знаков, принятых для обозначения классификационной группировки и (или) объекта классификации.

Кодирование - образование и присвоение кода классификационной группировке и (или) объекту классификации.

Система кодирования - совокупность методов и правил кодирования классификационных группировок и объектов классификации заданного множества.

Алфавит кода - система знаков, принятых для образования кода.

Основание кода - число знаков в алфавите кода.

Цифровой алфавит кода - алфавит кода, знаками которого являются цифры.

Буквенный алфавит кода - алфавит кода, знаками которого являются буквы алфавитов естественных языков.

Буквенно-цифровой алфавит кода - алфавит кода, знаками которого являются буквы алфавитов естественных языков и цифры.

Разряд кода - позиция знака в коде.

Длина кода - число знаков в коде без учета пробелов.

Структура кода - условное обозначение состава и последовательности расположения знаков в коде.

Последовательный метод кодирования - образование кода классификационной группировки и (или) объекта классификации с использованием кодов последовательно расположенных

подчиненных группировок, полученных при иерархическом методе классификации, и его присвоение.

Параллельный метод кодирования - образование кода классификационной группировки и (или) объекта классификации с использованием кодов независимых группировок, полученных при фасетном методе классификации, и его присвоение.

Порядковый метод кодирования - образование кода из чисел натурального ряда и его присвоение.

Серийно-порядковый метод кодирования - образование кода из чисел натурального ряда, закрепление отдельных серий или диапазонов этих чисел за объектами классификации с одинаковыми признаками и его присвоение.

163

Перекодирование - присвоение закодированной классификационной группировке или закодированному объекту классификации нового кода.

Перекодировочная таблица - таблица соответствия кодов одних и тех же классификационных группировок и (или) объектов классификации из разных классификаторов.

3.2.2.3 Организационные аспекты классификации

В ГОСТ 17369-85 определены следующие организационные термины и определения.

Классификатор - официальный документ, представляющий систематизированный свод наименований и кодов классификационных группировок и (или) объектов классификации.

Позиция классификатора - наибольшее количество позиций, которое может содержать классификатор.

Емкость классификатора - количество свободных позиций в классификаторе.

Внедрение классификатора - проведение комплекса мероприятий, обеспечивающих применение классификатора в предназначенной сфере деятельности.

Ведение классификатора - поддержание классификатора в достоверном состоянии.

Категория классификатора - признак, указывающий на принадлежность классификатора к определенной группе в зависимости от уровня его утверждения и сферы применения.

Государственный классификатор - классификатор, утвержденный для применения в автоматизированных системах управления различныхминистерств (ведомств).

Отраслевой (ведомственный) классификатор - классификатор, введенный в установленном порядке для применения в

автоматизированной

системе

управления

отрасли

министерства

(ведомства).

 

 

 

 

 

 

Классификатор

предприятия - классификатор,

введенный

в

установленном

 

порядке

для

применения

в

автоматизированной

системе управления предприятия (АСУП).

 

Единая система классификации и кодирования техникоэкономической информации (ЕСКК ТЭИ) - совокупность взаимоувязанных государственных классификаторов технико-

164

экономической информации, системы ведения н руководящих нормативных документов по их разработке, внедрению, ведению, совершенствованию н контролю за внедрением.

Регистрация классификатора - присвоение утвержденному классификатору регистрационного номера и запись необходимых сведений о нем в реестр.

3.2.2.4 Особенности создания системы классификации

Создание системы классификации на основании базовых понятий имеет некоторые особенности [41].

Система классификации определяется и характеризуется использованным методом классификации, признаками классификации (положенным в основу выделения классификационной группировки), их последовательностью и количеством уровней (ступеней) классификации, а также количеством группировок (емкостью). Метод классификации — это в сущности совокупность правил создания системы классификационной группировки и их связки между собой.

Иерархический метод классификации

Иерархический метод классификации характеризуется тем, что начальное множество объектов последовательно разделяется на группировку (классы) первого уровня разделения, дальше — на группировку следующего уровня и так далее. Каждая группировка разделяется на группировку следующего уровня. Совокупность группировки образует при этом иерархическую древовидную структуру.

 

 

 

 

 

 

 

 

М

 

 

 

 

 

 

 

0 уровень

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 уровень

 

 

 

М1

 

 

 

 

М2

 

 

 

 

М3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 уровень

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

М212

 

М222

 

 

 

М232

 

 

 

М242

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3 уровень

 

 

 

 

 

 

 

 

 

 

 

 

М2312

 

 

М2322

 

 

М2332

 

 

М2342

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис.3.2.1 - Схема группировки иерархического метода классификации

165

Количество уровней (ступеней) классификации определяет глубину классификации. Каждая группировка может разделяться на группировку низшего уровня с использованием своего признака; глубина классификации в каждой ветви иерархической структуры может быть разной.

При использовании иерархического метода необходимо соблюдать такие основные правила:

1)разделение каждой группировки выполняется лишь по одному основному признаку;

2)пересечение множеств объектов не допускается; на каждом уровне классификации группировки не должны повторяться;

3)классификация должна охватывать все множество объектов.

Наиболее существенными и сложными вопросами, которые появляются при использовании иерархического метода классификации, является выбор системы признаков, которые станут основой разделения, а также их последовательность. Выбранные признаки должны являться определяющими в развязывании конкретной технико-экономической задачи, для которой создается эта система классификации.

Позитивной чертой иерархического метода классификации является его приспособленность к ручной обработке, структурность, большая информативность кодов, которые несут смысловую нагрузку. В тоже время, иерархический метод классификации имеет недостатки, которые иногда усложняют его использование:

метод имеет жесткую структуру, которая предопределена фиксированностью признаков и их последовательностью; изменение хотя бы одного признака приводит к перераспределению классификационных группировок;

метод не дает возможность агрегировать объекты по любым раньше не предусмотренным произвольным сочетанием признаков, а также в некоторых случаях усложняет автоматизированную обработку, поскольку образуется нестандартное распределение последовательности признаков.

Фасетный метод классификации

При использовании фасетного метода начальное множество объектов может независимо разделяться на классификационную группировку с использованием одного из избранных признаков. Каждый признак фасетной классификации отвечает фасете, который является списком значений именующего признака классификации. Например, признак "цвет" содержит такой список фиксированных

166

значений: красный, желтый, зеленый, голубой, Следуют обратить внимание, что в приведенной отсутствует цвет оранжевый потому, что он не

белый, черный. фасете "цвет" был объектом

классификации.

Система классификации фасетным методом может быть представлена перечнем независимых фасетов (списков), которые содержат значение признаков классификации. Любая группировка в системе классификации может быть определена одним признаком или набором признаков объектов классификации.

При применении фасетного метода классификации следуют соблюдать такие основные правила:

признаки, которые используются в разных фасетах, не должны повторяться (принцип взаимного исключения фасетов);

из всяких признаков, которые характеризуют множество объектов классификации, отбираются и фиксируются лишь существенные,

которые обеспечивают решение конкретной задачи.

Фасетний метод классификации не имеет недостатков иерархического метода. Он особенно эффективен при функционировании компьютерныхинформационныхсистем.

Кодирование

Кодирование предназначено для формализированного описания объектов классификации, чаще всего в виде цифровых кодов. Такое представление приемлемее всего для повышения эффективности автоматизированной обработки экономической информации.

В процессе кодировки экономической информации необходимо решить три основные задачи:

1)однозначного обозначения (индентификации) каждого объекта заданного множественного числа,

2)кодирование некоторой совокупности свойств (атрибутов) объекта,

3)обеспечение эффективности и информационной надежности переработки информации.

Основным требованием, которое ставят к кодировке, является однозначное представление каждого объекта кодируемого множественного числа, то есть каждому объекту множественного числа должен отвечать единственный код.

Код любого объекта может состоять из идентификационной части, информационного блока, который содержит набор кодов, отвечающих свойствам данного объекта, и дополнительных разрядов или блоков, которые обеспечивают защиту всего кода от возможной ошибки.

167

При кодировке совокупности свойств объектов, то есть при создании информационного блока, рекомендуют применять два основных методов создания кода: последовательной кодировки на основе использования иерархической классификации и параллельной кодировки на основе фасетной классификации.

В каждой ветви иерархической классификации, как правило, используется своя совокупность свойств. В случае последовательного кодирования код группировки создается на основе кода группировки предыдущего уровня добавлением к нему еще одного разряда (или группы разрядов). При использовании последовательного метода логично строится код (кодовая комбинация), который имеет большую информативность. Но код при этом очень громоздок и имеет сложную структуру. Его целесообразнее использовать лишь в тех случаях, когда информация изменяется в незначительных размерах или вовсе не изменяется в течение длительного времени использования классификаторов, например при разработке общегосударственных классификаторов.

Табл. 3.2.1 - Последовательный метод кодирования

Код

ХХХ

ХХ

ХХХХ

Х

Группировка

Класс

Подкласс

Сорт

Семейство

При использовании фасетной классификации каждая группировка системы классификации отвечает некоторой совокупности значений свойств объектов. При этом каждая группировка первого уровня

разделения отвечает одному значению, второго

— значению двух

свойств и т.п.

 

 

 

 

Табл. 3.2.2 - Параллельный метод кодирования

Код

ХХХ

ХХ

ХХХХ

Х

Фасета

Фасета 1

Фасета 2

Фасета 3

Фасета 4

Самым простым и самым распространенным методом кодировки объектов первичного множества является порядковый метод. При

168

использовании этого метода каждый объект классифицированного множества кодируется с помощью текущего номера. Порядковый метод применяется при кодировке однопризнаковых, постоянной и малозначащей номенклатуры. Порядковый метод кодировки очень прост для идентификации. Но существенным недостатком данного метода является отсутствие в коде любой информации об объекте и относительная сложность автоматической обработки информации при получении итогов по группам объектов.

Табл. 3.2.3 - Порядковый метод кодирования Код ХХХХ

Порядковые числа

1,2,3,4,…,9999

Серийно порядковый метод кодирования характеризуется тем, что первичное множество делится на несколько частей (согласно некоторому признаку), и для кодировки объектов каждой части предназначается серия номеров (кодов). Объекты кодируются порядковым номером в пределах отведенной для них серии. Этот метод кодировки используется для объектов, какие имеют два признака.

Табл. 3.2.4 - Серийно-порядковый метод кодирования Код ХХХ ХХ ХХХХ

Серии порядковых чисел

Серия 1,

1,2,3,…999

Серия 2, 1,2,3,,…,99

Серия 3, 301,302, …,9999

При выборе метода кодировки следует помнить, что этот метод должен обеспечивать:

в пределах заданного множества однозначное определение объекта;

необходимую информацию об объекте;

169

использования как алфавита кода десятичных цифр и букв азбуки, что удобно для машинной обработки и обработки человеком;

по возможности наименьшую длину кода, которая упрощает заполнение документов, упрощает их проверку, уменьшает количество ошибки, размеры машинной памяти и время обработки;

достаточный резерв незанятых кодов, чтобы можно было кодировать новые объекты и группировки, не в нарушение структуры классификатора;

возможность автоматического контроля ошибки, например, внесением для кода контрольного разряда.

Классификация и кодирование — это неотделимый элемент создания и функционирования компьютерной информационной системы. Целью классификации и кодирования является упорядочение и согласование разных предметов, понятий, свойств или других элементов информации. Использованием кодов можно значительно сократить объемы информации и трудоемкость ее обработки на всех этапах технологического процесса автоматизированной обработки данных. Поэтому вопросом разработки рациональных классификаторов во время проектирования информационной системы уделяется большое внимание.

Разработка классификаторов базируется на учете следующих принципов.

1)Обеспечение в классификаторе выделения государственного, ведомственного и местного аспектов управления.

2)Содержание названий единицы информации должно отвечать требованиям государственных стандартов или руководящих технических документов.

3)Классификатор должен обеспечить решение всей задачи в информационной системе при минимальной значительности кодов. Большая значительность кодов усложняет заполнение документов, утруждает их проверку, увеличивает расходы времени на подготовку информационныхмассивов.

4)Построение системы классификации и кодирования нуждается в поддержке принципа взаимно однозначного соответствия классификационной номенклатуре. Каждый код должен обозначать лишь один объект классификации.

5)Система классификации должна обеспечить все виды группирований кодируемых элементов, необходимых для соответствующих расчетов.

170