Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ИСЭ_ Информационное_обеспечение_АИС_предприятий....doc
Скачиваний:
9
Добавлен:
25.04.2019
Размер:
176.13 Кб
Скачать

3. Методы классификации и кодирования информации

Система классификации – совокупность методов и правил классификации и ее результат, т.е. система классификационных группировок (классов). Система классификации может быть представлена также в виде перечня признаков классификации (фасетов) и их значений и правил образования группировок путем комбинирования признаков-фасетов.

Основными методами классификации являются иерархический и фасетный, методами кодирования – последовательный, параллельный, порядковый и серийно-порядковый.

Иерархический метод классификации – последовательное разделение множества объектов на подчиненные классификационные группировки. Он характеризуется тем, что исходное множество объектов, например товаров, последовательно разделяется по одному признаку на группировки (подмножества) первого уровня деления, затем каждая группировка в соответствии со своим признаком делится на группировки следующего уровня и т.д. Совокупность группировок образует при этом иерархическую древовидную структуру в виде перевернутого дерева, которую часто изображают в виде ветвящегося графа. Число уровней (ступеней) определяет глубину классификации. На каждом уровне деления используется чаще всего один признак. Основная проблема при разработке классификатора заключается в выборе оптимальных структурных характеристик системы классификации – последовательности признаков и основания деления.

Фасетный метод классификации – параллельное разделение множества объектов на независимые классификационные группировки. Он характеризуется тем, что исходное множество объектов может независимо делиться на классификационные группировки, каждый раз с использованием одного из выбранных признаков. Используется совокупность фасетов, представляющих собой признаки (свойства) объектов классифицируемого множества, каждый фасет-признак описывается полным набором своих значений. Например, признак "Материал" содержит список значений: капрон, лен, хлопок, ... , шелк; признак "Цвет" включает значения: желтый, зеленый, ... , фиолетовый с соответствующими кодами. На основе совокупности фасетов может быть образовано множество систем классификации, каждая из которых определяется фасетной формулой, т.е. последовательностью фасетов-признаков, используемых для ее построения.

Система кодирования – совокупность методов и правил кодирования классификационных группировок и объектов классификации заданного множества. Это совокупность символов (знаков) и правил, определяющих метод обозначения множества объектов с помощью комбинаций символов. В качестве синонима системы кодирования используется понятие «код». Код – это знак или совокупность знаков, принятых для обозначения классификационной группировки и (или) объекта классификации. Различают коды цифровые, алфавитные (буквенные) и алфавитно-цифровые. Код (кодовое обозначение) образуется в соответствии с правилами кодирования и характеризуется длиной – числом знаков (разрядов) и структурой – и условным обозначением состава и последовательности расположения знаков в коде.

Различают последовательный, параллельный, порядковый и серийно-порядковый методы кодирования. Последовательный метод кодирования – образование кода классификационной группировки и (или) объекта классификации с использованием кодов последовательно расположенных подчиненных группировок, полученных при и е р а р х и ч е с к о м методе классификации, и его присвоение. Для кодирования каждого свойства объекта используется один или несколько разрядов кода, однако значение свойства определяется не только символами этих разрядов, но и комбинацией символов на предыдущих разрядах.

Параллельный метод кодирования – образование кода классификационной группировки и (или) объекта классификации с использованием кодов независимых группировок, полученных при ф а с е т н о м методе классификации, и его присвоение. Каждое свойство объекта кодируется независимо с помощью одного или нескольких разрядов в пределах одной кодовой комбинации.

Порядковый метод кодирования – образование кода из чисел натурального ряда и его присвоение. Множеству объектов кодовые обозначения могут присваиваться в порядке возрастания чисел (номера студентов в журнале и т.п.).

Серийно-порядковый метод кодирования – образование кода из чисел натурального ряда, закрепление отдельных серий или диапазонов этих чисел за объектами классификации с одинаковыми признаками и их присвоение. Множество объектов предварительно разбивается на ряд подмножеств, а кодирование в пределах каждого п о д м н о ж е с т в а осуществляется методом последовательной регистрации в пределах отдельного диапазона (серии кодовых обозначений). Например, местным поставщикам района (города) присваиваются коды с 001 по 099, поставщикам других районов области – с 100 по 199, поставщикам других областей – с 200 по 300.