- •Введение в технологии баз данных и знаний план
- •1. Предмет и содержание дисциплины. Ее связь с другими дисциплинами.
- •Аннотация
- •1. Предмет и содержание дисциплины «технологии баз данных и знаний» и ее связь с другими дисциплинами
- •2. Экономическая информация 2.1. Структурные единицы экономической информации
- •2.2. Измерение объема экономической информации
- •3. Экономические информационные системы
- •4. Внемашинная организация экономической информации
- •4.1. Классификация экономической информации
- •4.2. Кодирование экономической информации
- •4.3. Штрих код
- •5. Внутримашинная организация данных 5.1. Файловая организация данных
- •5.2. Понятие базы данных
- •5.3. Приложения базы данных
- •5.4. Компоненты базы данных
- •5.5. Базы данных, имеющиеся в Республике Беларусь
4.2. Кодирование экономической информации
Важным вопросом при обработке информации является ее кодирование. Кодирование вызвано необходимостью передачи информации по каналам связи, хранения ее на внешних носителях и обработки с помощью технических средств. Кодирование позволяет более экономно изображать и систематизировать информацию. Закодированную информацию часто удобнее воспринимать зрительно, ее легче передавать, обрабатывать и использовать. Коды позволяют уменьшить объем информации, облегчить запись на машинные носители, поиск и сортировку информации. Кодирование повышает также надежность информации.
Согласно единой системе классификации и кодирования технико- экономической информации (ГОСТ 17369-78) кодирование - это образование и присвоение объекту классификации, признаку классификации и (или) классификационной группировке кодового обозначения. Кодовое обозначение - это обозначение объекта классификации, признака классификации и (или) классификационной группировки знаком или группой знаков в соответствии с принятым методом кодирования. Известны следующие метода кодирования информации:
порядковый;
серийно-порядковый;
последовательный;
параллельный.
Порядковый - это такой метод кодирования, при котором кодовыми обозначениями служат числа натурального ряда (ГОСТ 17369-78). При порядковом методе каждой единице информации присваивается номер по порядку без какого-либо пропуска номеров. Новые элементы получают номера в конце имеющегося перечня. Здесь никакой предварительной классификации не требуется. Последовательность присвоения кодов определяется чаще всего хронологией возникновения информации. Примером использования порядкового метода кодирования является систематизация домов на улице, квартир в доме.
Удобство этого метода в простоте. А к недостаткам можно отнести отсутствие всякой классификации, невозможность вставить элемент внутрь. Нет возможности выделить группы однородных признаков. Все это усложняет обработку данных на ЭВМ. Поэтому этот метод кодирования рекомендуется использовать для небольших, простых и постоянных множеств. Например, категорий работающих, видов образования, национальностей,
единиц измерения. В качестве примера рассмотрим кодирование единиц измерения:
Единица измерения |
Код |
Миллиграмм |
01 |
Грамм |
02 |
Килограмм |
03 |
Центнер |
04 |
Тонна |
05 |
Метр |
06 |
Пара |
07 |
Штука |
08 |
Серийно-порядковый - это такой метод кодирования, при котором кодовыми обозначениями служат числа натурального ряда с закреплением отдельных диапазонов (серий) этих чисел за объектами классификации с одинаковыми признаками (ГОСТ 17369-78). Серийно-порядковый метод кодирования предполагает разделение информации по какому-либо признаку на отдельные части (серии). Для каждой серии отводится своя группа условных обозначений. При этом номера единиц информации последующих серий не продолжают строго последовательно номера имеющихся единиц информации предыдущей серии: между ними делается разрыв. Примером может служить кодирование цехов на предприятиях. Так, если имеется 10 основных цехов и 3 вспомогательных, то их можно закодировать следующим образом: 01, 02, ... , 19; 25, 26, 27.
Серийно-порядковый метод используется для множеств, имеющих классификацию по двум признакам: старшему признаку отводится своя группа номеров, внутри которой все элементы младшего признака кодируются по порядку. Поэтому этот метод и называется серийно-порядковым. Размер серии устанавливается с учетом количества элементов младшего признака и необходимости резерва свободных номеров на случай расширения. Для новых номеров отводятся кодовые обозначения из резерва свободных номеров соответствующей серии. Этот метод опирается на иерархическую систему классификации.
Серийно-порядковый метод обеспечивает получение итогов по сериям, но лишь по одному классификационному признаку. Он позволяет сохранять принцип серийности при расширении номенклатуры. Но так как предвидеть запас кодов трудно, то на практике серийность порой нарушается. Поэтому к недостаткам этого метода кодирования относится то, что размер серии не всегда можно предусмотреть. Серийно-порядковый метод удобен для относительно устойчивых номенклатур. Так, его рекомендуется использовать для кодирования цехов, видов оплат и удержаний.
Последовательный - это такой метод кодирования, при котором в кодовом обозначении последовательно указываются зависимые признаки классификации (ГОСТ 17369-78). Последовательный метод кодирования предполагает наличие иерархической организации информации или разделение ее по ряду признаков. Суть его в том, что каждый признак обеспечивается своей нумерацией в пределах всего признака. Здесь все элементы классифицируются по определенным признакам, и каждому из них отводится свое число позиций (разрядов) в соответствии с количеством элементов данной группировки. Последовательная система кодирования обычно используется при иерархической системе классификации.
Рассмотрим в качестве примера последовательного метода кодирования присвоение кодовых обозначений наименованиям материалов. Предположим, надо закодировать классификатор материалов по укрупненной номенклатуре. Для этого материалы делят на классы, каждый класс - на подклассы, подкласс - на группы, группы - на подгруппы, а каждая подгруппа содержит определенное количество наименований, сортов и размеров материалов (табл.1). Например: класс - это основные материалы и вспомогательные материалы; подкласс - это черные металлы, цветные металлы и т.д.; группа - это чугун, сталь и т.д.; подгруппа у чугуна может быть: круглый и т.п.; и наконец, всякий материал имеет сорт и размер.
Таблица 1
Присвоение кодовых обозначений наименованиям материалов
Класс |
Подкласс |
Группа |
Подгруппа |
Сорт, размер |
(2 разряда) |
(1 разряд) |
(1 разряд) |
(2 разряда) |
(3 разряда) |
01 |
1 |
1 |
01 |
001 |
01 |
2 |
2 |
05 |
050 |
10 |
1 |
5 |
09 |
120 |
15 |
9 |
9 |
01 |
055 |
15 |
9 |
9 |
12 |
150 |
В целом, как видно из таблицы, длина кодового обозначения в нашем примере равна 9 позициям. При использовании последовательного метода кодирования эти 9 позиций распределяются так: классы - 2; подклассы - 1; группы - 1; подгруппы - 2; сорт, размер - 3.
Из приведенной таблицы можно получить, например, следующие коды: 01101001 и 012205050 и др.
Количество элементов в каждой классификационной группировке может быть, например, таким (рис.4): классы - 15 элементов, подклассы - 9, группы - 9, подгруппы - 12, сорт, размер - больше 100, но меньше 1000.
Рис.
4. Иерархическая
схема классификации материалов
Подклассы
Подгруппы
Сорт,
размер
Группы
Параллельный - это такой метод кодирования, при котором в кодовом обозначении объекта классификации или классификационной группировке указываются независимые признаки классификации (ГОСТ 1736978). Параллельная система кодирования чаще используется при фасетной системе классификации. В качестве примера рассмотрим классификацию сотрудников предприятия. Здесь можно учитывать следующие классификационные признаки: пол, возраст, образование, семейное положение и др. Очевидно, что все эти признаки не зависят друг от друга. Структура кода может быть такой:
табельный номер сотрудника - 3 символа;
пол - 1 символ;
возраст - 2 символа;
образование - 1 символ,
семейное положение - 1 символ.
Удобством последовательного и параллельного методов кодирования является четкое выделение каждого классификационного признака, стройность построения, удобство при обработке на ЭВМ. Недостаток этих методов - их сложность и громоздкость. Эти методы используются обычно при кодировании больших многопризначных номенклатур.
Для поддержки различных систем классификации и кодирования разрабатываются специальные документы, называемые классификаторами. В
республике Беларусь имеется Единая система классификации и кодирования (ГОСТ 173689-78), в которой определяется такое понятие, как классификатор. Классификатор - это систематизированный свод наименований объектов классификации, признаков классификации и (или) классификационных группировок и их кодовых обозначений. Классификаторы бывают: общегосударственные; отраслевые и локальные.
Общегосударственные классификаторы утверждаются и регистрируются в государственном стандарте РБ и применяются организациями разной ведомственной принадлежности - единые для республики. К ним можно отнести общегосударственный классификатор предприятий и организаций.
К 2008 году Республика Беларусь окончательно перейдет к классификации экономической деятельности по международным нормам. Согласно этим нормам статистическая информация будет обрабатываться по Общегосударственному классификатору видов экономической деятельности (ОКЭД), принятому Европейским союзом. На этот классификатор переходят все страны СНГ.
Согласно ОКЭД все виды экономической деятельности делятся на: добывающие, обрабатывающие и предоставляющие услуги. К добывающим относят: деятельность, связанную с производством сельскохозяйственной продукции, охотой, лесным хозяйством, рыболовством и рыбоводством. К обрабатывающим - переработку сырья, производство и распределение электроэнергии, газа и воды. Остальные - относятся к предоставляющим услуги.
Виды экономической деятельности по ОКЭД делятся на пять вертикальных уровней: четыре первых соответствуют классификации видов Европейского союза, а пятый является специфическим, то есть национальным.
Отраслевые классификаторы применяются внутри министерства или ведомства. Они используются для кодирования информации, специфичной для данной отрасли. К ним относят классификаторы кодов видов оплат и удержаний из заработной платы, видов операций движения материальных средств.
Локальные классификаторы предприятий применяются внутри предприятия, производственного объединения и других подразделений министерств и ведомств. Локальные коды - это индивидуальные коды. Они характерны только для конкретного предприятия.
Классификаторы и коды используются для составления отчетов, сводок и группировки.