- •Введение в технологии баз данных и знаний план
- •1. Предмет и содержание дисциплины. Ее связь с другими дисциплинами.
- •Аннотация
- •1. Предмет и содержание дисциплины «технологии баз данных и знаний» и ее связь с другими дисциплинами
- •2. Экономическая информация 2.1. Структурные единицы экономической информации
- •2.2. Измерение объема экономической информации
- •3. Экономические информационные системы
- •4. Внемашинная организация экономической информации
- •4.1. Классификация экономической информации
- •4.2. Кодирование экономической информации
- •4.3. Штрих код
- •5. Внутримашинная организация данных 5.1. Файловая организация данных
- •5.2. Понятие базы данных
- •5.3. Приложения базы данных
- •5.4. Компоненты базы данных
- •5.5. Базы данных, имеющиеся в Республике Беларусь
4. Внемашинная организация экономической информации
Обрабатываемая информация может быть представлена в двух видах: внемашинной и внутримашинной.
К внемашинной относится та часть информации, которая обслуживает системное управление в виде, воспринимаемом человеком без каких-либо технических средств, например, документ: наряды, акты, накладные, счета, ведомости и др.
Формой представления внемашинной информации являются документы. Документ - это информационное сообщение на естественном языке, зафиксированное ручным или печатным способом на бланке установленной формы и имеющее юридическую силу.
Структурно документ должен включать следующие разделы:
Заголовочная часть - это наименование и характеристика документа, зона для проставления кодов, постоянные реквизиты и характеристики;
Содержательная часть - это место, где располагаются показатели;
Оформительная часть - содержит подписи юридических лиц, дату составления, печать.
Документы классифицируют по ряду признаков:
Сфере деятельности (плановые, учетные, статистические, банковские, финансовые и т.д.);
Отношению к объектам управления (входящие, исходящие);
Содержанию хозяйственных операций (материальные, денежные);
Назначению (распорядительные, исполнительные, комбинированные);
Способу заполнения (заполняемые с помощью технических средств и заполняемые вручную).
Внемашинное информационное обеспечение включает внемашинную информационную базу и средства организации и ведения информационной базы. Внемашинная информационная база подразделяется на нормативно- справочную информацию, которая мало меняется во времени, и оперативную, фиксирующую оперативно меняющиеся данные. Например: номенклатурные ценники - это нормативная информация, а приходно-расходные ордера - оперативная. К средствам организации и ведения информационной базы относятся системы классификации и кодирования информации, системы организации и ведения документации.
Внутримашинная информация - содержится на машинных носителях и состоит из файлов. Внутримашинное информационное обеспечение включает внутримашинную информационную базу и средства организации и ведения этой информационной базы. Внутримашинную информационную базу можно создать либо как множество локальных, т.е. независимых файлов, каждый из которых отражает некоторое множество однородных «управленческих» документов (например, накладных), либо как базу данных. К средствам организации и ведения базы относят соответствующие программные средства: СУБД, Сервисные средства, прикладные программы пользователя, инструкции.
При изучении внемашинной части экономической информации важно ее правильно классифицировать и кодировать.
4.1. Классификация экономической информации
Для представления информации, содержащейся в документах, в форме, удобной для ввода и обработки, используется классификация и кодирование информации. Классификация - это распределение множества объектов на подмножества в соответствии признаками сходства и различия. Совокупность правил классификации и результата классификации называется системой классификации.
При классификации экономической информации наиболее широко используют иерархическую и фасетную системы классификации. Под иерархической системой понимают такую систему, в которой между классификационными группировками установлено отношение подчинения. Классифицируемое множество объектов делиться по некоторому выбранному признаку на крупные группировки, затем каждая группировка разбивается на ряд последующих группировок, которые в свою очередь распадаются на более мелкие, постепенно конкретизируя объект классификации. Например, группу людей по росту можно разбить на две подгруппы: до 150 и выше 150 см. Затем группу с ростом выше 150 см можно снова разбит на более мелкие подгруппы: 151-160; 161-170; выше 171 см и т.д.
Под фасетной системой классификации понимают такую систему, при которой классифицируемое множество образует независимые группировки по различным аспектам классификации. Она не имеет жесткой классификационной структуры и заранее построенных конечных группировок. При ней множество объектов, характеризующихся некоторым набором признаков (фасетов), значения которых соответствуют конкретным выражениям указанных признаков, делится многократно и независимо. Например, ту же группу людей можно классифицировать по полу, затем независимо от пола - по возрасту, затем независимо от возраста - по месту жительства.
Наиболее общим направлением классификации экономической информации можно считать ее деление по таким признакам, как:
сфера возникновения и потребления,
стадия возникновения,
функции управления,
стабильность,
полнота,
отношение к процессу обработки и хранения,
истинность,
способ отражения,
отношение к входу и выходу,
форма сигналов.
Классификация информации по каждому из этих признаков способствует ускорению процесса ее обработки. Так, классификация по функциям управления позволяет правильно выделить функциональные подсистемы, что дает возможность разработать коды, организовать сортировку информации, подводить итоги по группам. Выделение стабильной и нестабильной, истинной и неистинной информации создает условия для проверки достоверности исходной и результативной информации и т.д.
По сфере возникновения и потребления экономическая информация подразделяется на внутреннюю и внешнюю. Внутренняя - возникает и циркулирует внутри объекта. Внешняя поступает в объект извне. Выделение внешней информации позволяет в системах правильно определить и оценить информационные связи одной системы с системой других уровней управления.
По стадиям возникновения информацию делят на первичную и вторичную. Первичная информация возникает на начальной стадии управления в результате действия источника информации. Эта информация не подвергается вычислительной обработке, она лишь фиксируется в момент возникновения. Вторичная информация, называемая еще производной, представляет собой результат обработки как первичной, так и любой другой информации. Во вторичной информации, в свою очередь, выделяют информацию промежуточную и результативную.
Промежуточная информация является результатом расчетов и используется в качестве исходной для решения других задач. Результатная информация - это результат расчетов, использующихся при управлении работой экономического объекта.
Для получения первичной информации выполняются процедуры ее сбора, регистрации и передачи. А для получения результативной - процедуры обработки, хранения, размножения и поиска. В зависимости от характера решаемой задачи процедуры выполняются в определенной последовательности при помощи соответствующих технических средств и образуют технологический процесс обработки информации.
По функции управления выделяют информацию учетную, плановую, финансовую, нормативную, прогнозную, конструкторско-
технологическую.
Функции управления включают в себя:
уровень производства (народное хозяйство, отрасль, подотрасль, объединение, предприятие, структурные подразделения предприятия);
элементы производства (предметы труда, средства труда, труд, готовая продукция и др.);
стадии управления (прогнозирование, нормативная информация, плановая, учетная и др.).
Для выполнения многих функций производства недостаточно экономической информации, требуется еще и техническая информация. Часть технической информации, используемой совместно с экономической, называется нормативной. Для автоматизированной обработки экономической информации наиболее часто используется нормативная, плановая и учетная. Плановая информация делится на информацию перспективного, технико-экономического и оперативно-производственного планирования. А учетная - бухгалтерского учета, статистического учета и оперативно- технического учета.
По стабильности экономическую информацию подразделяют на переменную, постоянную, условно-постоянную.
Переменная информация изменяется за достаточно короткие периоды. В экономических задачах к переменной информации относят ежедневную, месячную информацию. Переменная информация обычно участвует в одном технологическом цикле машинной обработки. Постоянная информация не изменяется в течение продолжительного периода. Это справочные сведения, нормативы, расценки и т.п. Для оценки постоянства информации используют коэффициент стабильности. Информация считается постоянной, если коэффициент стабильности выше значения 0,85. К условно- постоянной информации относят информацию с коэффициентом стабильности равным 0,5-0,85.
По полноте информацию делят на достаточную, недостаточную, избыточную. При недостаточной информации решить задачу порой вообще невозможно.
По истинности, т.е. по критерию соответствия отражаемым явлениям выделяют информацию достоверную и недостоверную. Недостоверная информация ведет к ошибкам в управлении, к сокрытию недостатков.
По отношению к процессу обработки и хранения экономическую информацию подразделяют на обрабатываемую и необрабатываемую. В экономических информационных системах некоторая часть информации не подвергается обработке и называется необрабатываемой. Она складывается из входящей внешней информации и входящей внутренней. При выходе из экономической информационной системы необрабатываемая информация подразделяется на исходящую внешнюю и исходящую внутреннюю.
Другая часть информации участвует в процессе обработки и называется обрабатываемой. Она складывается из входящей внешней информации и входящей внутренней. В результате обработки получается, как правило, новая информация, которая называется производной. Производная информация в свою очередь подразделяется на два потока: исходящую внешнюю (результативную), которая вместе с необрабатываемой исходящей внешней информацией образует исходящую информацию экономической информационной системы: и исходящую внутреннюю (промежуточную), которая потребляется объектом управления и вместе с необрабатываемой внутренней информацией составляет поток исходящей внутренней информации экономической информационной системы. Обычно промежуточные показатели не имеют самостоятельного значения и выводятся лишь для облегчения вычислений и контроля.
Довольно часто одна и та же информация и потребляется (является результатной), и продолжает функционировать при дальнейшей обработке (является промежуточной) одновременно.
В процессе обработки из известных исходных показателей должны быть получены неизвестные результатные показатели. В получении результатных показателей заключается вся цель обработки. При этом должен соблюдаться принцип: минимум исходных показателей и максимум производных.
По отношению к входу, выходу системы выделяют информацию входящую и исходящую. С кибернетической точки зрения экономическую информационную систему объекта можно рассматривать как «черный ящик», который на входе получает некоторую информацию, а на выходе выдает, вообще говоря, уже другую информацию. Информацию, поступающую в данную информационную систему, называют входящей, а информацию, получаемую на выходе, - исходящей.
Как входящая, так и исходящая информация подразделяется на внешнюю, связанную с внешним по отношению к данному объекту миром, и внутреннюю, связанную непосредственно с управляемым объектом. Внешняя информация разрабатывается вне данного объекта и характеризует его производственно-хозяйственные отношения с другими объектами. Она представляет в общем объеме информации небольшой процент, что в значительной степени снижает к ней интерес. Внутренняя информация получается на объекте.
Входящая внутренняя информация, называемая обычно первичной, является основой для регулирования объектом. В выработке исходящей внутренней информации фактически заключается весь смысл управления. Внутренняя информация (исходящая и входящая) осуществляет прямую и обратную связь экономической информационной системы с объектом управления.
По форме сигналов представления информацию делят на дискретную (в виде цифр, букв) и непрерывную (в виде кривых). Дискретная информация в ЭВМ передается набором символов. Символ - это буква, цифра или служебный знак, изображенный в данном алфавите. Символы объединяются в слова. Слово - это один или несколько символов, сгруппированные для машинного представления. Совокупность слов переменной длины, логически связанных между собой и представляющих единое целое, называется записью. Записи объединяются в файлы. Файл - группа записей, имеющих одинаковую организацию и структуру и относящихся к одноименным объектам.