Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
лекция авто.rtf
Скачиваний:
11
Добавлен:
08.08.2019
Размер:
1.83 Mб
Скачать

Лекция №3 Классификация электронных документов

Возможные подходы к классификации машиночитаемых документов: по способу записи и считывания информации; в связи с технологическими процессами в автоматизированных системах. Классификация электронных документов.

Цель классификации ЭД состоит в выявлении общих свойств и характерных отличий документов, образующихся в ходе деятельности организаций и частных лиц. Выявленные в результате классификации виды ЭД необходимы для проведения основных архивных работ: отбора документов на хранение, их учета, обеспечения сохранности и организации использования.

Можно привести несколько примеров возможных подходов к указанной проблеме.

"Порядок отбора и приема на архивное хранение документов, созданных средствами вычислительной техники" 1995 г. - основной нормативный документ, который регламентирует работу архивов с ЭД, выстраивает следующую иерархию электронных документов: документ - файл - база данных - автоматизированная система. Классификация здесь проводится только для автоматизированных систем (АС), т.к. именно они рассматриваются главным объектом при проведении экспертизы ценности. АС в этом документе различают в зависимости от: 1) их специализированных функций - организационно-методического, технического, программного, информационного, математического, лингвистического, правового, эргономического обеспечения деятельности организаций; и 2) сферы автоматизируемой деятельности - автоматизированные системы управления (АСУ), системы автоматизированного проектирования (САПР), автоматизированные системы научных исследований (АСНИ), информационно-поисковые (АИПС), автоматизированные системы технологической подготовки производства и др.

Те же объекты классификации рассматриваются в "Перечне документов на машинных носителях (ДМН) и автоматизированных банков данных (АБД) автоматизированных систем научно-технического и производственного назначения с постоянными сроками хранения и указания по его применению" (1994). В то же время авторы Перечня указывают на "нецелесообразность рассмотрения ДМН и АБД, исходя из деления АС на виды по их назначению и направлению в автоматизации". Более рациональным им представляется унифицированный подход, "базирующийся на общих чертах, характеризующих различные АС". В соответствии с ним документы группируются по документам на АС (программы, проектная документация и т.д.) и документам, создаваемым в процессе функционирования АС (результаты сбора и обработки данных). Кроме того, в зависимости от способа проектирования АС их делят на: 1) АБД АС индивидуального характера (об отдельных изделиях и технологии их производства); 2) АБД типовых АС; и 3) АБД интегрированных АС.

Более широкий подход к классификации ЭД представлен в "Примерной инструкции по работе с машиночитаемыми документами в организациях, на предприятиях и в ведомственных архивах Республики Беларусь" (1996). Инструкция предназначена для работы непосредственно с электронными документами и, по существу, исходит из анализа их основных компонентов - носителя информации, метаданных и содержания. Предусматривается наличие четырех видов классификации ЭД: 1) по носителю информации - на гибких магнитных дисках, магнитооптических дисках, оптических дисках и магнитных лентах; 2) по информационной технологии - разнообразные автоматизированные системы, банки и базы данных, информационно-поисковые и информационно-справочные системы, текстовые данные, программы и программные средства; 3) в зависимости от комплектности - только файлы на машинном носителе, файлы на машинном носителе плюс документация на бумажном или другом носителе; 4) по видам деятельности организаций - проектная, производственная, коммерческая, финансовая, бухгалтерская, управленческая и т.д.

В качестве нестандартного взгляда на классификацию ЭД можно привести мнение по этому вопросу Г.З. Залаева. Он разделяет понятия "документы на машинных носителях" и "электронные документы". Первые, судя по всему, - это документы, создававшиеся ранее на больших ЭВМ; вторые - документы, появившиеся в результате использования современных средств вычислительной техники. Среди электронных документов Залаев предлагает выделять три группы: 1) оцифрованные ЭД - "документы, полученные в результате конверсии бумажных или технотронных документов в оцифрованную форму"; 2) современные электронные документы - "документы которые существуют только в цифровом виде": Интернет-технологии, WWW-технологии, гипертекст, мультимедиа; 3) продукты безбумажных технологий - электронная почта, цифровые фотографии, "электронные газеты", документы "электронного офиса".

Такая классификация включает продукты самых последних достижений ИТ, однако, принципы ее проведения вызывают большие сомнения. Так, например, первая группа выделяется на основании их значимости для страхового копирования традиционных документов. В связи с этим цифровые фотографии (также как современные музыкальные CD), для которых необходимо то же самое программное обеспечение и применение тех же самых методов хранения, Залаев вынужден поместить отдельно. Особенность второй группы, как указывается - это их многофайловость и значительный объем. Но почему-то "электронные газеты", представляющие собой, как правило, гипертекстовые системы, вошли в состав третьей группы. Документы электронного делопроизводства генетически близки к ДМН, не говоря уже о том, что они часто бывают "многофайловыми и больших объемов". Электронная почта вообще не может считаться документом. Это, как правильно отмечает сам Залаев, - вид электронного сервиса. С помощью электронной почты могут передаваться абсолютно все вышеперечисленные электронные документы.

Таким образом, наблюдаются разные подходы к классификации ЭД. Отличаются они методологическим, концептуальным взглядом на сущность электронных документов: что в них главное - технологическая или содержательная компонента. Вероятно, все эти подходы имеют право на существование, однако, в современных условиях развития ИТ и электронного документооборота точка зрения белорусских архивистов выглядит более привлекательной. Классификационные группировки на основе компонентов ЭД помогают не только гибко применять их в работе архива, они отражают информационную природу документа. Содержание и реквизиты документа, дающие основное представление о его смысле, назначении и границах применения - вот то главное, что всегда находилось в центре внимания документоведов и архивистов. Именно они - тот бесценный капитал, который общество накапливает и использует в своих интересах. Именно они - те узы, которые скрепляют связь времен. Технологическая составляющая ЭД, хотя и имеет важно значение, носит вспомогательный, служебный характер, позволяя обеспечивать доступ к информации, сохранять и передавать ее во времени.

В общем можно предложить классификацию электронных документов по содержанию, контексту, носителю информации и метаданным.

Содержание и контекст ЭД допускают применение традиционных классификационных схем, принятых в научных дисциплинах, которые так или иначе связанны с анализом документов. Например, источниковедение делит документы на законодательные, делопроизводственные, статистические, нарративные, изобразительные источники, периодику, справочные издания и т.д. Документоведение рассматривает их как подлинники и копии, черновики и беловики, как отчетно-распорядительные, финансовые, научно-технические документы, документы по планированию, по личному составу и т.д. Архивоведение может классифицировать документы на открытые и конфиденциальные, по источникам комплектования, хронологии, сферам деятельности организаций и другим признакам. В традиционные схемы не укладываются сами компьютерные программы и сопроводительная документация на информационные системы. Но их можно выделить в специальный вид или рассматривать как научно-техническую документацию.

Наиболее сложным при классификации ЭД является учет метаданных, т.е. технологических характеристик, необходимых для их визуализации. Сложность представляет не столько разнообразие типов, структур и форматов данных, сколько их совокупность в рамках одного документа. Современные ЭД - как правило, комбинированные сложноформатные документы, а тенденции, наблюдаемые в компьютерной отрасли, говорят об их дальнейшем усложнении. Упустив некоторые элементы метаданных при отборе на хранение или при проведении миграции, можно исказить или совершенно утратить документ.

В качестве рабочей модели можно предложить следующее ранжирование ЭД, в зависимости от комбинации метаданных:

- Одно-ранговые ЭД: документ состоит из одного типа данных, объединенных одной структурой, и записан в один файл определенного формата. Наиболее характерные примеры: простые текстовые файлы (в том числе, передаваемые по электронной почте), графические (оцифрованные) изображения, оцифрованные аудио- и видеодокументы;

- Двух-ранговые ЭД: документ состоит из нескольких типов данных, объединенных одной структурой, и записан в один файл определенного формата. Примеры: файлы электронных таблиц (Excel), "плоские" реляционные (однотабличные) базы данных, документы, состоящие из геометрических объектов (схемы, чертежи, рисунки);

- Трех-ранговые ЭД: документ состоит из нескольких типов данных, объединенных в несколько структур, и записан в один файл определенного формата. Это - документы офисных приложений или издательских систем, в которых объединяются текстовые, графические и табличные данные (например, MS Office или Adobe PageMaker), сюда же можно отнести базы данных, хранящиеся в СУБД или компьютерных приложениях, которые поддерживают архитектуру "клиент - сервер" (например, Oracle или Lotus Notes);

- Четырех-ранговые ЭД: документ состоит из нескольких типов данных, объединенных в несколько структур и записанных в нескольких файлах общего формата. К ним относятся многофайловые системы баз данных всех типов (вместе с системными файлами и, возможно, интерфейсом), документы САПР, документы, хранящиеся в некоторых аналитико-поисковых (например, "Кодекс Плюс"), геоинформационных и гипертекстовых системах, "виртуальные документы";

- Пяти-ранговые ЭД: документ состоит из нескольких типов данных, объединенных в несколько структур и записанных в нескольких файлах разных форматов. Для визуализации этих документов необходимо использовать интегрированные программные приложения, которые объединяют работу программ разных типов. К ним относятся: документы с криптографической защитой, документы корпоративных информационных систем, гипертекстовые и мультимедийные системы, WWW-странички в Интернет, сложные геоинформационные системы.

Внутри ранга электронные документы можно разделять по конкретным технологиям, в рамках которых они были созданы: текстовым или графическим процессорам, типам СУБД, гипертекстовым системам и т.п.

Ранжирование ЭД позволяет подходить к ним с общих методологических позиций. Рассмотрение происходит в зависимости от объема материальных и интеллектуальных затрат, необходимых для проведения последующей миграции. Чем выше ранг ЭД, тем сложнее ее осуществить. Для обеспечения долговременной сохранности четырех- и пяти-ранговых ЭД требуются большие машинные ресурсы, труд высококвалифицированных программистов и ясное представление об их строении.

В настоящее время электронные документы всех видов широко используются в работе государственных и частных организаций. От того, насколько точно и полно они будут классифицированы, зависит качество их последующего отбора на хранение, сохранность и полноценное использование.

Носители электронной информации вносят определенную специфику в классификацию ЭД, которая связана с разнообразием материала и технологий записи/считывания данных. При использовании практически любого вида (и даже разновидности) носителя необходимо самостоятельное устройство для записи и считывания информации (дисковод, стример и т.п.). Поэтому следует учитывать на каком носителе электронный документ записан:

- перфо-носитель;

- магнитная лента;

- гибкий магнитный диск;

- постоянный жесткий магнитный диск;

- сменный жесткий магнитный диск;

- магнитооптический диск;

- оптический диск типа CD-ROM или CD-R (допускающий перезапись данных);

- оптический диск типа CD-RW (не допускающий перезапись данных);

- оптический диск типа DVD-ROM или DVD-R (допускающий перезапись);

- оптический диск типа DVD-RW (не допускающий перезапись).