Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Информационные технологии управления.pdf
Скачиваний:
114
Добавлен:
28.02.2016
Размер:
1.61 Mб
Скачать

Данная модель для задания пространства системы управления документооборотом работоспособна как для неавтоматизированных, так и для автоматизированных систем. В обоих случаях разными средствами решается задача совершенствования системы документооборота. Этот процесс можно представить в виде кривой в трехмерном пространстве координат F, D, R. Причем, чем круче эта кривая, тем быстрее идет процесс модернизации, и чем больше значения всех трех координат, тем выше уровень автоматизации в организации.

Тема 4. Системы автоматизации работы с документами

Общие требования к системе электронного документооборота

Система автоматизации документооборота – одна из важнейших составляющих корпоративной информационной системы. В общем случае она позволяет автоматизировать ручные, рутинные операции, автоматически передавать и отслеживать перемещение документов внутри предприятия, контролировать выполнение поручений, связанных с документами и т.д. Для этого она должна удовлетворять ряду требований.

Масштабируемость. Система документооборота должна поддерживать число пользователей от единиц до тысяч (например, 5-5000) пользователей. При этом способность системы наращивать свои возможности должна определяться только мощностью аппаратного обеспечения.

Выполнение этого требования обеспечивается применением серверов баз данных производства таких компаний как Oracle, Informix, Sybase и др.

Распределенность. Архитектура систем документооборота должна поддерживать взаимодействие территориально распределенных подразделений и удаленных пользователей. Это связано с тем, что основные проблемы документооборота возникают в территориально распределенных организациях.

Модульность. Система документооборота должна состоять из отдельных модулей, интегрированных между собой. Актуальность данного требования обусловлена необходимостью адаптации системы (последовательного наращивания) к спектру задач пользователя.

Открытость. Система документооборота должна обеспечивать возможность интеграции с другим программным обеспечением, например, прикладной бухгалтерской программой. Для этого система документооборота должна иметь открытые интерфейсы.

Основные технологии электронного документооборота

В самом широком смысле под автоматизацией документооборота подразумевают любые информационные технологии, связанные с электронной обработкой документов – от использования текстовых процессоров до систем управления потоком работ. Произведем их классификацию.

Работа собственно с документами, точнее с файлами документов на ма-

шинных носителях (ввод, редактирование и т.д.). Существует огромное количество программных продуктов, позволяющих готовить текстовые, табличные, графические, мультимедийные и другие типы документов. Многие из них хорошо знакомы обычным пользователям.

22

Управление документами. Управление документами (document management) одно из наиболее динамично развивающихся направлений автоматизации документооборота. Для решения этой задачи используются технологии систем управления базами данных (СУБД) и систем управления электронными докумен-

тами (Electronic Document Management Systems – EDMS).

Применение технологии СУБД основано на предположении, что каждый документ характеризуется сложной совокупностью структурированных данных. Системы управления документами обеспечивают хранение и обработку этих данных. Характерным примером систем управления документами являются системы правовой информации, позволяющие эффективно работать с множеством нор- мативно-правовых актов. Универсальным инструментом создания систем управления документами являются СУБД.

Выбор корпоративной СУБД – один из ключевых моментов при разработке информационной системы. На российском рынке присутствуют практически все современные СУБД – Oracle, Informix, Sybase, Ingres. Целесообразность применения конкретной СУБД определяется по результатам предварительного обследования и получения информационных моделей деятельности предприятия.

Появление систем управления электронными документами (EDMS) вызва-

но потребностью сокращения потока бумажных документов и проблем, возникающих в связи с их хранением, поиском и обработкой.

EDMS реализуют ввод, хранение и поиск всех типов электронных документов: управленческих и финансовых документов, факсов, технической библиотеки, изображений и т.д.

На рынке предлагается более 500 систем EDMS. Они различаются по функциональным возможностям и по технологическим решениям. Однако любая система EDMS должна обеспечивать:

-поступление информации в систему (основной способ ввода документов в систему – сканирование, хотя информация может поступать с магнитных носителей, через модемы и т.д.);

-индексацию и хранение информации;

-осуществление поиска и извлечение необходимой информации (это самое важное).

Технические решения, реализующие перечисленные задачи, позволяют выделить три категории систем.

Системы EDMS первого поколения. Системы этого класса появились в середине 80-х годов XX века. Технология работы с ними основана на использование ключевых слов для индексации и поиска документов. Для этого документ должен быть отсканирован (получен графический образ). Графическому образу приписывается набор ключевых слов, который затем индексируется и используется для поиска информации.

Серьезные ограничения при использовании этих систем связаны со следующими обстоятельствами.

1. Определение ключевых слов:

-субъективный процесс (даже при участии квалифицированного эксперта трудно избежать односторонности при выборе ключевых слов);

23

- дорогостоящая процедура (от 5 до 20 долларов за документ) из-за невозможности автоматической индексации и низкой производительности при определении ключевых слов вручную.

2.Поиск информации возможен только по предопределенным ключевым словам (четкий поиск). Для этого пользователь точно должен знать, что он ищет. Наличие ошибок при написании ключевого слова в поисковом запросе исключает возможность нахождения информации.

3.Набор ключевых слов, который используется людьми, может с течением времени меняться. Данное обстоятельство также снижает вероятность нахождения информации.

Примерами систем EDMS первого поколения являются программные про-

дукты SoftSolutions (SoftSolutions), DocuData (LaserData), WorkFLO Business System (FileNet).

Системы EDMS второго поколения. Технология работы с системами EDMS второго поколения заключается в следующем. После сканирования документа его графический образ преобразуется в текстовый файл. Для этого используется тех-

нология оптического распознавания символов (Optical Character Recognition – OCR). OCR – один из основных компонентов большинства современных систем управления документами.

Далее следует трудоемкий процесс исправления ошибок в тексте, допущенных при распознавании.

Поиск информации в таких системах происходит с использованием меха-

низма полнотекстового поиска (Full Text Retrieval), или, иначе, механизма чет-

кого поиска по полному содержанию документа. Этот механизм реализуется с помощью метода индексирования на основе инвертированной матрицы. Суть метода заключается в том, что при создании индексного файла (индексированной матрицы) в него вносятся все значимые слова (без союзов, предлогов и т.п.) из всех документов в алфавитном порядке. Эти слова затем объединяются в пары с указателями на документы, содержащие эти слова.

Однакотакогородасистемыимеютрядсерьезныхограниченийвприменении.

1.Определение ключевых слов – субъективный процесс, кроме того, ключевые слова со временем теряют свою значимость.

2.Технологии OCR достаточно достоверно распознают высококачественный текст, но не гарантируют абсолютную достоверность. Поэтому в процесс распознавания текста включена процедура ручной правки, в ходе которой исходный текст сверяется с полученным файлом.

Правка текста, имея высокую трудоемкость, обычно выполняется квалифицированным персоналом, и поэтому приводит к значительным скрытым расходам. Стоимость процесса составляет от $1 до $10 на страницу.

3.Во всех предлагаемых системах EDMS используется механизм четкого поиска. Поэтому при наличии в запросе орфографических ошибок нужная информация не будет найдена.

Примерами систем, использующих описанную технологию, могут служить

ZyIMAGE (ZyLAB Division of IDI), Topic (Verity), BRS/Search (Dataware).

24

4.Индекс систем с полнотекстным поиском составляет от 200% до 400% от объема исходных документов. Это означает существенное увеличение времени поиска при росте количества документов и предъявляет серьезные требования к ресурсам компьютера.

5.Совокупная стоимость применения технологии OCR составляет от $5 до $20 за документ.

Системы EDMS третьего поколения. Технология адаптивного распозна-

вания образов APRP. В начале 90-х годов XX века появились разработки сис-

тем EDMS, использующих технологии нейронных сетей и искусственного ин-

теллекта. Они позволили реализовать принципиально новую концепцию построения систем управления неструктурированной информацией в электронном виде, а именно: нечеткий поиск по полному содержанию документа и очень

«компактное» индексирование (всего лишь 30% от объема исходного текста). Нечеткий поиск означает индифферентность по отношению к ошибкам, как

во входных данных, так и в формулировках запроса. Система всегда выдает пользователю ответ, наилучшим образом согласованный с терминами или фразами запроса, по которому проводится поиск. Другими словами, под нечетким поиском понимается возможность найти достаточно близкое приближение к запрошенному термину или фразе.

На рынке коммерческие системы EDMS третьего поколения представлены программным продуктом Excalibur EFS (Excalibur Technologies Corp), который базируется на технологии адаптивного распознавания образов (Adaptive Pattern Recognition Processing – APRP).

Технология APRP использует идеи нейронных сетей. Она позволяет не только обойти проблемы ошибок распознавания текстов, но и предоставляет возможности автоматического индексирования и поиска различных типов неструктурированной информации в электронной форме (исключает необходимость выбирать ключевые слова вручную и дает возможность проведения нечеткого поиска любого слова в документе).

Возможные затраты времени на индексацию и поиск данных при реализации системы APRP на компьютере DEC Station 5000 для различных документов приведены в табл. 2.2.1.

Таблица 2.2.1

Затраты времени на индексацию и поиск данных в системе APRP

Документ

Время

Время поиска

индексации

 

 

Полное собрание сочинений Шекспира

2 мин. 20 сек.

01 сек.

26 томов энциклопедии

29 мин. 38 сек.

13 сек.

Библия

1 мин. 47 сек.

01 сек.

Пересылка документов (e-mail). Это почтовые системы, обеспечивающие пересылку документов и сопроводительной информации для работы с ними других пользователей компьютерной сети. Они могут быть более или менее мощными: от простейших систем электронной почты до развитых учрежденческих систем, позволяющих, например, связывать с документами специфические наборы реквизитов и маршруты движения.

25

Групповая работа над документами (groupware). Эти системы позволяют небольшому коллективу параллельно работать над общими документами. Системы класса groupware ориентированы на автоматизацию работы и поддерживают корректное разделение (т.е. совместное использование) информации группой пользователей компьютерной сети. При этом может обеспечиваться оперативное отслеживание всех изменений и версий.

Управление потоком работ (workflow). Системы класса workflow ориенти-

рованы на автоматизацию работы предприятия и поддерживают разделение работ, т.е. выполнение одной «большой» работы группой исполнителей.

Эти системы автоматизируют сложные многошаговые алгоритмы работы с документами на предприятии. Каждый тип документа, в частности, может иметь специфические алгоритмы обработки и маршруты движения, причем на каждом шаге функции обработки и дальнейший маршрут могут, в общем случае, зависеть от предыстории документа и текущих событий.

Основные возможности систем класса workflow:

1.Обеспечение высокой производительности и возможность масштабирования в рамках предприятия.

2.Открытость, т.е. возможность интеграции с другими компонентами информационной системы СУБД, системами управления электронными документами, коммуникационными программами и т.д.

3.Гибкость, т.е. способность системы к настройке и перенастройке в зависимостиотструктурыитехнологийобработкидокументов, принятыхнапредприятии.

4.Простота в использовании, изучении и обслуживании.

5.Возможность работы с локализованной версией на русском языке.

Сравнительная характеристика различных систем

Таким образом, основное назначение систем groupware и workflow – автоматизация и поддержка коллективной работы в офисе. Основные характеристики и отличия функционального набора этих систем приведены в табл. 2.2.2.

Таблица 2.2.2

Сравнительная характеристика систем класса Groupware и систем класса Workflow

Системы класса Groupware

Системы класса Workflow

Одна выполняемая задача, т.е. поддержи-

Множество выполняемых задач, т.е. поддер-

вается коллективная работа с одной зада-

живается многопользовательская работа с не-

чей в данный момент времени (например,

сколькими задачами одновременно, как в син-

с текстовым редактором)

хронном, так и в асинхронном режимах

Отсутствие на предприятии структуриза-

Строгая структуризация, т.е. выполнение ра-

ции работ, т.е. нет никаких правил и пред-

боты четко расписано по ролям, документам,

писаний, кто и как должен работать в рам-

времени обработки документов и т.д.

ках системы

 

Реализация на ПЭВМ и ориентация на не-

Реализация в среде клиент/сервер и ориента-

большие коллективы

ция на масштаб предприятия

Системы workflow и groupware не конкурируют между собой, а скорее дополняют друг друга. Выбор одной из них, а также использование их в комбинации определяется задачами, решаемыми предприятием.

26