Состав и содержание операций автоматизированного ввода потоков входящих документов

При организации электронного документооборота самым трудоемким, рутинным этапом является обработка и ввод документации в систему. Автоматизированный потоковый ввод документов в систему электронной документации (СЭД) позволяет значительно ускорить этот процесс. Необходимость в потоковом режиме ввода чаще всего возникает в различных учреждениях, где рабочий процесс связан с большим количеством входящей документации, обработка которой требует и предельного внимания, и оперативности.

Потоковый ввод обеспечивает выполнение всех названных операций практически одновременно. Процесс сканирования производится на потоковом сканере. Отсканированная документация автоматически делится на файлы изображений и текстовые документы и прикрепляется к приготовленным оператором карточкам. Специально нанесенные на каждый документ штрих-коды позволяют связывать отсканированные документы и карточку регистрации оригинального варианта.

При потоковом режиме есть возможность вести быструю работу с самыми сложными версиями документов (тексты, тексты и изображения, изображения с поверхностным слоем нанесенного текста, таблицы, счета-фактуры, бланки, заполненные от руки). При необходимости можно использовать систему, которая позволит извлекать отдельные атрибуты нужных документов (реквизиты, номера договоров).

При автоматизированном потоковом вводе документов любое учреждение, предприятие, организация смогут гораздо быстрее внедрить систему электронного документооборота и в полной мере прочувствовать, насколько значимо изменилась производительность осуществляемой ими деятельности. При четком функционировании СЭД документооборот превращается во вспомогательный инструмент, помогающий продуктивно осуществлять основную работу. Именно поэтому владельцы и учредители должны иметь заинтересованность в организации потокового режима ввода документации в СЭД на своих предприятиях.

В настоящее время все большее распространение получают системы, автоматизирующие процесс ввода и обработки документов. Основное внимание уделяется документам, имеющим жесткую структуру. Под такими документами понимаются деловые бумаги, в которых задается их структура, т.е. определены топологические и геометрические соотношения всех их элементов. К таким документам относятся различные платежные квитанции, анкеты, почтовые карточки и т.п. Обработка таких документов заключается в том, что необходимо выделить переменные данные и перевести их в электронный текстовый вид.

Создание систем потокового ввода документов предусматривает решение пяти основных задач:

  • • создание технологической цепочки, позволяющей переводить в электронный вид большое число документов, представленных на бумаге. Здесь используются появившиеся в последнее время мощные сканеры, обрабатывающие до 150 страниц в минуту, или большое количество низкопроизводительных сканеров (до 6—12 страниц в минуту), или несколько сканеров средней производительности (30—50 страниц в минуту). В процессе ввода документы проходят несколько этапов обработки, часть из которых полностью автоматизирована, часть выполняется с минимальным взаимодействием с пользователем;
  • • полученные графические образы документов необходимо отсортировать. Необходимо решить задачу формализации характеристик, определяющих тип документа. Таких характеристик должно быть достаточно, чтобы однозначно отделить один тип от другого. С другой стороны, излишняя детализация может привести как к существенному увеличению количества отбракованных документов, т.е. не подходящих ни к одному типу, так и к неоправданному усложнению решения задачи управления потоком;
  • • на отсортированных графических представлениях документов необходимо определить те места, на которых расположены искомые переменные данные, используя при этом заранее известную структуру документа;
  • • данные, расположенные в местах, определенных в предыдущей задаче, необходимо перевести из графического вида в текстовый. При решении этой задачи используются системы оптического распознавания текстов, представляющие собой интенсивно развивающийся сектор рынка программного обеспечения. Наиболее известными российским пользователям являются такие системы, как «Cuniform», «Tiger», «Fine Reader»;
  • • полученные и распознанные данные необходимо записать в соответствующую базу данных или информационную систему.
 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >