一段时间以来,我一直在考虑如何在 Webapps 中处理纸质文档输入。主要问题是如何统一元数据和扫描的 PDF。为了这个例子,我将提出一个假设的费用索赔申请。到目前为止我考虑过的方法:
- Web 1.0,打开网页,创建报销单并输入数据,切换到扫描应用程序,扫描到文件,切换到浏览器,点击“选择文件”导航到扫描文件上传。优点:编码简单。缺点:糟糕的工作流程,每个工作站都需要扫描仪(以及驱动程序和磁盘空间等/可能不适用于瘦客户端:Citrix / iPad)
- 条码样式打开网页,创建费用报销并输入数据,保存,打印条码贴纸,将条码粘贴到纸上。在一天结束时扫描所有条形码文件。批量上传它们并根据条形码将它们分配给费用报销。(扫描中的 OCRing 条码是一个已解决的问题,例如,请参阅exactCODE) 优点:工作流程不错,每个部门一台扫描仪就足够了。缺点:每个工作站都需要条形码标签打印机(比扫描仪更容易,但并不便宜),扫描的文件要在几个小时后才能使用
- 使用本地扫描仪将Web 2.0 样式扫描到 [Dropbox] 文件夹。Webapp 使用Dropbox API来检测新的扫描,将它们呈现给用户并要求他们输入元数据。优点:不错的工作流程。缺点:每个人都需要一个扫描仪,Webapp 不能只是弹出并说“有一个新的扫描可用”。
- 批量样式有人扫描所有文档,按必须处理它们的人(或按文档类型:费用索赔、发票、订单)将它们分开。文档被批量上传(例如作为 ZIP)到队列中的 Web 服务器。一个人现在必须通过这个队列并输入所需的元数据。优点:只需要维护一个 Scanner。缺点:员工手头没有纸了,只有在线版本。这被我的同事们认为是一场大秀。
- Barcode Batch Somebody 对所有传入的文档进行条形码标记,在单个文件夹中扫描它们并将它们批量上传到存储库,然后以老式的方式将文件分发到不同的部门。处理费用报销的人也会输入纸上的条形码编号。Webapp 联系存储库并根据条形码编号检索扫描的文档并将其与元数据一起保存。优点:易于编码,缺点:大量纸张仍在四处游荡,文件可能会被扫描,可能永远不应该进入数字存储库 - 例如医疗记录)
- 桌面应用程序编写一个基于TWAIN的小型桌面应用程序,该应用程序扫描、上传到 Web 应用程序并打开浏览器窗口以添加元数据。优点:工作流程不错,缺点:每个桌面一台扫描仪,不是 Web 应用程序/平台问题
对上述方法之一的更好解决方案或评论有什么建议吗?