1

我是 Kofax capture 的新手,我正在从基本扫描发票副本 (PDF) 中检索数据,其中包含要索引文件的项目列表。后续步骤如下:

  1. 创建文档类并添加表格类型的索引字段和表格列,例如日期作为字段。PDF的日期列值截图如下:

在此处输入图像描述

  1. 在验证期间,日期字段值都显示在一个字段中,如下所示:

Date: 12/01/2018 12/02/2018 12/03/2018 12/04/2018

  1. 此外,当导出到索引文件的值采用上述格式时。

有没有办法将每个单元格中的值检索为单独的条目或使用 kofax 捕获分隔的逗号?

4

1 回答 1

1

普通的 Kofax Capture (KC) 无法提取以表格组织的数据。KC 可以提取静态数据,即简单的键值对(例如发票编号、发票日期、总金额)。

当然,您可以尝试提取这样的列: 在此处输入图像描述

但是,这可能会导致潜在的问题。如果数据并不总是在同一个地方怎么办?如果数据在后续页面上继续出现怎么办?您所在区域中的哪些内容小于整个列?如果有重叠的文本怎么办?如果您想要另一列包含额外数据,本质上是创建行,但如果某些列中存在巨大差距(如我的屏幕截图所示),该怎么办?

如果需要提取表,您可能需要使用 Kofax 转换模块 (KTM),它作为 Kofax Capture 的附加组件提供。KTM 具有更复杂的表格提取方法,不仅限于单个表单布局。

于 2019-04-01T19:57:21.833 回答