1

我是 KofaxTotalAgility 解决方案的新手,但我非常了解 OCR、OMR 和识别机制。

我在一个文件夹中有两个表格,A 和 B。它们都是相同的,但是由于手动扫描,轴有轻微的变化,比如 20 像素右移,所以布局略有不同。

Image AImage B的布局不同,表单在页面中的位置不固定。我知道,像“abbyy Fine reader”这样的其他解决方案提供了 flexilayout,我们可以通过查找文本并设置右左上向下自动识别区域来处理这个问题。

当我开始学习 KofaxTotalAgility 时,我不知道“kofax Transformation Designer”提供的所有选项。

我的问题是我应该使用哪个定位器,我目前正在使用/正在使用高级区域定位器,对于我设置为参考的一个文档(图像 A),提取是正确的。但对于其他,(图 B)由于布局不匹配文本/框字段没有被提取。

谁能指出我可以正确处理此案的正确方向。我知道,我要求直接选择/解决方案,任何帮助都是非常可观的。

4

1 回答 1

1

一般来说,Kofax Transformations 有两组定位器:

  • 确定性。您准确地告诉定位器要做什么以及如何去做(类似于编程时的命令式方法)
  • 概率的。您只需告诉定位器要提取什么,剩下的就可以解决(基于 AI)。

这是我前几天创建的(非详尽的)图表:

Kofax Transformations 中的定位器

使用表单时,您可能会倾向于依赖特定于表单的定位器,例如高级区域定位器。虽然此定位器可以解释“四处移动”的字段,例如由于图像被颠簸、缩放或扭曲,但存在某些限制。其他定位器没有这些限制 - 例如,格式定位器允许您定义某种模式(正则表达式),该模式应该与必须在该模式周围某处找到的关键字匹配。

对于您的示例,您可以创建一个正则表达式M|F|X,然后将“性别”定义为需要出现在左侧的关键字。

然而,任何受确定性支配的定位器都遵循墨菲定律——在某些时候,关键字可能会改变。可能有不同的语言。并且可能会添加针对某些性别的额外字母;最终打破你的提取逻辑。

进入人工智能——虽然墨菲定律在使用组定位器时仍然适用,但这里的不同之处在于用户可以训练系统来获取新数据。所述定位器将自动找出提取该数据的最佳方法。如果您使用格式定位器,客户需要回复您以添加其他表达式,或更改关键字。

在您的特定情况下,我会先尝试使用可训练组定位器。如果您已经知道要查找的内容 - 例如数据库中某处的 SSN,请选择Database Locator。使用格式定位器作为最后的手段,尽管它们可能很诱人。处理表格时,高级区域定位器很有用,但我发现自己几乎只将它们用于手印或复选框识别。

于 2019-09-25T18:41:06.947 回答