1

UIPath 中是否有某种方式或活动,我们可以在其中检查 PDF 文件是否是第一代文档?一个想法或帮助将不胜感激。谢谢你。

4

1 回答 1

0

这更像是一种技巧,而不是一个正确的解决方案,但它应该起作用:将 IntelligentOCR 包中的数字化活动与您知道返回单词置信度的 OCR 一起使用(我认为 Microsoft OCR 会进行仔细检查)。Digitize 活动将决定它是否需要 OCR,如果不使用 OCR(这意味着它是本机文档或您如何称呼它的第一代),则 DOM 中的所有 OCRConfidences 将为 -1。

这样做有两个注意事项:

  • 如果 digitize 决定文档文本不可读(例如由于超级奇怪的自定义字体),它可能会决定在原生 PDF 上使用 OCR 以及在某些奇怪的边缘情况下
  • 虽然目前不支持,但 Digitize 活动可能会在未来的某个时候执行部分 OCR,例如当原生 PDF 包含带有文本的图像时。与任何“未记录的功能”一样,请谨慎使用,因为它可能在将来升级到新版本时随时中断
于 2020-10-09T08:50:44.383 回答