1

我对带有手写文本的 Azure 表单识别器的 OCR 有疑问。

在 Azure 的示例标签工具中标记之前对手写 PDF 文件运行 OCR 时,OCR 经常会错误地检测到文本。使用其他表单分析和提取技术,通常会提供一个选项来输入本应检测到的文本,以从根本上“纠正”OCR。为了在示例标签工具(Docker 映像)中训练 Azure 表单识别器,我看不到一种方法可以覆盖 OCR 文本并输入正确的文本。

有没有一种方法可以让我自己输入 OCR 未能检测到或检测不正确的文本?

例如,下图是 Azure 的 Sample Labeling Tool 中的 OCR 拾取的: OCR detection sample image

有没有办法纠正这个结果并告诉表单识别器文本应该是:“Bridget Sims, MD”?

4

1 回答 1

0

目前还没有办法立即纠正 OCR 结果并提高其准确性。典型的场景是从一小组训练文件中训练一个表单识别器模型,并用它来处理更多的文档。在训练过程中,少量的 OCR 错误对模型质量并不重要,您可以忽略它们。产品团队正在开发具有更好手写识别准确度的新版 OCR。

谢谢 -xin [Microsoft Azure 表单识别器团队]

于 2020-07-20T23:17:30.877 回答