ocr - 示例标签工具 OCR 文本检测问题

Question

我对带有手写文本的 Azure 表单识别器的 OCR 有疑问。

在 Azure 的示例标签工具中标记之前对手写 PDF 文件运行 OCR 时，OCR 经常会错误地检测到文本。使用其他表单分析和提取技术，通常会提供一个选项来输入本应检测到的文本，以从根本上“纠正”OCR。为了在示例标签工具（Docker 映像）中训练 Azure 表单识别器，我看不到一种方法可以覆盖 OCR 文本并输入正确的文本。

有没有一种方法可以让我自己输入 OCR 未能检测到或检测不正确的文本？

例如，下图是 Azure 的 Sample Labeling Tool 中的 OCR 拾取的： OCR detection sample image。

有没有办法纠正这个结果并告诉表单识别器文本应该是：“Bridget Sims, MD”？

score 0 · Accepted Answer

目前还没有办法立即纠正 OCR 结果并提高其准确性。典型的场景是从一小组训练文件中训练一个表单识别器模型，并用它来处理更多的文档。在训练过程中，少量的 OCR 错误对模型质量并不重要，您可以忽略它们。产品团队正在开发具有更好手写识别准确度的新版 OCR。

谢谢 -xin [Microsoft Azure 表单识别器团队]

ocr - 示例标签工具 OCR 文本检测问题

1 回答 1

Related

Reference