我对带有手写文本的 Azure 表单识别器的 OCR 有疑问。
在 Azure 的示例标签工具中标记之前对手写 PDF 文件运行 OCR 时,OCR 经常会错误地检测到文本。使用其他表单分析和提取技术,通常会提供一个选项来输入本应检测到的文本,以从根本上“纠正”OCR。为了在示例标签工具(Docker 映像)中训练 Azure 表单识别器,我看不到一种方法可以覆盖 OCR 文本并输入正确的文本。
有没有一种方法可以让我自己输入 OCR 未能检测到或检测不正确的文本?
例如,下图是 Azure 的 Sample Labeling Tool 中的 OCR 拾取的: OCR detection sample image。
有没有办法纠正这个结果并告诉表单识别器文本应该是:“Bridget Sims, MD”?