1

这是表格

我有一个包含不同字段的表单图像,如姓名、号码、地址等。我想识别这些字段中的数据并将它们保存到数据库中。现在,我的 OCR 工作正常,但我不知道如何从图像中提取特定字段数据(名称、地址)以用于 OCR。只是我想知道如何识别输出文件中的字符来自名称字段或地址字段或任何其他字段。

4

2 回答 2

0

由于您知道不同字段将在表单的确切区域,因此您可以使用一些图像处理库裁剪图像并仅将特定区域发送到 OCR 引擎。

检查这个 SO 问题

于 2012-11-21T07:28:31.097 回答
0

您有两种解决方案来获取您想要的数据,要么使用@osiris 的解决方案,要么您必须添加一个文本挖掘层。第一个解决方案:您获取图像并将其切成碎片(包含所需数据的碎片)。例如,您通过根据字段位置(X 和 Y)裁剪原始图像,将图像切割成 2 部分,其中包含名称和包含地址的第二部分,为此您必须使用图像库来操作您的原始图像。第二种解决方案是使用文本挖掘层而不进行裁剪。在此解决方案中,您必须使用检测姓名和地址的模型(duckling.ai),您可以训练自己的模型,或者您甚至可以使用一些聊天机器人引擎,然后训练您的聊天机器人引擎将姓名和地址检测为实体(重铸.ai 或 rasa 例如)。

于 2019-02-19T07:57:47.003 回答