我想从账单图像中提取有用的信息。
我已经使用 OCR + pytesseract 将图像转换为文本,并根据特定单词(如总数、金额等)提取信息。
处理各种类型的非结构化票据以提取票据的地点和金额的最佳通用方法是什么?
我想从账单图像中提取有用的信息。
我已经使用 OCR + pytesseract 将图像转换为文本,并根据特定单词(如总数、金额等)提取信息。
处理各种类型的非结构化票据以提取票据的地点和金额的最佳通用方法是什么?
在非结构化、旋转、平移、轻变图像识别的情况下,最好选择深度学习模型。
最初用包含不同类型变化的 n 个图像来训练你的网络。
例如,假设我们需要找到“金额”一词的位置:
图一:右上角有“金额”字样的账单图片
图2:左上角带有“金额”字样的账单图片
……
这些将是您的输入训练样本。您的输出将是“金额”一词的位置坐标。
您可以查看此链接以了解有关创建深度学习模型的更多信息。