我正在尝试查找扫描的 pdf 表单是否包含签名(例如确保已签署支票)。
问题域:
我将收到文件包(多页 pdf 和多种表格)。我已经将文档包分类器放在一起,这些分类器将检查所有文档的包并将图像缩放到通用大小。之后,我知道签名应该在哪里,并且可以专门扫描文档的区域。我正在寻找的是确保存在签名的最佳方法。我考虑过只检查暗像素的基本阈值,但这似乎很笨拙。签名的问题在于它们并不是真正的书写,更多的是个人标记。
我唯一能想到的就是寻找循环的机器学习方法?但我对机器学习并不是很熟悉,甚至不知道从哪里开始这样的事情。任何对实际方法有一些建议的人都会非常感激。
如果这有帮助的话,我正在用 Java 编写代码