什么方法适合从文件照片中捕获(检测)机读区?我正在考虑级联分类器(例如 Viola-Jones),但用它来解决这个问题似乎有点奇怪。
问问题
3437 次
5 回答
4
如果您知道您将在护照中查找文本,为什么不先尝试在其上查找护照模型点。使用 ASM/AAM (Active shape model, Active Appearance Model) 技术匹配护照模板。获得护照位置信息后,您可以剪下您感兴趣的区域。但这需要一些时间来实施。
于 2012-12-28T13:17:48.463 回答
0
更好的方法是使用投影轮廓方法。投影轮廓方法基于以下思想:
为您的黑白输入文档中的每一行创建一个数组 A。现在将 A[i] 设置为原始图像第 i 行中的黑色像素数。
(您还可以通过考虑原始图像中的列而不是行来创建垂直投影配置文件。)
现在数组 A 是文档的投影行/列直方图,检测机读区的问题可以通过检查 A 直方图中的谷值来解决。
然而,这个问题并没有完全解决,所以有很多变化和改进。这里有一些额外的文档:
- Google Scholar 中的投影配置文件:http ://scholar.google.com/scholar?q=projection+profile+method
- Tesseract-ocr,一个很棒的开源 OCR 库:https ://code.google.com/p/tesseract-ocr/
于 2012-12-27T21:55:37.073 回答
0
Viola & Jones 的类似 Haar 的特征会生成许多(许多(许多))特征来尝试描述一个对象,并且在规模等方面更加稳健。他们的方法是解决难题的独特方法。
但是,在这里,您对问题有很多限制,类似的事情似乎有点矫枉过正。我想说的是评估现成的标准 OCR 工具,看看它们能带给你什么,而不是“尽早优化”。相信你会感到惊喜。
PS:
您需要预处理图像以隔离白色背景上的字符。这可以很容易地完成,并将显着帮助 OCR 算法。
于 2012-12-27T22:04:15.787 回答