opencv - 捕获机器可读区域的算法

Question

什么方法适合从文件照片中捕获（检测）机读区？我正在考虑级联分类器（例如 Viola-Jones），但用它来解决这个问题似乎有点奇怪。

score 4 · Accepted Answer

如果您知道您将在护照中查找文本，为什么不先尝试在其上查找护照模型点。使用 ASM/AAM (Active shape model, Active Appearance Model) 技术匹配护照模板。获得护照位置信息后，您可以剪下您感兴趣的区域。但这需要一些时间来实施。

score 1 · Accepted Answer

将此方法视为一个很好的起点：

它可能不是解决问题的最有效方法，但它非常强大。

score 0 · Accepted Answer

更好的方法是使用投影轮廓方法。投影轮廓方法基于以下思想：

为您的黑白输入文档中的每一行创建一个数组 A。现在将 A[i] 设置为原始图像第 i 行中的黑色像素数。

（您还可以通过考虑原始图像中的列而不是行来创建垂直投影配置文件。）

现在数组 A 是文档的投影行/列直方图，检测机读区的问题可以通过检查 A 直方图中的谷值来解决。

然而，这个问题并没有完全解决，所以有很多变化和改进。这里有一些额外的文档：

score 0 · Accepted Answer

0

您可能要考虑使用笔画宽度变换。
您可以按照这些提示来实施它。

于 2012-12-31T14:53:33.247 回答

score 0 · Accepted Answer

Viola & Jones 的类似 Haar 的特征会生成许多（许多（许多））特征来尝试描述一个对象，并且在规模等方面更加稳健。他们的方法是解决难题的独特方法。

但是，在这里，您对问题有很多限制，类似的事情似乎有点矫枉过正。我想说的是评估现成的标准 OCR 工具，看看它们能带给你什么，而不是“尽早优化”。相信你会感到惊喜。

PS：
您需要预处理图像以隔离白色背景上的字符。这可以很容易地完成，并将显着帮助 OCR 算法。

5 回答 5