1

我正在开发一个可以识别希伯来字符的 C# OCR 程序(用于我自己的学习目的的项目,没有商业质量)。我计划通过从图像中分离字形然后应用模板匹配方法来做到这一点。

我在哪里

我现在有了它,这样我就可以将单个字形从图像中分离出来。每个字形都用一个 2D 像素数组表示。例如,字符“bet”看起来像:

..........
.*******..
.......*..
.......*..
.********.
..........

在哪里 ”。” 表示空白,“*”表示填充像素。

我现在要应用模板匹配算法来识别这个二维像素数组代表什么字形(在这种情况下,它应该匹配“赌注”模板)。

问题

我很难找到一个好的模板匹配算法的简单解释(我发现的大部分是论文或代码库的链接),并且想知道是否有人知道我可能研究的任何内容。

我想强调一下,我想手动完成,而不是简单地使用库。我愿意研究图书馆如何解决这个问题,但是,如果它不分成十五亿个不同的部分。:)

我也愿意听听是否有更好的方法来做我想做的事情。

4

1 回答 1

0

为每个模板生成一个数字,因为它是像素数组,如果您将每个像素与一个数字(如 0、2、4、8、16 等)相关联,空像素为 0,填充像素为 1。

然后对于每个字形还计算总数并匹配它们。

于 2012-08-21T22:27:27.067 回答