3

晚安 :)

我目前正在使用 DevIL 库,它允许我加载图像并检查每个像素的 RGB 值。作为一个个人学习项目,我正在尝试为我在 Photoshop 中制作的几张图像编写一个非常基本的 OCR 系统。

我成功地消除了图像中的所有扭曲,留下了文字和数字。我目前不是在寻找从输入中学习的高级神经网络。我想开始相对容易,所以我开始识别单个字符并计算这些字符中的像素。

我有两个问题:

  • 识别单个字符。
  • 最重要的是:我需要一种算法来计算连接像素(相同颜色),而不计算我之前计算过的像素。我没有数学背景,所以这对我来说是最大的问题。

感谢您对此事的任何帮助,谢谢。

编辑:

我已将此问题标记为 C++,因为这是我目前使用的。但是,其他语言的伪代码或易于阅读的代码也可以。

4

3 回答 3

2

只要您将图像过滤为简单的黑白位图,洪水填充算法就可以计算包含的像素

话虽如此,您可以通过将每个字符与您的集合中每个字符的一组标准图像进行比较,测量相似度,然后选择得分最高的字符来执行字符识别。

请查看此问题以获取更多信息。

于 2009-02-26T04:56:26.597 回答
1

不确定这是否有帮助,但有一个名为gocr的 GPL OCR 库。

于 2009-02-26T04:54:53.183 回答
1

抱歉,如果这离题太远了,但恕我直言,Vigra(不是另一个!)是一个比 DevIL 更好的 C++ 图像处理库。

于 2009-02-26T04:58:17.043 回答