0

我试图回忆一些关于字母的信息,以使用神经网络开始某种 OCR。我还没有真正将所有东西结合在一起,但是,我现在遇到的问题是如何区分字符并将它们分开。像http://pp19dd.com/tesseract-ocr-chopper/?i=ocrFTYzRJ之类的东西 (没什么花哨的,只是常见的字体)

考虑到每个字符和数字都有相互连接的黑色像素(尽管 i 是一个例外),我相信更好的方法是制作大量的 for 循环以获得顶部、最低 x 和 y。

是否有任何类型的库或算法可以帮助我解决这个问题?我正在使用 Cimg 进行图像处理。

真的很难吗?

4

2 回答 2

1

听起来您正在寻找一个连接的组件贴标机。这个想法是扫描图像中相互连接的像素组,并返回一组对象(通常称为“斑点”),其中每个对象都包含该斑点中的像素列表。

我不建议尝试自己编写。OpenCV 内置了一个运行良好且基于

F.Chang,C.-J.Chen,and C.-J.Lu,“使用轮廓跟踪技术的线性时间组件标记算法,”计算机视觉和图像理解,第一卷。93,没有。2,第 206-220 页,2004 年。

很可能有更好的解决方案专门用于查找字母。

于 2011-09-25T22:16:21.993 回答
0

你检查过OpenCV项目吗?是使用它进行数字 OCR 的教程。

于 2011-09-25T22:55:55.047 回答