c++ - 识别图像上字符的开始和结束 XY 向量

Question

我试图回忆一些关于字母的信息，以使用神经网络开始某种 OCR。我还没有真正将所有东西结合在一起，但是，我现在遇到的问题是如何区分字符并将它们分开。像http://pp19dd.com/tesseract-ocr-chopper/?i=ocrFTYzRJ之类的东西（没什么花哨的，只是常见的字体）

考虑到每个字符和数字都有相互连接的黑色像素（尽管 i 是一个例外），我相信更好的方法是制作大量的 for 循环以获得顶部、最低 x 和 y。

是否有任何类型的库或算法可以帮助我解决这个问题？我正在使用 Cimg 进行图像处理。

这真的很难吗？

score 1 · Accepted Answer

听起来您正在寻找一个连接的组件贴标机。这个想法是扫描图像中相互连接的像素组，并返回一组对象（通常称为“斑点”），其中每个对象都包含该斑点中的像素列表。

我不建议尝试自己编写。OpenCV 内置了一个运行良好且基于

F.Chang,C.-J.Chen,and C.-J.Lu，“使用轮廓跟踪技术的线性时间组件标记算法，”计算机视觉和图像理解，第一卷。93，没有。2，第 206-220 页，2004 年。

很可能有更好的解决方案专门用于查找字母。

score 0 · Accepted Answer

0

你检查过OpenCV项目吗？这是使用它进行数字 OCR 的教程。

于 2011-09-25T22:55:55.047 回答

2 回答 2