我试图回忆一些关于字母的信息,以使用神经网络开始某种 OCR。我还没有真正将所有东西结合在一起,但是,我现在遇到的问题是如何区分字符并将它们分开。像http://pp19dd.com/tesseract-ocr-chopper/?i=ocrFTYzRJ之类的东西 (没什么花哨的,只是常见的字体)
考虑到每个字符和数字都有相互连接的黑色像素(尽管 i 是一个例外),我相信更好的方法是制作大量的 for 循环以获得顶部、最低 x 和 y。
是否有任何类型的库或算法可以帮助我解决这个问题?我正在使用 Cimg 进行图像处理。
这真的很难吗?