首先,我的最终目标是使用 tesseract 处理以下图像:http: //ubuntuone.com/72m0ujsL9RhgfMIlugRDWP (我清除了第二列和第三列……)
然而,tesseract 的虚线背景存在问题。所以我的想法是用OpenCV对图像进行预处理。最好的办法是我能以某种方式检测每一行,因为我需要通过应用与偶数行不同的阈值来移除虚线背景。有什么办法可以解决我的问题吗?到目前为止,我已经找到了 Hough 变换和分段,但结果不是很好(可能是因为参数错误)......但我不确定,如果这些是可能的方法以及我最投入时间的方法。列检测也可以,因为第二列只包含数字和第三个字符。将这些“知识”传递给 tesseract 可以进一步提高其检测率。
如果有人能给我一些提示如何解决这个问题以及最好使用哪些 OpenCV 函数,以及哪些参数,我将非常感激。一些让我对不同步骤有一个公平了解的片段也会有所帮助。
预先感谢!!!
亲切的问候。