我正在 Visual Studio 平台上进行手写识别和相关工作,并使用 openCV 库。输入采用二进制扫描的 .tif 图像的形式。
目前,我遇到了一个障碍,试图找出一种方法来识别被删除的单词,就像你使用直线/曲线删除(取消)单词一样。我不会进行单个字符识别,因为这会浪费计算能力。
有没有办法以替代方式识别此类事件?
以下是我遇到的两个想法,但我不确定 - 1> 使用像 < 0 0 0 , 1 1 1, 0 0 0 > 这样的掩码,这将有助于找到所有水平线......但这将是一个非常大的假设。线条可以是波浪形的,可以是任何方向的。
2> 骨架化输入并寻找交叉点。这会给我很多交叉点 - 包括那些由于用于删除单词的线而发生的交叉点。使用一些近似值,如最小二乘等。我可以得到一条近似线。但问题是在许多地方都可能出现交叉路口——例如。'b'中的2个交叉点等。
有什么建议么?