我正在尝试阅读手写文件。为此,我将分割字符,然后 OCR/ICR 分割字符。
我想要这样的结果!虽然这是一个非常微不足道的案例。笔迹可能是草书,单笔可用于分割字符,但并不总是有效。
经过大量阅读和研究,意识到我以错误的方式解决了这个问题。对于手写识别,很难分割字符然后识别它们。
随着悖论的发展
一个字母在识别之前不能被分割,在分割之前也不能被识别。
所以正确的做法是把问题看成是“监督序列标注”。这些问题与传统的监督模式分类框架的区别在于,不能假设单个数据点是独立的。相反,输入和标签都形成了强相关的序列。
我建议在这里使用多维 RNN 和 CTC 的论文。