我目前正在使用 Tesseract-OCR 识别图片中的一些文字。但是现在我有一个问题。由于有些单词无法识别。我专门训练了它们,它仍然不起作用!
在训练 DAWG 文件等语言数据时,我是否需要一些额外的文件?我对此一无所知。因为有时候在一些特殊的位置和方向上出现的文字,它也能认出其中的几个。
这真是令人困惑。真诚需要您的帮助。提前致谢!
其他信息:
我用的是简体中文。(不知道有没有我用中文的时候没有设置的参数)
因为我想识别的图片是一张桌子。里面有几行。在识别表格以提高准确性时,您对这种情况有什么想法吗?
因为不知道是不是字的特殊形状造成的。我这里直接贴一些词。下午一二三四五
非常感谢 !