c++ - 某些单词（被训练）无法通过 Tesseract-OCR 识别

翻译自：https://stackoverflow.com/questions/20233182 2013-11-27T03:11:12.747

440 次

0

我目前正在使用 Tesseract-OCR 识别图片中的一些文字。但是现在我有一个问题。由于有些单词无法识别。我专门训练了它们，它仍然不起作用！

在训练 DAWG 文件等语言数据时，我是否需要一些额外的文件？我对此一无所知。因为有时候在一些特殊的位置和方向上出现的文字，它也能认出其中的几个。

这真是令人困惑。真诚需要您的帮助。提前致谢！

其他信息：

我用的是简体中文。（不知道有没有我用中文的时候没有设置的参数）
因为我想识别的图片是一张桌子。里面有几行。在识别表格以提高准确性时，您对这种情况有什么想法吗？
因为不知道是不是字的特殊形状造成的。我这里直接贴一些词。下午一二三四五

非常感谢！

0 回答 0