我目前正在使用 Tesseract OCR,想知道是否可以将正则表达式添加到字典文件中。
根据我的假设,Tesseract 找到的每个单词都会根据字典进行检查,以提高结果的准确性。
现在我想搜索一个 8 位数字的字符串,然后我希望能够将这样的正则表达式添加到“字典”中,以确保这 8 位数字中没有字母。
这可能吗?如果是这样,怎么做?
到目前为止我只发现了这个,我们目前在 3.02:http ://code.google.com/p/tesseract-ocr/issues/detail?id=289