regex - 在 Tesseract 字典文件中使用正则表达式

Question

我目前正在使用 Tesseract OCR，想知道是否可以将正则表达式添加到字典文件中。

根据我的假设，Tesseract 找到的每个单词都会根据字典进行检查，以提高结果的准确性。

现在我想搜索一个 8 位数字的字符串，然后我希望能够将这样的正则表达式添加到“字典”中，以确保这 8 位数字中没有字母。

这可能吗？如果是这样，怎么做？

到目前为止我只发现了这个，我们目前在 3.02：http ://code.google.com/p/tesseract-ocr/issues/detail?id=289

score 1 · Accepted Answer

1

您可以在 Tesseract 中使用集市匹配模式。

于 2013-11-13T23:47:08.093 回答

1 回答 1