2

我正在使用 Tesseract,但我不知道它是否忽略了任何非文本区域并仅针对文本。我是否必须删除任何非文本区域作为预处理步骤以获得更好的输出?

4

1 回答 1

2

Tesseract 有一个非常好的算法来检测文本,但它最终会给出误报匹配。

理想情况下,您会在将图像提交给 tesseract 之前对其进行预处理。前段时间我搞了一个类似的任务,所以建议你看看下面的资料:

于 2012-04-19T17:10:34.713 回答