image-processing - Tesseract 是否忽略扫描文档中的任何非文本区域？

翻译自：https://stackoverflow.com/questions/10193816 2012-04-17T15:05:31.293

2801 次

2

我正在使用 Tesseract，但我不知道它是否忽略了任何非文本区域并仅针对文本。我是否必须删除任何非文本区域作为预处理步骤以获得更好的输出？

1 回答 1

2

Tesseract 有一个非常好的算法来检测文本，但它最终会给出误报匹配。

理想情况下，您会在将图像提交给 tesseract 之前对其进行预处理。前段时间我搞了一个类似的任务，所以建议你看看下面的资料：

于 2012-04-19T17:10:34.713 回答