android - 操作位图以获得最佳 ocr 检测

Question

我正在使用 Tesseract ORC 库从屏幕上拍摄的图像中提取文本。问题是大多数现代相机在拍照时也会捕捉显示屏上的像素。

无论如何，是否可以像过滤器或对位图进行阈值处理以将文本“提取”到更清晰的文本以获得更好的 tesseract 效果？

例如，在处理之前：在此处输入图像描述

处理后（photoshop中的阈值效果）：在此处输入图像描述

score 2 · Accepted Answer

Tesseract 有一个内置的阈值方法，TessBaseAPI#ThresholdRect. 你试过吗？如果是这样，您遇到了什么问题？

如果它在某些图片上效果不佳，您可能想尝试查找一些“平均”或“自适应”阈值算法，因为看起来 Tesseract 是一个直接阈值，因此它可能无法很好地适应较暗/较亮图像没有一些调整。

1 回答 1