python - 正方体选项和图像预处理

Question

亲爱的社区，我正在尝试做一些 ocr。
我已经对图像进行了很多预处理（未倾斜，裁剪......）
现在，我可以毫无问题地自己读取数字
但我无法获得 tesseract 给我一个有意义的结果。

单击顶部的链接以查看我正在尝试 OCR 的图像

我还缺少更多的预处理吗？
还是我把 tesseract 称为不好？

我根本没有选择，或者没有选择：

config = ('--psm 13 -c tessedit_char_whitelist=0123456789')

编辑：

有趣的是，我尝试了多种方法：

所以这对我来说是非常开始的。我可能更喜欢使用 Tesseract，以免花大价钱。当我的项目更高级时，我会知道我能做什么。

但我很想听听您对图像预处理的建议！:-)

所以如果你有建议。

问候！

score 7 · Accepted Answer

您可以为 tesseract 提供三个重要标志，它们是-l、--oem和--psm。

获取选项使用：

像这样使用这些选项config = ("-l eng --oem 1 --psm 7")

1 回答 1