2

我尝试 OCR 的图像

编辑:如要求,这是原始图像

亲爱的社区,我正在尝试做一些 ocr。
我已经对图像进行了很多预处理(未倾斜,裁剪......)
现在,我可以毫无问题地自己读取数字
但我无法获得 tesseract 给我一个有意义的结果。

单击顶部的链接以查看我正在尝试 OCR 的图像

我还缺少更多的预处理吗?
还是我把 tesseract 称为不好?

我根本没有选择,或者没有选择:

config = ('--psm 13 -c tessedit_char_whitelist=0123456789')

编辑 :

有趣的是,我尝试了多种方法:

  • Windows 上的 Tesseract 5,不提供任何“eT” (但可能配置错误)
  • Windows 上 Phyton Jupyter Notebook 的 Google API => 'UO0 1124'或类似的东西不太记得了
  • buntu 上的 Tesseract 4 配置 = ('-l eng --oem 1 --psm 13') : 'WU000 244m'
  • 来自 Ubuntu 上 Python Jpyter Notebook 的 Google API => 'U000241\n'

所以这对我来说是非常开始的。我可能更喜欢使用 Tesseract,以免花大价钱。当我的项目更高级时,我会知道我能做什么。

但我很想听听您对图像预处理的建议!:-)

所以如果你有建议。

问候 !

4

1 回答 1

7

您可以为 tesseract 提供三个重要标志,它们是-l--oem--psm

  • -l 标志控制输入文本的语言。

  • 参数或 OCR 引擎模式控制 Tesseract 使用的--oem 算法类型。

  • --psm 控制 Tesseract 使用的自动页面分割模式。

获取选项使用:

像这样使用这些选项config = ("-l eng --oem 1 --psm 7")

于 2019-09-28T18:58:43.650 回答