亲爱的社区,我正在尝试做一些 ocr。
我已经对图像进行了很多预处理(未倾斜,裁剪......)
现在,我可以毫无问题地自己读取数字
但我无法获得 tesseract 给我一个有意义的结果。
单击顶部的链接以查看我正在尝试 OCR 的图像
我还缺少更多的预处理吗?
还是我把 tesseract 称为不好?
我根本没有选择,或者没有选择:
config = ('--psm 13 -c tessedit_char_whitelist=0123456789')
编辑 :
有趣的是,我尝试了多种方法:
- Windows 上的 Tesseract 5,不提供任何“eT” (但可能配置错误)
- Windows 上 Phyton Jupyter Notebook 的 Google API => 'UO0 1124'或类似的东西不太记得了
- buntu 上的 Tesseract 4 配置 = ('-l eng --oem 1 --psm 13') : 'WU000 244m'
- 来自 Ubuntu 上 Python Jpyter Notebook 的 Google API => 'U000241\n'
所以这对我来说是非常开始的。我可能更喜欢使用 Tesseract,以免花大价钱。当我的项目更高级时,我会知道我能做什么。
但我很想听听您对图像预处理的建议!:-)
所以如果你有建议。
问候 !