问题标签 [pytesser]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Recognize simple digits with pytesser
I'm learning OCR using PyTesser
and Tesseract
. As the first milestone, I want to write a tool to recognize captcha that simply consists of some digits. I read some tutorials and wrote such a test program.
I tested my code with the image below. But the result is 2(T?770
. And I've tested some other similar images as well, in 80% case the results are incorrect.
I'm not familiar with imaging processing. I've two questions here:
Is it possible to tell
PyTesser
to guess digits only?I think the image is quite easy for human to read. If it is so difficult for
PyTesser
to read digits only image, is there any alternatives can do a better OCR?
Any hints are very appreciated.
python - 使用 PyTesser 破解简单的验证码
我PyTesser
用来打破一个captcha
. PyTesser 使用tesseract
python ocr 库。在将图像放入 PyTesser 之前,我使用了一些过滤。一步一步我的代码:输入图像是:
应用此代码后,输出为:
现在,
在此代码段输出图像之后是:
最后,当我应用这个时
我得到输出%/ww
请帮助我找到正确的结果。
如果我尝试使用这些图像,此代码可以成功识别字母。
python - pytesseract 显示“‘str’对象没有属性‘save’”错误
当我为 pytesseract 运行以下代码时
它显示以下错误
这个错误是什么意思?我该如何纠正这个?
提前致谢
python - Python 2.7.9 中的 Pytesser - 打印 image_to_string(image) 错误
我正在将 Pytesser 用于 python OCR。我已经安装了 PIL 和 Pytesser 并运行了以下代码:
然后出现这个错误
这意味着什么?我做错了什么?我正在使用 Windows 8 64 位和 Python 2.7.9
python-2.7 - 使用 pytesseract 时出错
我正在使用 pytesseract 将图像转换为文本。我使用 pip 命令成功安装了 pytesseract。但是当我运行脚本时,它显示错误:No module named Tesseract
。
这些是我的代码:
错误 :
python - pytesser subprocess.Popen 失败
从昨天开始,我试图使用 OCR pytesser。我自己解决了几个问题,但我不知道如何解决这个问题。有错误:
最后一行说“找不到文件”
我如何将 tesseract 放入我的init .py
我真的不明白为什么他不能打开文件。在我的init .py中还有另外两件事。我可以更改我尝试创建的图像文件和 txt 文件并给他路径没有成功,但我认为他自己创建了它们。
这是发送到 Popen 的 3 个文件,所以我想错误就在那里。
我希望我足够清楚,让你们理解我遇到的问题。
编辑:lol.py 中的内容来自该站点,只是修改了网址http://www.debasish.in/2012/01/bypass-captcha-using-python-and.html
python - pytesser - next line of text in image?
I'm using pytesser on simple images with plain text. It works great! However, in python it prints each line of text on a new line. But the string it outputs has no "\n" or new line delimiters that I can pull out.
How does it print each new line of the image on a new line in the console? And is there a way I can pull out a particular line? or split them myself?
It's more than likely something very simple i'm missing...
Output:
python - 如何加载数学 tesseract 模块?
所以我是新手使用 tesseract,我想加载数学输入模块。不幸的是,我不知道如何将它与此链接中的数学模块一起使用。如何正确加载?它会默认加载经过训练的数据吗?我已经将经过训练的数据添加到适当的 tessdata 文件夹中了吗?我无法弄清楚 lang 参数的 isocode 应该是什么?是垫子之类的东西吗?关于这个问题的文档非常有限,我们将不胜感激。
我也在用 pytesseract 进行编码,但如果它不支持更改训练数据集,我对其他模块持开放态度。
python - 在 Windows 上开始使用 Python OCR?
我以前从未使用过python,我不知道从哪里开始。我的目标是获取数字和多色背景的图像数据,并可靠地识别出正确的字符。我查看了为此所需的工具,我发现了 Anaconda python 发行版,其中包括我可能需要的所有可能的包,以及 tesseract-ocr 和 pytesser。
不幸的是,我不知道如何开始。我正在使用 PyCharm 社区 IDE,只是尝试遵循本指南: http: //www.manejandodatos.es/2014/11/ocr-python-easy/ 来掌握 OCR。
这是我正在使用的代码:
我相信我正在使用的 Anaconda 发行版有 PIL,但我收到了这个错误:
谁能指出我正确的方向?