首先让我说我不确定我是否正确使用了这个库。
方法#1
我要离开这个页面(这里是Github)。我正在使用这段代码:
from ABBYY import CloudOCR
ocr = CloudOCR(application_id='ApplicationID', password='SuperSecretPasswordFromAbbyy')
pdf = open('blah.pdf', 'rb')
file = {pdf.name: pdf}
result = ocr.process_and_download(
file,
exportFormat='xml,pdfTextAndImages',
language='English'
)
print(result)
这是我得到的错误:
requests.exceptions.HTTPError: 403 Client Error: Forbidden for url: http://cloud.ocrsdk.com/processImage?exportFormat=xml%2CpdfTextAndImages&language=English
如果我点击错误回溯中的链接,我会看到以下文本:
404 HTTP method GET not supported for /processImage, only method POST supported
方法#2
我正在尝试将本地 PDF 发送到 Cloud OCR 平台。我已经成功使用这里找到的包,如下所示:
$ export ABBYY_APPID='ApplicationID'
$ export ABBYY_PWD='SuperSecretPasswordFromAbbyy'
...
$ python process.py -pdf blah.pdf result.txt
我想使用方法#1 实现一个系统。我只是想知道如何做不同的事情来实现这一点。方法 #2 有效的事实表明身份验证不是问题。