4

首先让我说我不确定我是否正确使用了这个库。

方法#1

我要离开这个页面(这里是Github)。我正在使用这段代码:

from ABBYY import CloudOCR

ocr = CloudOCR(application_id='ApplicationID', password='SuperSecretPasswordFromAbbyy')
pdf = open('blah.pdf', 'rb')
file = {pdf.name: pdf}

result = ocr.process_and_download(
  file,
  exportFormat='xml,pdfTextAndImages',
  language='English'
)

print(result)

这是我得到的错误:

requests.exceptions.HTTPError: 403 Client Error: Forbidden for url: http://cloud.ocrsdk.com/processImage?exportFormat=xml%2CpdfTextAndImages&language=English

如果我点击错误回溯中的链接,我会看到以下文本:

404 HTTP method GET not supported for /processImage, only method POST supported

方法#2

我正在尝试将本地 PDF 发送到 Cloud OCR 平台。我已经成功使用这里找到的包,如下所示:

$ export ABBYY_APPID='ApplicationID'
$ export ABBYY_PWD='SuperSecretPasswordFromAbbyy'
...
$ python process.py -pdf blah.pdf result.txt

我想使用方法#1 实现一个系统。我只是想知道如何做不同的事情来实现这一点。方法 #2 有效的事实表明身份验证不是问题。

4

1 回答 1

0

状态: - 我也遇到了同样的问题,使用这两种方法。

解决方案 - 如果您的 Application_ID 和 Password 正确,您仍然会收到相同的错误,原因是您在注册表单上选择了英国美国注册。

美国和英国都有不同的 ServerUrl:

  1. http://cloud-westus.ocrsdk.com如果您在美国创建应用程序
  2. http://cloud-eu.ocrsdk.com如果您在英国创建应用程序

根据位置更改 AbbyyOnlineSdk.py 中的 ServerUrl。

为我完成了使命!

希望这有帮助。

于 2020-02-07T09:28:56.267 回答