0

我正在尝试使用 Adob​​e PDF 服务从公司报告 PDF 中提取文本,并收到以下一些通用错误消息:

    raise SdkException("Request could not be completed. Possible cause attached!", sys.exc_info())
adobe.pdfservices.operation.exception.exceptions.SdkException: description =Request could not be completed. Possible cause attached!, requestTrackingId=(<class 'requests.exceptions.ConnectionError'>, ConnectionError(ProtocolError('Connection aborted.', timeout('The write operation timed out'))), <traceback object at 0x10455d540>)

这不是网络问题,因为:

  1. 我同时成功地从其他 6 个文件中提取了文本
  2. 我对每个错误的文件进行了多次尝试

这些文件没有损坏,因为我可以在本地查看它们就好了。

我正在运行的 python 代码由 Adob​​e 的服务帐户生成并下载到本地文件夹:仅更改了输入文件名。

我使用的是试用帐户,并且只使用了我的配额的 20%,所以这也不是配额错误。

错误文件列表如下:

  1. https://www.asahigroup-holdings.com/en/ir/pdf/annual/2019_all.pdf
  2. https://www.csx.com/share/wwwcsx15/assets/File/Responsibility/CSX_ESG_Report_Final_7_30.pdf
  3. https://online.flippingbook.com/view/459148139/ (从那里下载)

是否有任何人(可能是 Adob​​e 员工)能够对一般错误消息提供任何见解/建议,以便我可以尝试纠正问题?

4

1 回答 1

2

我在我的 Node.js 环境中测试了这些文件,它们运行良好。如果您愿意,我很乐意与您分享输出。看起来错误是由于超时造成的,我怀疑这是因为文件大小实际上并不是那么大。

尝试使用允许您设置自定义超时的示例。完整示例在这里,但相关代码如下。

# Initial setup, create credentials instance.
credentials = Credentials.service_account_credentials_builder()\
    .from_file(base_path + "/pdfservices-api-credentials.json") \
    .build()

# Create client config instance with custom time-outs.
client_config = ClientConfig.builder().with_connect_timeout(10000).with_read_timeout(40000).build()

#Create an ExecutionContext using credentials and create a new operation instance.
execution_context = ExecutionContext.create(credentials, client_config)
于 2021-07-14T14:34:44.227 回答