0

我有带有表格的 PDF 和与表格内容相关的图像图。表格和图像都在一个页面上。

我已经使用 Camelot 库提取了表格。还有使用 Fitz 库的图像。使用 Python

现在我想将这些图像(.png)上传到任何可能的云服务,并将相应图像的 Web 链接提供到相应表的 Dataframe。

请帮忙。

这就是单页 PDF 的外观。

4

1 回答 1

0

如果是任何公共云,您可以使用 S3 使用BOTO3(python 库)存储图像。

在 AWS S3 存储桶中存储图像的示例代码:

import boto3
s3 = boto3.client('s3')
bucket = 'your-bucket-name'
file_name = 'location-of-your-image'
key_name = 'name-of-image-in-s3'
s3.upload_file(file_name, bucket, key_name)

要获取上传的文件 url,可以将其构造为:

s3_url = f"https://{bucket}.s3.{region}.amazonaws.com/{file_name}"

并将s3_url存储在数据框中。

于 2020-10-16T13:59:51.860 回答