我有带有表格的 PDF 和与表格内容相关的图像图。表格和图像都在一个页面上。
我已经使用 Camelot 库提取了表格。还有使用 Fitz 库的图像。使用 Python
现在我想将这些图像(.png)上传到任何可能的云服务,并将相应图像的 Web 链接提供到相应表的 Dataframe。
请帮忙。
我有带有表格的 PDF 和与表格内容相关的图像图。表格和图像都在一个页面上。
我已经使用 Camelot 库提取了表格。还有使用 Fitz 库的图像。使用 Python
现在我想将这些图像(.png)上传到任何可能的云服务,并将相应图像的 Web 链接提供到相应表的 Dataframe。
请帮忙。
如果是任何公共云,您可以使用 S3 使用BOTO3(python 库)存储图像。
在 AWS S3 存储桶中存储图像的示例代码:
import boto3
s3 = boto3.client('s3')
bucket = 'your-bucket-name'
file_name = 'location-of-your-image'
key_name = 'name-of-image-in-s3'
s3.upload_file(file_name, bucket, key_name)
要获取上传的文件 url,可以将其构造为:
s3_url = f"https://{bucket}.s3.{region}.amazonaws.com/{file_name}"
并将s3_url存储在数据框中。