我正在尝试设置将数据加载到 RDS PostgreSQL 数据库中的每日 AWS Glue 作业。但是我需要在将数据加载到它们之前截断我的表,因为这些作业适用于整个数据集。
为此,我正在实施此处给出的解决方案:https ://stackoverflow.com/a/50984173/11952393 。
它使用纯 Python 库 pg8000。我遵循这个 SO 中的指导方针,下载库 tar,解压缩,添加空__init.py__
文件,压缩整个想法,将 zip 文件上传到 S3,并将 S3 URL 作为 Python 库添加到 AWS Glue 作业配置中。
当我运行该作业时,似乎正确导入了 pg8000 模块。但后来我收到以下错误:
AttributeError: module 'pg8000' has no attribute 'connect'
我肯定做错了什么......但找不到什么。欢迎任何建设性的反馈!