python - 如何修复 AWS Glue 作业中的“模块 'pg8000' 没有属性 'connect'”错误

Question

我正在尝试设置将数据加载到 RDS PostgreSQL 数据库中的每日 AWS Glue 作业。但是我需要在将数据加载到它们之前截断我的表，因为这些作业适用于整个数据集。

为此，我正在实施此处给出的解决方案：https ://stackoverflow.com/a/50984173/11952393 。

它使用纯 Python 库 pg8000。我遵循这个 SO 中的指导方针，下载库 tar，解压缩，添加空__init.py__文件，压缩整个想法，将 zip 文件上传到 S3，并将 S3 URL 作为 Python 库添加到 AWS Glue 作业配置中。

当我运行该作业时，似乎正确导入了 pg8000 模块。但后来我收到以下错误：

AttributeError: module 'pg8000' has no attribute 'connect'

我肯定做错了什么......但找不到什么。欢迎任何建设性的反馈！

score 0 · Accepted Answer

添加

install_requires = ['pg8000==1.12.5']

在_setup.py生成.egg文件的文件中

您应该能够访问库。

score 0 · Accepted Answer

这就是它对我有用的原因。

将以上2个目录分别压缩

cd /tmp/
zip -r pg8000.zip pg8000/
zip -r scramp.zip scramp/

s3://<bucket>/<prefix>/pg8000.zip,s3://<bucket>/<prefix>/scramp.zip

2 回答 2