2

我是 AWS 新手。我有一个用户帐户和两个角色,一个用于生产,一个用于测试。

通常我登录我的帐户并切换到 prod 角色来运行一些简单的选择查询。

现在我想用 PyAthena 在 Python 中本地使用 Athena。我尝试了 PyAthena 文档中的以下资源:

from pyathena import connect
import pandas as pd

conn = connect(aws_access_key_id='YOUR_ACCESS_KEY_ID',
               aws_secret_access_key='YOUR_SECRET_ACCESS_KEY',
               s3_staging_dir='s3://YOUR_S3_BUCKET/path/to/',
               region_name='us-west-2')
df = pd.read_sql("SELECT * FROM many_rows", conn)
print(df.head())

但总是有错误

An error occurred (AccessDeniedException) when calling the StartQueryExecution operation: User: arn:aws:iam::xxxxxx:user/xxxx@xxxxx is not authorized to perform: athena:StartQueryExecution on resource: arn:aws:athena:ap-southeast-2:xxxxx:workgroup/primary

如果我使用我的用户帐户运行相同的查询而不切换角色,这就是我会得到的确切错误。

profile name parameter in connect即使正确识别了env,我也尝试添加但仍然无法正常工作。

有人可以帮我如何在本地 python 代码中执行“切换”角色步骤吗?

4

1 回答 1

2

问题似乎是由于缺少角色而不是profile_name参数。如果您查看Connectionpyathena 中的类role_arn,您可以在初始化连接时指定一个变量。这就是我要说的那条线。

您可能想以这种方式尝试-

conn = connect(aws_access_key_id='YOUR_ACCESS_KEY_ID',
               aws_secret_access_key='YOUR_SECRET_ACCESS_KEY',
               s3_staging_dir='s3://YOUR_S3_BUCKET/path/to/',
               region_name='us-west-2',
               role_arn='<your arn here'>)

我没有自己测试过,因为我没有 Athena 设置。

于 2019-12-08T03:10:04.770 回答