需要一点帮助来为下面的我的用例找到更好的解决方案。
我有包含输入数据的 S3 存储桶,它使用KMS KEY 1加密
所以我可以使用将 KMS KEY 1 设置为我的 spark 会话"spark.hadoop.fs.s3.serverSideEncryption.kms.keyId"
并能够读取数据,
现在我想将数据写入另一个 S3 存储桶,但它是使用KMS KEY 2加密的*
所以我目前正在做的是,使用 Key1 创建 spark 会话并读取数据帧并将其转换为 Pandas 数据帧并终止 spark 会话并使用 KMS KEY2 在相同的 AWS 胶水作业中重新创建 spark 会话并转换 pandas 数据在上一步中创建以触发数据帧并写入输出 S3 存储桶。
但这种方法有时会导致数据类型问题。有没有更好的替代解决方案来处理这个用例?
提前致谢,非常感谢您的帮助。