我已经通过 spark 数据框创建了 CSV 文件,这些文件会自动加密 KMS。
供您参考,我提供了一个创建这些 KMS 加密文件的示例代码片段。如果您在写作时看到我没有提供任何 KMS 密钥。如果您说出根本原因,这将非常有帮助。
val df=spark.read.format("csv").option("header", "true").load("s3:///test/App_IP.csv")
df.createOrReplaceTempView("test")
val df1=spark.sql("select name from test")
df1.coalesce(1).write.format("com.databricks.spark.csv").option("header", "true").save("s3://test/city5/")
我从 EMR 集群 (emr-5.24.0) 中的 spark-shell 执行的这段代码,spark 版本是 Spark 2.4.2