0

嗨,我在使用 DataFrameReader 从 S3 读取文件时遇到问题,我可以在本地读取完全相同的文件,但是当它存储在 s3 上时,我无法读取它,这是我的代码片段

private SparkSession getSparkSession() {
    return  sparkSessionService.getTransformedCsvSparkSession();
}

public void processFile(StructType structType, String srcFile, String targetFile) {
    //"s3n://yourAccessKey:yourSecretKey@/path/
    String spark = new String("s3n://TTTTTTTT:YYYYYYY@/bucket-qa1/test/123456785_Ads_mockup_.csv");
    Dataset<Row> dfSpark = getSparkSession().read().format("csv").schema(structType).option("header", srcIncludeHeader).load(spark);
    dfSpark.show();

但我得到了这个错误:

java.lang.IllegalArgumentException: Invalid hostname in URI s3n://.....

我正在使用DataBrics

我如何“告诉” DataFrameReader 从 AWS S3 读取?

4

1 回答 1

2

存储桶名称前不应该有斜线,文件路径上有斜线是可以的

于 2017-02-11T15:27:38.853 回答