2016 年 5 月更新:Flink 文档现在有一个关于如何将 Flink 与 AWS 结合使用的页面
Flink 用户邮件列表上也有人问过这个问题,我已经在那里回答了:http: //apache-flink-user-mailing-list-archive.2336050.n4.nabble.com/Processing-S3-数据与 Apache-Flink-td3046.html
tl;博士:
Flink 程序
public class S3FileSystem {
public static void main(String[] args) throws Exception {
ExecutionEnvironment ee = ExecutionEnvironment.createLocalEnvironment();
DataSet<String> myLines = ee.readTextFile("s3n://my-bucket-name/some-test-file.xml");
myLines.print();
}
}
将以下内容添加到core-site.xml并使其可用于 Flink:
<property>
<name>fs.s3n.awsAccessKeyId</name>
<value>putKeyHere</value>
</property>
<property>
<name>fs.s3n.awsSecretAccessKey</name>
<value>putSecretHere</value>
</property>
<property>
<name>fs.s3n.impl</name>
<value>org.apache.hadoop.fs.s3native.NativeS3FileSystem</value>
</property>