当我运行 saveAsTextFiles("prefix","postfix"); 对于 JavaDStreams,我发现创建了多个部分文件。
我想了解每个零件文件的含义?
这些文件具有以下命名,/part0000、part0001、part0002
创建用于输出这些文件的基于行的 RDD 平面图的代码
JavaDStream<String> words = lines.flatMap(new FlatMapFunction<String, String>() {
@Override
public Iterable<String> call(String x) {
return Lists.newArrayList(NEWSPACE.split(x));
}
});
我的假设是,这是为每个 RDD= 1 行创建一个 RDD 的 DStream,因此应该创建 1 个部分文件。