在我的用例中,从 Kafka 获取一组匹配的文件模式,
PCollection<String> filepatterns = p.apply(KafkaIO.read()...);
在这里,每个模式最多可以匹配 300 多个文件。
Q1。我如何使用TextIO.Read()
来匹配来自 的数据PCollection
,因为它withHintMatchesManyFiles()
仅适用于TextIO.Read()
不适用于TextIO.ReadFiles()
.
Q2。如果使用通过 FileIO.Match->FileIO.ReadMatch()->TextIO.ReadFiles() 的withHintMatchesManyFiles()
路径,在该路径中不可用,它将如何影响读取性能?
Q3。上述用例还有其他优化路径吗?