1

有人知道捆绑包在 BigtableIO 中是如何工作的吗?GroupBy在使用或CombineDoFn之前,一切看起来都很好。此时,管道会将我们PCollection元素的窗格从更改PaneInfo.NO_FIRINGPaneInfo{isFirst=true, isLast=true, timing=ON_TIME, index=0, onTimeIndex=0},然后BigtableIO将输出以下日志INFO o.a.b.sdk.io.gcp.bigtable.BigtableIO - Wrote 1 records。当有数百万条记录要输出时,日志记录是否会导致性能问题,或者是否BigtableIO为每条记录打开和关闭写入器?

4

1 回答 1

1

BigtableIO 在批处理 RPC 中发送多条记录。但是,这假设在“捆绑包”中发送了多条记录。捆绑包大小取决于前面的步骤和数据流框架的组合。您看到的问题似乎与BigtableIO直接相关。

FWIW,这里是记录方法中出现的记录数的代码finishBundle()

于 2017-06-26T13:04:42.933 回答