有人知道捆绑包在 BigtableIO 中是如何工作的吗?GroupBy
在使用或Combine
DoFn之前,一切看起来都很好。此时,管道会将我们PCollection
元素的窗格从更改PaneInfo.NO_FIRING
为PaneInfo{isFirst=true, isLast=true, timing=ON_TIME, index=0, onTimeIndex=0}
,然后BigtableIO
将输出以下日志INFO o.a.b.sdk.io.gcp.bigtable.BigtableIO - Wrote 1 records
。当有数百万条记录要输出时,日志记录是否会导致性能问题,或者是否BigtableIO
为每条记录打开和关闭写入器?
问问题
86 次
1 回答
1
BigtableIO 在批处理 RPC 中发送多条记录。但是,这假设在“捆绑包”中发送了多条记录。捆绑包大小取决于前面的步骤和数据流框架的组合。您看到的问题似乎与BigtableIO
直接相关。
FWIW,这里是记录方法中出现的记录数的代码finishBundle()
。
于 2017-06-26T13:04:42.933 回答