我想知道,如果我的查询返回数百万行,JdbcIO 将如何并行执行查询。我已经提到了https://issues.apache.org/jira/browse/BEAM-2803和相关的拉取请求。我完全无法理解。
ReadAll
expand
方法使用ParDo
. 因此,它会创建到数据库的多个连接以并行读取数据吗?如果我限制可以创建到数据源中数据库的连接数,它会坚持连接限制吗?
谁能帮我理解这将如何处理JdbcIO
?我在用2.2.0
更新 :
.apply(
ParDo.of(
new ReadFn<>(
getDataSourceConfiguration(),
getQuery(),
getParameterSetter(),
getRowMapper())))
上面的代码显示 ReadFn 与 ParDo 一起应用。我认为,ReadFn 将并行运行。如果我的假设是正确的,我将如何使用该readAll()
方法从一次只能建立有限数量的连接的数据库中读取?
谢谢巴鲁