Flink 文档中已经提到,DataSet API 将来会被弃用。因此,我正在研究以批处理模式(我相信现在处于 Beta 版)迁移的Dataset API到DataStream API 的原型。
我们的代码库中有这个(类似的)代码,它在数据集上使用leftOuterJoin。
DataSet<SomeOutType> joined_out = datasetA.
leftOuterJoin(datasetB, JoinOperatorBase.JoinHint.BROADCAST_HASH_SECOND)
.where((left) -> coalesce(left.getId(), -9999999L))
.equalTo((right) -> right.company_id).with((JoinFunction<SomeTypeA, SomeTypeB, SomeOutType>) (left, right) -> {
SomeOutType recNew = SomeOutType.newBuilder().build();
recNew.setCustomerId(left.getCustomerId());
recNew.setCustomerName((right != null && right.cust_name != null) ? right.cust_name : "Blank");
....
....
....
return recNew;
});
问题是我无法在 Datastream API docs - Join中找到Left Join或Left Outer Join等效项。
由于他们正在考虑完全弃用 DataSet API,我假设现在应该有一种方法可以在 DataStream API 中执行此 Left Outer Join。
有人可以指导我以正确的方式做到这一点吗?TIA