0

我正在用一张桌子加入一个流。连接的结果只是部分成功。一些值被准确填充,而另一些为空。我检查以确保表和流中都存在这些值,并且用于连接的列是两者的键。

我正在使用 confluent 加载使用 jdbc 从 MSSQL 中的表中读取的主题。

然后我使用 KSQL 从相应的主题创建流和表,数据都是 JSON 格式。

表中缺失数据的时间戳早于流的时间戳。

create stream casecode_contract_stream as select ct.projectid, ct.casecode, cs.isTrue from contract_stream cs left join casecode_table ct on cs.projectid = ct.projectid;    

select * from casecode_contract_stream limit 1;
1532034321292 | 706083 | null | null | true

ksql> select * from casecode_contract_stream where casecode is not null limit 1;
1532034321292 | 705147 | 705147 | data1 | true

select * from casecode_table where projectid = 705147;
1532033878462 | 705147 | 705147 | data1 

select * from casecode_table where projectid = 706083;
1532033878463 | 706083 | 706083 | data2 

select * from contract_stream where projectid = 705147;
1532034321292 | 705147 | 705147 | true

select * from contract_stream where projectid = 706083;
1532034321292 | 706083 | 706083 | true

有什么建议么?

4

1 回答 1

0

结果取决于(非确定性)处理顺序。这是一个已知问题,并且正在进行中以使处理顺序更具确定性。

在将记录添加到表端之前,可能会处理来自流端的记录。对于这种情况,当您指定左连接时,流记录将使用 NULL 连接。

于 2018-07-20T21:40:13.777 回答