每当定义一个连续导出实体时,它都会有一个查询作为其输入。如果查询只是一个表名,很容易理解导出是如何发生的。必须根据导出实体运行时的不同时间点来考虑表中记录的摄取时间。但是,如果查询是实际的“查询”,我的意思是说正在使用各种管道运算符在表顶部应用一些转换。在这种情况下,查询的结果是动态的,数据不会在任何地方被摄取。这是否意味着连续导出真的只考虑查询中最左侧实体的摄取时间,这显然是某个表,因此显然确实将摄取时间存储为它的记录的一部分。
更新
添加此更新,因为我需要对@yifat 的回答进行更多说明。
因此,假设我的查询引用了三个表 t1、t2、t3。我创建了下图来描述我的困惑:-
正如您在图中看到的那样,当前运行实例无论如何都将确保它将获取自上次导出游标以来所有 3 个表的数据。那么添加强制延迟有什么不同呢?该图将说明一些我没有正确理解的东西。谢谢。