我是PipelineDB的新手,甚至还没有在运行时体验过它(安装待定......)。但我正在阅读文档,我完全感兴趣。
显然,PipelineDB 能够采用基于集合的查询表示并将它们机械地转换为增量表示,以有效地处理作为连续视图输出函数的存储受限的增量流。
是否还支持将基于集合的查询作为基于集合的查询运行以启动连续视图?在我看来,在创建连续视图时,初始数据将以传统方式计算。此外,由于连续视图可以被截断,它们是否可以被重新填充(从仍然可用的源表)而不拆除它必须允许删除/创建的任何依赖对象?
在我看来,这个特性在许多实际场景中都是至关重要的。一个简单的例子是偶尔刷新以重置舍入误差的漂移,例如分数平均值。
另一个例子是,如果 PipelineDB 本身发现并修复了导致数据错误的错误。软件打补丁后,基于仍然可用数据的查询应该重新运行。
完全基于没有永久存储的事件流的连续视图无法以这种方式重建。不确定是否只有部分连接源是短暂的。
我没有在文档中看到这些主题。你能解释一下这些是或不是问题吗?
谢谢!