我正在尝试从将 Citus 和 Greenplum 用作数据仓库的角度来评估它们。总体思路是,来自多个 OLTP 系统的数据将通过 Kafka Connect 实时集成到中央仓库中以进行分析查询。
Citus 在这方面与 Greenplum 相比如何?我读过 Citus 有一些 SQL 限制,例如,如果相关性不在分布列上,则不支持相关子查询,Greenplum 是否有类似的 SQL 限制?如果将数据流式传输到 Greenplum 中(而不是批量更新),Greenplum 会运行良好吗?我只是感觉 Greenplum 更专注于分析并且可以牺牲一些特定于 OLTP 的东西,这是 Citus 无法承受的,因为他们将自己定位为 HTAP(而不是 OLAP)。Citus 还将自己定位为亚秒级查询时间的解决方案,这对我的用例来说不是必需的 - 每个查询几秒钟(最多 5 秒)就可以满足要求。