我是 citus 的新手,需要建议在 create_distributed_table 时将哪一列视为分布列。
exp 1,订单的快照表,每一行包含一个唯一的订单信息,3个字段,order_id,create_date,update_date,哪个更好。
exp 2,如果有一个用户访问日志表,例如clicks、sequence_id或click_date,是哪一个?
谢谢!
我是 citus 的新手,需要建议在 create_distributed_table 时将哪一列视为分布列。
exp 1,订单的快照表,每一行包含一个唯一的订单信息,3个字段,order_id,create_date,update_date,哪个更好。
exp 2,如果有一个用户访问日志表,例如clicks、sequence_id或click_date,是哪一个?
谢谢!
“为每个表选择分布列是最重要的建模决策之一,因为它决定了数据如何跨节点分布。”
来自 Citus 文档。
我建议你看看 Citus Docs 的相关部分:https ://docs.citusdata.com/en/v10.2/sharding/data_modeling.html
此外,您可以尝试不同的分布列并对它们进行一些性能测试,然后进行比较。