我正在尝试对 citus(postgres 的扩展)进行一些测量。对于那个任务,我正在 citus 上运行 tpc-ds 查询。我正在使用的 citus 是从这里获取的 master、workers 和 manager 的容器:https ://github.com/citusdata/docker 我可以通过添加他们的容器来添加workers。到目前为止一切顺利,但我在进行测量时遇到了麻烦,需要一些答案:
- 要使用所有工作人员,我需要运行 select_distributed_table/select_reference _table。是否将所有数据复制给所有工作人员(例如,16 名工作人员的 1TB 数据变成了 16 TB)?
- 如果我不使用 select_distributed_table 但添加工作人员,该操作有什么好处吗?
- 如果我已经运行了 select_distributed_table 并且后来添加了 worker,它是否会分发数据或者我需要再次运行 select_distributed_table?