0

我们希望能够使用分布式表,其中一些节点可能有多个租户,而其他节点可能只有一个或两个(例如,自己放置一个庞大、高流量的租户,但将多个小租户组合在一起)。

我看到了 HASH 和 MODULO 的 DISTRIBUTE BY 选项,我认为这不符合这个要求。还有其他 CREATE TABLE 选项(特别是 DISTRIBUTED 和 DISTSTYLE,如下所示),但我似乎无法找到有关这些选项含义的文档或详细信息。我看到一篇提到自定义分布函数的帖子,但我找不到任何其他引用。

问题:有没有办法使用 DISTRIBUTED 或 DISTSTYLE 选项或通过其他方式将分布列值显式分配给节点?自定义分发功能是否可用或在路线图上?(额外问题:有任何指向有关 DISTRIBUTED 或 DISTSTYLE 详细信息的链接吗?)

...
[ 
  DISTRIBUTE BY { REPLICATION | ROUNDROBIN | { [HASH | MODULO ] ( column_name ) } } |
  DISTRIBUTED { { BY ( column_name ) } | { RANDOMLY } |
  DISTSTYLE { EVEN | KEY | ALL } DISTKEY ( column_name )
]
4

0 回答 0