我有一组如下所示的文档:
每个 VIN/SiteID 有一个文档,我们的访问模式显示特定站点的所有文档。我看到我们可以选择两个潜在的分区键:
- SiteID - 我们只有 75 个站点,因此基数不是很高。此外,文档不是很大,因此 10GB 的限制可能还可以。
- SiteID/VIN:数据现在分布更均匀,但这意味着每个逻辑分区将只存储一项。这是反模式吗?此外,为了支持我们的访问模式,我们将需要使用跨分区查询。再次,数据集很小,这是一个问题吗?
根据我所描述的,哪个分区键更有意义?
任何其他建议将不胜感激!