我试图想出我应该为我的解决方案使用多少个集合。我知道这取决于,但我想就我们将使用的数据类型提供一些背景信息。
- 物联网遥测事件
- 参考数据(侦听来自外部系统的事件并存储它)
- 读取模型 - 根据来自上述两个来源的数据创建非规范化视图
此外,我们将在 IoT 事件和参考数据上使用 cosmos db 更改提要,因此我知道我们将需要一个租约集合。
任何帮助或建议都会很棒!
我试图想出我应该为我的解决方案使用多少个集合。我知道这取决于,但我想就我们将使用的数据类型提供一些背景信息。
此外,我们将在 IoT 事件和参考数据上使用 cosmos db 更改提要,因此我知道我们将需要一个租约集合。
任何帮助或建议都会很棒!
正如您所说,这完全取决于多种因素,我无法给出最准确的答案,但我会尝试总结您需要了解的所有内容,以便做出正确的选择。
首先,分区键是不可变的。这意味着一旦使用分区键创建集合,它的定义就不能更改。文档上的分区键值也是如此。
其次,分区的最大大小为 10GB(至少目前如此)。这意味着,如果您选择的分区键最终会达到该数字,那么游戏就结束了,您必须将您的集合迁移到另一个具有更多不同值的分区键的集合。
我之所以提到这一点,是因为可以将多种类型的实体存储在同一个集合中,唯一的限制是分区键。如果他们可以有一个共享的分区键(比如说某种类型的 id,比如 eventId),那么他们就没有理由不能共享同一个集合。
好吧,我撒谎了。您的实体可能不应该共享同一个集合还有另一个原因,那就是成本和吞吐量扩展。每种类型的实体拥有一个集合具有(可能)具有更合适的分区键但也能够彼此独立扩展的优点。这意味着您可以以 600 RU/s 的速度预配遥测事件集合,而以 400 RU/s 的速度预配参考数据。同样,这取决于您期望的负载,因此完全取决于您。从长远来看,这最终可能会节省资金或花费更多的钱。
更改提要需要指向一个集合以存储与租赁相关的文档,但是许多更改提要进程可以共享相同的更改提要集合,因此您至少需要一个。