1

我们决定用雪花重新构建我们的产品存储来存储我们的时间序列数据。目前我们有10 TB 的时间序列数据(每天增加)和6 个作业,每15 分钟间隔触发一次,并利用近40GB/天的数据进行处理。我们正在使用 Microsoft Azure 云。

由于我们没有得到节点/服务器/雪花集群的确切大小,请您建议我们应该选择什么仓库大小。

4

1 回答 1

1

仓库大小可以随时修改。所以你可以从一个小的开始,然后再增加尺寸,直到找到最佳尺寸。您还可以使用多个仓库,这样您就可以重新分配您的工作量。

我建议您关注集群键而不是仓库大小,因为在您的情况下选择正确的集群键以进行有效的数据修剪将非常重要:

https://docs.snowflake.net/manuals/user-guide/tables-clustering-keys.html#benefits-of-defining-clustering-keys-for-very-large-tables

于 2020-02-27T12:47:52.527 回答