我一直在阅读如何对 Azure 表存储进行分区以确保高性能。我想知道我提出的策略是否能够为数据存储提供高效且可扩展的插入和简单查询。
我有 1000 个不同的进程每 30 秒将一小包数据(约 50 字节)上传到 AZT。我的查询几乎总是按流程和时间进行简单查询。例如,我想查询给定日期从晚上 7 点到晚上 9 点的所有进程 A 的日志。
我提出的策略是为每个进程创建一个表(1000 个表),然后对行进行分区,使每个分区包含 6 小时的数据(每天 4 个新分区,每个分区 720 行)。从 11 月 8 日午夜到早上 6 点,分区键“NOV82012-0”将包含 720 行。'NOV82012-1' 将包含 6AM-Noon 等...
这应该确保我在任何分区中的行数始终少于 1000 行,这样我就不必担心延续令牌。我也可以轻松地按进程“过滤”,因为每个进程的数据都有自己的表。
这是这种情况下的理想策略吗?我错过了什么吗?