我将大量 GPS 数据存储在存储表中。每个分区最多可以达到 100 万个实体。插入到表中的每个 GPS 实体实际上与之前插入的数据是连续的,因此顺序很重要。
有时我需要执行以下查询:
从当前实体(在同一分区内)获取前/后 3 个 GPS 实体。
RowKey 设计的选项:
创建一个递增的整数。 但是我如何跟踪表格的当前大小?无法获取表格行数或获取最后插入的行。
使用日期时间刻度。 但是如何使用刻度获取上一个/下一个实体?
我在 C# 中使用 SDK 2.0 版。
我将大量 GPS 数据存储在存储表中。每个分区最多可以达到 100 万个实体。插入到表中的每个 GPS 实体实际上与之前插入的数据是连续的,因此顺序很重要。
有时我需要执行以下查询:
从当前实体(在同一分区内)获取前/后 3 个 GPS 实体。
RowKey 设计的选项:
创建一个递增的整数。 但是我如何跟踪表格的当前大小?无法获取表格行数或获取最后插入的行。
使用日期时间刻度。 但是如何使用刻度获取上一个/下一个实体?
我在 C# 中使用 SDK 2.0 版。
这是一个非常酷的问题要解决。
如果您的工作是仅查找在给定条目之后或之前的条目,这将很简单,因为您可以将 DateTime.Now.Ticks 或 (DateTime.Max.Ticks - DateTime.Now.Ticks) 作为RowKey 并在查询中使用“Take”命令来查找最近的 X 记录。
但是,由于您需要找到在给定位置 ID 之后或之前的最近位置,因此我认为这是一种可能适用于您的 RowKeys 的设计模式:
例如,您有 7 个位置,Location1..thru..Location7 我给了它们从 01 到 99 的随机 Tick 值(为简单起见)。假设 MaxTicks 为 100。这将使我们的表包含以下数据:
Rowkey,实体数据
现在,对于每个实体,您都可以轻松计算其“相反”的 Rowkey 实体。(只需从 DateTime.MaxValue.Ticks 中减去其 RowKey 并将前缀从 A 翻转到 D 或从 D 翻转到 A)
因此,如果您需要 Location3 之前的 2 个实体,只需发出查询以从 RowKey 大于“D----45”且小于“D----99”(最大)的表中获取 2 个实体. 如果您需要在 Location3 之后取 2 行,只需发出 Take 2,其中 RowKey 大于“A----55”且小于“A-----99”(最大值)。发出“小于”标准很重要,这样您在查询“A”时就不会意外遇到“D”。
在批处理事务中更新/插入两组实体,以保证两者都或没有进入表并“瞧”。
这种方法的缺点是您必须支付两倍的存储费用。
希望这会有所帮助并且不会太混乱