0

我有大约 28GB 的​​数据输入,用于存储在 Windows Azure 表存储中的超过 1350 万行。

6 列,除 1 个十进制数和 1 个日期时间外的所有整数。分区键长约 10 个字符。RowKey 是一个向导。

这是为了我的理智检查——这看起来对吗?

我从中迁移数据的 Sql 数据库有更多数据,只有 4.9GB。

有没有办法缩小尺寸?我不怀疑重命名属性会对此产生巨大影响。

*请注意,这只是用于估算长期成本的数据样本。

4

2 回答 2

1

嗯……有些事情似乎不太对劲。

  • 每个属性都是一个键/值对,因此在计算中包含属性名称。
  • 数据本身可能约为 75-100 个字节,包括平均每个 10 个字符的属性名称。4 个整数等于 16 个字节,十进制(双精度?) 8 个字节,时间戳 8 个字节。因此,让我们将每个实体最多舍入 100 个字节。
  • 在 1400 万个实体中,您将拥有 100*1350 万,即大约 1.35 GB。

你的数字是大约。大一个数量级(每个实体大约 2,000 字节)。即使考虑到序列化的批量,我也不知道您是如何获得如此大的尺寸的。只是好奇:您是如何计算当前表大小的?而且...您是否进行了多次测试,从而从以前的运行中获得了更多数据?您是在测量表大小,还是在存储帐户中使用的总存储空间?如果是后者,可能还有其他表(例如诊断)也在消耗空间。

于 2013-04-25T03:53:23.377 回答
0

重命名持久化实体中的属性应该会对大小产生一些影响。不幸的是,这仅适用于将来保存的数据。现有数据不会因为您重命名属性而改变

于 2013-04-24T18:55:48.200 回答