4

我想使用面向文档的数据库存储大量 JSON 文档,所有文档都具有非常相似的模式(尽管不相同)。

一个示例文档:

{
     "firstName": "John",
     "lastName": "Smith",
     "age": 25,
}

是否有任何系统(CouchDB 等)使用压缩(任何类型的)来避免一遍又一遍地存储密钥字符串(例如“firstName”)?

当有数百万个文档时,我的动机是最小化磁盘上数据库的大小,特别是当某些重复键比“firstName”长得多时。

谢谢你的想法!

W


编辑:在考虑了更多之后,我想我要问的是一个更通用的压缩系统的特定情况,其中压缩字典(部分?)在文档存储中的多个压缩文档之间共享(并且可能建立在时间)。然后,这将处理的不仅仅是 JSON 密钥的压缩。

做起来会很有趣!

4

1 回答 1

2

我只想添加一个“键映射”文档,您可以在其中存储键及其快捷方式......在后端进行映射应该不会那么麻烦......

{
   FirstName: 'a',
   Town: 'b'
}

{ 
  a: 'Peter',
  b: 'Zurich'
}
于 2011-02-15T23:19:32.237 回答