我想使用面向文档的数据库存储大量 JSON 文档,所有文档都具有非常相似的模式(尽管不相同)。
一个示例文档:
{
"firstName": "John",
"lastName": "Smith",
"age": 25,
}
是否有任何系统(CouchDB 等)使用压缩(任何类型的)来避免一遍又一遍地存储密钥字符串(例如“firstName”)?
当有数百万个文档时,我的动机是最小化磁盘上数据库的大小,特别是当某些重复键比“firstName”长得多时。
谢谢你的想法!
W
编辑:在考虑了更多之后,我想我要问的是一个更通用的压缩系统的特定情况,其中压缩字典(部分?)在文档存储中的多个压缩文档之间共享(并且可能建立在时间)。然后,这将处理的不仅仅是 JSON 密钥的压缩。
做起来会很有趣!