有谁知道一种序列化格式:
- 是二进制的,至少相对紧凑,
- 可以存储 JSON 样式的数据(不是Protobuf、Thrift 等),
- 支持遍历(即你不需要解析整个文档来读取其中的一部分),并且
- 支持大文件(例如 30 GB)?
我看过以下内容:
- CBOR - 不支持遍历
- MessagePack - 不支持遍历
- UBJSON - 不支持遍历
微笑 - 不支持遍历
BSON -支持遍历!但最大文档大小为 2 GB。
BSON 是如此接近,但最大文件大小对我来说是致命的。有没有可以工作的格式?显然我可以自己写,但是二进制 JSON 格式太多了,肯定有人做出了不错的吗?
编辑: “遍历”我的意思与BSON 作者的意思是一样的——你应该能够找到给定的对象而不必解析整个文件。亚马逊将此称为“稀疏”或“浅层”阅读。