0

我的数据如下: 我有大约 1,000,000 个基因序列数据,但有些很短,几百个字符,但有些太大了,它的 BSON 大小已经超过了 MongoDB 的每个文档大小限制 16M,一个序列最多约 10,000,000 个字符。所以,我正在考虑使用 GridFS 将这些序列存储为文件。所以,我陷入了困境:

解决方案1:使用GridFS将所有基因序列存储为文件,无论它们大小。

解决方案2:使用GridFS仅将非常大的基因序列存储为文件,将小尺寸的基因序列存储为普通文档。但这就引出了另一个问题,查询不再简单,因为基因序列是以两种不同的方式存储的,每次查询,我都要同时查询。

我是 MongoDB 的新手,所以,我的许多想法看起来很荒谬。但我真的需要你的帮助。

4

0 回答 0