我对 cassandra 及其数据模型比较陌生。我有一大组数据,这些数据由染色体上的位置(染色体:开始-结束)描述,我们有 24 条染色体,开始和结束是整数。我想支持的查询是查找基因组中与一组其他位置重叠的所有位置。如果没有其他想法,我可以创建一个简单的基于 R-tree 的“索引”方案,但我认为有人可能遇到了这个问题并想出了一个解决方案。
问问题
691 次
我对 cassandra 及其数据模型比较陌生。我有一大组数据,这些数据由染色体上的位置(染色体:开始-结束)描述,我们有 24 条染色体,开始和结束是整数。我想支持的查询是查找基因组中与一组其他位置重叠的所有位置。如果没有其他想法,我可以创建一个简单的基于 R-tree 的“索引”方案,但我认为有人可能遇到了这个问题并想出了一个解决方案。