我想构建一个跨越多节点
计算机网络(Linux PC 的内部子网)的 B+树,用于
弹性海量存储。范围扫描很重要。
这基本上是
分布式数据库系统的底层数据结构吗?(卡桑德拉,HBase)
有没有关于分布式 B+Trees 的研究?我在http://www.cs.yale.edu/homes/aspnes/papers/opodis2005-b-trees-final.pdf
看到了这篇文章,
但是跳过 BTrees 只是取出有故障的节点(所以会有数据丢失)
我对具有内置冗余的 B+Trees 特别感兴趣
(即,如果主机发生故障并且它托管的所有节点都处于脱机状态,
我希望另一台复制的主机成为主节点
服务器并取代故障主机)
我不想使用一组数据库实例(1 个节点,一个数据库),因为分片
对于大规模存储系统(跨商品
x86、x64 硬件和 FOSS OS)
来说不是一个好的选择。
我在重新发明轮子吗?
我应该只使用 Cassandra 还是 HBase?