我想实现文本搜索引擎。特别是要索引的文档将是具有权重的术语列表。
查询是一个简单的术语列表。
搜索的输出应该是按相关性匹配(针对术语及其权重)排序的列表
我需要存储的数据很大!它不适合单个节点。所以最终的存储必须易于分发。
您会推荐哪种数据库存储?经过一些分析,我想在 Couchbase 和 Riak 之间进行选择。
[编辑] 您如何看待简单的关系数据库?他们已经有了一些不错的分发机制(例如:内置 Postgres 9)[/edit]
Riak 具有内置搜索功能,但据我所知,我不想使用它,因为我需要索引才能获得响应(而不是为每个查询计算它)。
另一方面,Couchbase 2“为 JSON 文档添加了二级索引。索引是通过视图创建的,然后可以查询。索引是均匀分布的。 ”
这听起来对 Couchbase 来说是一个很大的好处