4

我一直在玩 apache 的 cassandra 项目。完成了相当多的阅读,我已经完成了一些相当复杂的示例,包括插入单个和批处理数据集,基于键检索单个和多个数据集。我看过的一些文章包括

http://www.rackspacecloud.com/blog/2010/05/12/cassandra-by-example http://github.com/digg/lazyboy http://arin.me/blog/wtf-is-a-超柱卡桑德拉数据模型 http://www.sodeso.nl/?p=80

我已经很好地掌握了解释的概念,甚至实现了一个简单的应用程序。

没有一篇文章描述了如何执行查询,例如,查询是用户输入的搜索词。

有谁知道或可以建议我如何执行这样的查询?或者也许是一种创建可搜索索引、全文搜索或任何远程关闭的方法?

4

1 回答 1

3

您可能会将文本拆分为单词,然后将这些单词用作“索引”的键。每个单词都将包含时间戳有序列族,其中包含您的文章、消息等的 ID 列表。因此您只能对键(单词)执行简单搜索。当搜索多个单词时,对这些列族使用交集。

这是一种非常简单的方法,如果您需要更复杂的查询,请查看 Lucandra - http://github.com/tjake/Lucandra - Lucandra 是一个以 Cassandra 作为后端存储的全文搜索引擎。

于 2010-08-09T23:17:11.970 回答