我想在java MYSELF中实现一个网站单词搜索(用户搜索一个单词并从特定网站获取包含该单词的句子)(不使用lucandra,solr,nutch,......我的意思是),直到现在我可以在jsoup的帮助下获取网站的内容(文本,不是源代码),但我不知道如何索引数据库中的数据,我搜索了google以了解solr等知名索引器使用的算法,我已经了解了一些东西,例如使用倒排列表或哈希表,......但它们很一般,我想知道我该怎么做?
我想使用 cassandra 作为我的数据库,所以我阅读了有关 cassandra 二级索引的内容,但我必须对此了解更多,这真的是我应该关注的吗?