我们正在使用 Postgres 及其全文功能在我们的系统中搜索文档(帖子内容),并且效果非常好。
对于自动完成,我们希望使用文档中使用的所有单词建立索引(字典?)并按最常用的单词进行搜索。我们将始终搜索一个词。我们永远不会搜索短语。
所以如果我写:
- “第”
我将收到(假设我们文档中出现频率最高的单词):
- “这个”
- “那里”
- “想法”
- ...
如何用 Postgres 做到这一点?或者也许我们需要一些更高级的解决方案,比如 apache lucene / solr ?
postgres 全文搜索(提供词法)和 postgres trigrams 似乎都不适合这项工作。或者也许我错了?
我不想手动解析文本并忽略所有容易出错的英文停用词。Postgres 在构建词法索引时做得很好。但是除了词法,我们需要在没有规范化的情况下构建和搜索词词典
谢谢您的帮助