postgresql - 通过最常用的单词自动完成 - postgres 还是 lucene？

翻译自：https://stackoverflow.com/questions/40823837 2016-11-26T22:36:04.297

292 次

6

我们正在使用 Postgres 及其全文功能在我们的系统中搜索文档（帖子内容），并且效果非常好。

对于自动完成，我们希望使用文档中使用的所有单词建立索引（字典？）并按最常用的单词进行搜索。我们将始终搜索一个词。我们永远不会搜索短语。

所以如果我写：

“第”

我将收到（假设我们文档中出现频率最高的单词）：

“这个”
“那里”
“想法”
...

如何用 Postgres 做到这一点？或者也许我们需要一些更高级的解决方案，比如 apache lucene / solr ？

postgres 全文搜索（提供词法）和 postgres trigrams 似乎都不适合这项工作。或者也许我错了？

我不想手动解析文本并忽略所有容易出错的英文停用词。Postgres 在构建词法索引时做得很好。但是除了词法，我们需要在没有规范化的情况下构建和搜索词词典

谢谢您的帮助

0 回答 0