6

我们正在使用 Postgres 及其全文功能在我们的系统中搜索文档(帖子内容),并且效果非常好。

对于自动完成,我们希望使用文档中使用的所有单词建立索引(字典?)并按最常用的单词进行搜索。我们将始终搜索一个词。我们永远不会搜索短语。

所以如果我写:

  • “第”

我将收到(假设我们文档中出现频率最高的单词):

  • “这个”
  • “那里”
  • “想法”
  • ...

如何用 Postgres 做到这一点?或者也许我们需要一些更高级的解决方案,比如 apache lucene / solr ?

postgres 全文搜索(提供词法)和 postgres trigrams 似乎都不适合这项工作。或者也许我错了?

我不想手动解析文本并忽略所有容易出错的英文停用词。Postgres 在构建词法索引时做得很好。但是除了词法,我们需要在没有规范化的情况下构建和搜索词词典

谢谢您的帮助

4

0 回答 0