2

对于我的 SOLR 设置,我可以对其进行配置,以便当用户在数据库中搜索某些文章时,搜索引擎会对整个正文文本进行全文搜索。

但是,我也有对正文进行关键字提取的代码。是建议只让SOLR对文章的关键词进行全文检索,还是让SOLR只对文章正文进行全文提取更好?

我宁愿不要两者都做,一个或另一个会很好。我的内存有限,只能保留两个字段之一,关键字或文章正文。

推理和答案会很好,谢谢。

4

1 回答 1

0

是建议只让SOLR对一篇文章的关键词进行全文检索,还是让SOLR只对文章正文进行全文提取更好?

是的,SOLR 擅长全文索引。与其重新发明轮子(搜索算法、停用词过滤、提升等),不如让 SOLR 索引数据库中的内容。如果您需要忽略文章文本中的某些单词,您可以在 stopwords.txt 中配置停用词。

于 2013-12-03T15:07:35.457 回答