0

我正在使用 Apache Solr 使用 DataImportHandler 进行索引。文档结构如下:

id(long)、title(text)、abstract(text)、pubDate(date)

我结合了文本搜索的标题和摘要文件。我的问题是当我查询“标题:实用程序”时,它给出的结果如下:

身份证、头衔

6、金融交易洞察能源与公用事业2008 年 12 月

11、经济低迷时期的住宅公用事业零售策略

16、Financial Deal Insights: Energy & Utilities Review of 2008

41、太阳能是公用事业公司战略的核心

我只想搜索“实用程序”,但它也给出了实用程序的结果......我也尝试了 title:"utility" 和 title:utility~1 但它不起作用。我读到了“词干”,但我不知道如何使用它……请帮助我……谢谢……

4

1 回答 1

3

这是您的文本分析中出现 PorterStemFilterFactory 的原因。

<filter class="solr.PorterStemFilterFactory"/>

Stemmer 会将单词简化为 root,因此实用程序也将匹配实用程序。

检查您是否需要 Stemmer 进行搜索,否则您可以将其从过滤器链中删除。
或者检查一个不那么激进的词干分析器来满足你的需求。

于 2012-07-13T07:22:26.033 回答