1

我在使用 solr 通配符搜索和停用词时遇到问题。我在 stopwords.txt 中添加了几个停用词“to”、“for”、“is”。当我不进行通配符搜索时,它工作得很好。
查询 -->q=learningObjectTopic:to&rows=1

<response>
<lst name="responseHeader">
<int name="status">0</int>
<int name="QTime">3</int>
<lst name="params">
<str name="q">learningObjectTopic:to</str>
<str name="rows">1</str>
</lst>
</lst>
<result name="response" numFound="0" start="0"/>
</response>

当我进行通配符搜索时,它返回的数据。
查询 -->q=learningObjectTopic:*to*&rows=1

<response>
<lst name="responseHeader">
<int name="status">0</int>
<int name="QTime">5</int>
<lst name="params">
<str name="q">learningObjectTopic:*to*</str>
<str name="rows">1</str>
</lst>
</lst>
<result name="response" numFound="75" start="0">
<doc>
<str name="id">56f4bc54b2de79277297dcab</str>
<str name="learningObjectId">LO1_SK1_18</str>
<str name="learningObjectTopic">Introduction to Web Development</str>
<str name="category">learningObject</str>
<long name="_version_">1537824533459763200</long>
</doc>
</result>
</response>

这是我的分析仪

<fieldType name="text_general" class="solr.TextField" multiValued="false" positionIncrementGap="100">
    <analyzer type="index">
        <tokenizer class="solr.WhitespaceTokenizerFactory"/>
        <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
        <filter class="solr.LowerCaseFilterFactory"/>
 </analyzer>

我需要的是,“to”也不应该在通配符查询中匹配。我在这里想念什么?

注意: learningObjectTopic:当我在停用词中添加“to”时搜索结果中跳过的“to”字,因此停用词索引正在工作。

4

1 回答 1

0

Solr StopFilterFactory 不是一个多术语感知组件,因此 stopFilterFactory 不适用于通配符查询。参考链接

而且,这个场景可能不是一个有效的场景。因为,如果索引中有关键字“Tokyo”,那么搜索关键字“to*”应该返回这个结果,而不是显示不正确的“0”结果。

于 2017-10-04T06:37:10.890 回答