2

我在 Solr 中得到了意想不到的结果,希望有人能提供帮助。我的 schema.xml 对我正在搜索的字段(索引和查询)具有 splitOnCaseChange="1",并且默认搜索行为是“OR”。

我有一个索引“航空公司”一词的字段。当我搜索“航空公司”时,我得到了匹配。当我搜索“航空公司别名”时,我得到了匹配(正如预期的那样,因为它是 OR)。但是,当我搜索“AirlineAlias”时,我找不到匹配项。我期待 splitOnCaseChange 属性将 AirlineAlias 查询分离为 2 个基本词。但是,如果发生这种情况,那么它应该找到与“Airline”的匹配项(即,它应该是与“Airline Alias”完全相同的查询)。

我的理解正确吗?如果是这样,关于为什么我不会得到正确的搜索结果的任何想法?

我已经从下面的 schema.xml 文件中复制了相关部分。

在此先感谢您的帮助。

<fieldType name="text_en_splitting" class="solr.TextField" positionIncrementGap="100" autoGeneratePhraseQueries="true">
    <analyzer type="index">
            <tokenizer class="solr.WhitespaceTokenizerFactory" />
            <filter class="solr.StopFilterFactory" 
                    ignoreCase="true" 
                    words="lang/stopwords_en.txt" 
                    enablePositionIncrements="true" />
            <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1" />
            <filter class="solr.LowerCaseFilterFactory" />
            <filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt" />
            <filter class="solr.PorterStemFilterFactory" />
    </analyzer>
            <analyzer type="query">
            <tokenizer class="solr.WhitespaceTokenizerFactory" />
            <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true" />
            <filter class="solr.StopFilterFactory" 
                            ignoreCase="true" 
                            words="lang/stopwords_en.txt" 
                            enablePositionIncrements="true" />
            <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="0" catenateNumbers="0" catenateAll="0" splitOnCaseChange="1" />
            <filter class="solr.LowerCaseFilterFactory" />
            <filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt" />
            <filter class="solr.PorterStemFilterFactory" />
    </analyzer>
</fieldType>

<fields>

<field name="value" type="text_en_splitting" indexed="true" stored="true" multiValued="true" omitNorms="true" />
/fields> 

<solrQueryParser defaultOperator="OR" />
4

1 回答 1

2

在 Solr 邮件列表上从 Jack Krupansky 那里得到了答案,所以在这里更新以供未来的搜索者使用……

只需在 ="text_en_splitting" 字段类型上设置 autoGeneratePhraseQueries="false"。当前设置将 AirlineAlias 视为引用的短语“Airline Alias”。

于 2012-08-20T22:38:45.943 回答