0

我正在使用Solr 6.0. 我想Highlighting使用Solr.

当我进行以下查询highlighting时,响应中的部分只有 ids(没有&hl.q=data:*ad*) -

http://<hostname>:<port>/solr/<core>/select?q=text:ad&fl=data&rows=10&hl=on&hl.fl=data&hl.preserveMulti=true&hl.mergeContiguous=true

输出 -

"highlighting": {
    "id1": {},
    "id2": {}
}

当我进行以下查询时,我会得到所需的输出(使用&hl.q=data:*ad*) -

http://<hostname>:<port>/solr/<core>/select?q=text:ad&fl=data&rows=10&hl=on&hl.q=data:*ad*&hl.fl=data&hl.preserveMulti=true&hl.mergeContiguous=true

输出 -

"highlighting": {
    "id1": {
        "data": ["<em>advertise</em>",
            "<em>add</em>"
        ]
    },
    "id2": {
        "data": ["<em>admin</em>",
            "<em>addon</em>"
        ]
    }
}

为什么我需要通过 hl.q?有没有办法避免它?

如果我想写一个自定义requestHandler (qt)solrconfig.xml那么我可以将 q 值作为前缀和后缀传递hl.q给.*hl.q=*$q*

我有以下 2 个字段 -

<field name="text" type="text_suggest" indexed="true" stored="false" multiValued="true"/>
<field name="data" type="lower" indexed="false" stored="true" multiValued="true"/> 

以下是字段的定义 -

<fieldType name="lower" class="solr.TextField" sortMissingLast="true" omitNorms="true">
    <analyzer>
         <tokenizer class="solr.KeywordTokenizerFactory"/>
         <filter class="solr.LowerCaseFilterFactory" />
    </analyzer>
</fieldType>
<fieldType name="text_suggest" class="solr.TextField" positionIncrementGap="100">
    <analyzer type="index">
         <tokenizer class="solr.KeywordTokenizerFactory"/>
         <filter class="solr.LowerCaseFilterFactory"/>
         <filter class="solr.EdgeNGramFilterFactory" minGramSize="1" maxGramSize="30"/>
         <filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
    </analyzer>
    <analyzer type="query">
         <tokenizer class="solr.KeywordTokenizerFactory"/>
         <filter class="solr.LowerCaseFilterFactory"/>
    </analyzer>
</fieldType>

以下是在 2 个字段中复制数据的方式 -

<copyField source="somefield" dest="text" maxChars="30"/>
<copyField source="somefield" dest="data"/>

编辑 1

当我添加&hl.alternateField=data到第一个查询时,多值字段中的所有值都会显示在该highlighting部分中,就像普通搜索一样。如下图——

"highlighting": {
    "id1": {
        "data": ["advertise",
            "not relevant",
            "add"
        ]
    },
    "id2": {
        "data": ["admin",
            "addon",
            "irrelevant"
        ]
    }
}
4

1 回答 1

1

将 EdgeNGram 过滤器添加到较低的类型,它将与第一个示例匹配。它不会匹配数据中的“广告”,因为它没有任何 NGram。

于 2016-05-30T10:41:03.357 回答