我使用text_general
Solr 提供的配置字段来存储网页内容,如下所示:
<fieldType name="text_general" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>
场地:
<field name="content" type="text_general" stored="true" indexed="true"/>
说,在synonyms.txt
我有一个条目:
ABC=>Apple Ball Company
content
如果我在我的数据上执行搜索,q=content:ABC
其中我没有任何内容与“ Apple Ball Company
”一起。
我得到了所有单词的突出显示片段Apple
,Ball
并且Company
在我content
包含的这些单词中,这些单词的顺序不同,甚至没有一起出现。
我只想突出显示首字母缩写词ABC
和/或仅用于扩展“ Apple Ball Company
”(如果这些词以相同的顺序组合在一起)。