所以,我有一个 Solr 实例,它使用StandardTokenizer
(以及ClassicFilterfactory
,LowercaseFilterFactory
和Stopfilterfactory
)处理输入和查询。
在我的索引中,有许多带有下划线分隔名称的文件(例如。some_indexed_file.jpg
)。
我注意到,如果我查询some_indexed_file.jpg
,我会正确返回要查找的文件。
但是,如果我另外搜索some_indexed_file.jp*
, (带有星号,我假设它充当通配符),据我了解应该会产生类似的结果,但我没有得到任何结果。
知道发生了什么:我认为我对 solr 处理查询的方式有误解?
编辑:根据要求,这里是架构 XML 配置条目:
<fieldType name="default" class="solr.TextField">
<analyzer type="index">
<tokenizer class="solr.StandardTokenizerFactory" />
<filter class="solr.ClassicFilterFactory" />
<filter class="solr.LowerCaseFilterFactory" />
<filter class="solr.StopFilterFactory" />
</analyzer>
<analyzer type="query">
<tokenizer class="solr.StandardTokenizerFactory" />
<filter class="solr.ClassicFilterFactory" />
<filter class="solr.LowerCaseFilterFactory" />
<filter class="solr.StopFilterFactory" />
</analyzer>
</fieldType>
<field name="filename" type="default" multiValued="true" omitNorms="false" termVectors="false"/>