我已经阅读了有关如何在索引/查询期间删除重音的各种主题。我想出的当前字段类型如下所示:
<fieldType name="text_general" class="solr.TextField">
<analyzer>
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.ASCIIFoldingFilterFactory"/>
<filter class="solr.LowerCaseFilterFactory" />
</analyzer>
</fieldType>
在向索引添加了一些测试信息后,我通过http://localhost:8080/solr/test_core/admin/luke?fl=title
生成了哪种令牌。例如,像“拜仁慕尼黑”这样的标题已被标记为:
<int name="bayern">1</int>
<int name="m">1</int>
<int name="nchen">1</int>
因此,它没有用它的 ascii 吊坠替换字符,而是被解释为分隔符?!有了这种索引结果,我既不能搜索“münchen”,也不能搜索 m?nchen。
知道如何解决吗?提前致谢。