我一直在使用 elasticsearch-analysis-kuromoji 进行日语搜索,但我遇到了两个非常奇怪的行为,第一个是我搜索的字符不起作用,比如 - '输出贸易' 将不起作用,除非我将其传递为“输出出贸易易”,每个字符之间有空格。像 ント 这样的字符也不会被搜索。
这是我的配置:
.setSettings(ImmutableSettings.settingsBuilder().loadFromSource(jsonBuilder()
.startObject()
.startObject("analysis")
//
.startObject("tokenizer")
.startObject("kuromoji_user_dict")
.field("type", "kuromoji_tokenizer")
.field("mode", "extended")
.field("discard_punctuation", "false")
.endObject()
.endObject()
//
.startObject("analyzer")
.startObject(JAPANESE_LANGUAGE_ANALYSIS)
.field("type", "custom")
.field("tokenizer", "kuromoji_user_dict")
.endObject()
.endObject()
//
.endObject()
.endObject().string()));
我是不是配置错了,还是我需要一个不同的标记器来表示字符,比如:'输出贸易和 ント'
谢谢你