使用WordDelimiterFilter
withgenerateNumberParts
我可以获取像“123-456”这样的字符串并将其编入索引,以便匹配“123”的查询。
我还想做的是将前导零视为另一个生成部分的过渡。换句话说,“000123”应该生成“123”作为令牌以及“000123”,就好像我从“000-123”开始一样。
我可以用 去除前导零PatternReplaceFilter
,但我真正想做的是在前导零之后拆分字符串,而不仅仅是扔掉它们。
有什么好方法可以做到这一点?
如果过滤器实际上导致修改,那么破解 PatternReplaceFilter 来索引原始令牌会更容易吗?或者破解 WordDelimiterFilter 以确认前导零?