我正在使用 Shingle Fitler 和 Suggester 来实现自动建议下拉菜单。我与 shingle 过滤器一起使用的字段有一个 worddelimiter,其 preserveoriginal=1 将“women's”标记为“women's”和“womens”。
正因为如此,当 shingle 过滤器生成单词 ngram 时,除了预期的标记外,还有一个 "women's womens" 标记。我想知道是否有任何方法可以配置 ShingleFilter 以便它忽略具有相同开始值和结束值的标记。