我有一个案例,我想像这样匹配:
查询:abcd efgh ijkl mnop
在此之后,查询受到 NGram 标记器的影响,每个单词被分成 2 个 gram 标记。
例如)查询被分成,
ab,bc,cd,ef,fg,gh,ij,jk,kl,mn,no,op
现在,在匹配时,我希望为单词中的标记定制最小匹配。
我的意思是,默认情况下,当与一个单词对应的任何一个标记与索引文档匹配时,mm=1,则返回该索引文档。如果我给 mm=2,那么任何 2 个单词中的任何一个标记都需要匹配要返回的索引文档。
但我想要的是:仅当任何 'm' 标记每个匹配 mm=num 个单词时才返回文档。
例如)我希望从至少 3 个单词中选择至少 2 个标记,以便选择索引文档。
似乎 Lucene 的 IndexSearcher 做了这个核心部分。我是否需要更改代码或任何其他可以执行上述操作的配置?
提前致谢...