我想在我的 solr 突出显示功能中使用 Regexp Fragmenter 来自定义我的片段。
根据要求,我们需要在突出显示术语之前和之后返回 25 个单词。
下面是一个示例高亮片段。
Some polls show a major gender gap between men and women when it comes to gun control. A Washington Post/ABC News poll in January showed that <span class="highclass">women</span> supported a semi-automatic gun ban by 20 more points than men. They favored a ban on high-capacity magazines by 15 points.
为此,我制作了下面的正则表达式
((?:\w+\W*){25})\b(span class)\b((?:\W*\w+){25})
这个正则表达式可以很好地处理简单的字符串。(tested) ,但是在将它与 solr 一起使用时,它似乎无法正常工作。
很少有亮点很好,但是对于很少的亮点,亮点术语出现在突出显示片段的开头。
我不确定,那个正则表达式碎片器可以做什么,我需要什么。还有其他方法可以满足这个要求吗?
有人可以建议我吗?