我们正在尝试将短语组合在一起以提高结果。
例如,如果用户提出“我什么时候必须更换空调过滤器?”之类的问题。对于特定领域的短语,例如“空调”,R&R 返回一些包含术语“空气”但没有“空调”的答案,或者它返回包含其他术语(如气囊或空气过滤器)的答案。
这可以使用原始 Solr 实例并在引号之间设置短语来完成。因此,Solr 查询将如下所示:
...
"debug": {
"rawquerystring": "When do I have to change the filter of my \"air conditioning\" ?",
"querystring": "When do I have to change the filter of my \"air conditioning\" ?",
"parsedquery": "text:when text:do text:i text:have text:to text:change text:the text:filter text:of text:my PhraseQuery(text:\"air conditioning\") text:?",
"parsedquery_toString": "text:when text:do text:i text:have text:to text:change text:the text:filter text:of text:my text:\"air conditioning\" text:?",
...
但是,R&R 指南指出:
该语法与标准 Solr 语法不同,如下所示:
您可以搜索单个术语或短语。您不需要像 Solr 那样用双引号将短语括起来,但您可以在查询中包含短语,并且它们由排名模型考虑。
我们找不到有关上述声明的更多细节。
但是,据我们了解,排名器应该识别短语。如果是这样的话,我们想知道是否有一种方法可以设置短语字典来调整排名?或者,我们可以设置自己的法律短语模型吗?实现这一目标有哪些选择?
谢谢