0

我想知道 Retrieve & Rank 服务,尤其是在排名期间,是否允许按邻近搜索

例子 :

Ranker learned : 

a. Query = "I have a problem with my mailbox"

b. Documents with pertinence score : "Doc1":3, "Doc2":4", "Doc3":1

所以我们可以想象,当我只使用 Retrieve 服务时,查询的结果是:

1. Doc1 
2. Doc2
3. Doc3

当我使用 Ranker 重新排序之前的结果时,我们有:

1. Doc2 
2. Doc1
3. Doc3

这一刻,一切正常。

现在我想使用 Ranker 执行一个新的(和类似的)查询:“我的邮箱遇到问题”

问题是 :

  1. Ranker 是否会将我的新查询与其之前学习的查询相匹配?所以结果将是:

     1. Doc2 
     2. Doc1
     3. Doc3
    
  2. 或者 Ranker不会将我的新查询与它之前学习的查询匹配,因此结果将是 Retrieve 服务执行的结果:

     1. Doc1
     2. Doc2
     3. Doc3
    

该文档 https://www.ibm.com/watson/developercloud/doc/retrieve-rank/plugin_query_syntax.shtml,尤其是此文本,让我认为 Ranker 将不匹配查询:

The following modifiers are not supported with the /fcselect request handler:
 - [...]
 - Search by proximity
 - [...]

但是当我尝试这个例子时,Ranker 似乎与查询匹配......

谢谢你的时间。

4

1 回答 1

0

因此,排名器不能通过记住您的训练问题或将新问题映射到训练数据集中最接近的问题来工作。事实上,排序器根本不直接处理问题。

相反,根据 RnR 文档中的概述材料,排名器使用一种称为“学习排名”的方法(查看维基百科条目可能会有所帮助:https ://en.wikipedia.org /wiki/Learning_to_rank)。

从本质上讲,learning-to-rank 方法是首先生成一组特征,这些特征捕获从初始检索阶段返回的每个候选文档与查询的匹配程度的概念。有关功能的更多信息,请参阅此帖子:watson 检索和排名 - 手动排名

然后,基于训练数据,排序器将学习如何关注这些特征,以便最好地重新排列候选文档集,从而优化相关性。这种方法允许它泛化到未来出现的不同问题(这些可能有相同的主题,也可能没有)。

于 2017-05-05T21:44:46.717 回答