我有 3 个数组,其中包含已从三个搜索引擎读取的文档列表。该数组包含重要信息,例如 url、标题和描述。
最终,我希望对数组中的文档进行排名,并使用Reciprocal Rank Fusion对它们进行聚合,从而根据每个数组中的排名对文档进行评分:
Document_Score = (1/(60+rank_google)) + (1/(60+rank_yahoo)) + (1/(60+rank_bing))
问题是:
我需要通过检查唯一标识文档的 url 来隔离每个文档。因此,关键信息包含在以下内容中:
googlearray[$i]['url'];
yahooarray[$i]['url'];
bingarray[$i]['url'];
问题:
任何人都可以提出一种简单的方法来隔离每个引擎中的特定文档(基于其url),以便我对每个文档执行聚合公式吗?(效率很好,但现在很简单)
欢迎任何线索或建议:)
谢谢。