1

我有一个查询的二分图和相关的点击网址。基于这些查询,我想对查询进行聚类。我打算使用简单的基于集合的公式来确定两个查询是否相同。我的初始输入数据格式如下:

Url   Queries   
Url1   Q1, Q2, Q3   
Url2   Q1, Q5, Q6   

我很难确定合适的算法来解决这个问题。

将不胜感激任何帮助。

4

0 回答 0