我有一个查询的二分图和相关的点击网址。基于这些查询,我想对查询进行聚类。我打算使用简单的基于集合的公式来确定两个查询是否相同。我的初始输入数据格式如下:
Url Queries
Url1 Q1, Q2, Q3
Url2 Q1, Q5, Q6
我很难确定合适的算法来解决这个问题。
将不胜感激任何帮助。
我有一个查询的二分图和相关的点击网址。基于这些查询,我想对查询进行聚类。我打算使用简单的基于集合的公式来确定两个查询是否相同。我的初始输入数据格式如下:
Url Queries
Url1 Q1, Q2, Q3
Url2 Q1, Q5, Q6
我很难确定合适的算法来解决这个问题。
将不胜感激任何帮助。