1

什么样的算法可以对逻辑社区(技术、娱乐等)中的博客进行聚类和排名?

对博客文章进行聚类和排名的算法会更好。

接受的答案是算法、伪代码、java 代码或特定算法解释的链接。

更新: 所以,我似乎想要基于文本特征的部分聚类类别中的一些东西。

4

1 回答 1

1

首先,您必须通过定义 a 来更好地定义您的问题:

  1. 每个博客的特征向量(描述符)
  2. 用于评估描述符之间“距离”的度量。

完成此操作后,您就有大量的聚类算法可供选择,例如kmeans等。

于 2009-10-06T15:32:01.127 回答