0

我在不同时间创建了许多文档。我想暂时对这些文档进行聚类。

我想将文档聚集成具有相关时间戳的文档组。例如,如果在时间 X 创建的文档数量出现“峰值”,它们将被分组到同一个集群中,依此类推......

假设我们不知道可能有多少个集群。

4

1 回答 1

1

如果你不知道有多少个集群,增长 newral gas 是一个很好的算法开始。你可以在这里玩演示:http: //www.demogg.de/

在您的任务中,您需要一维案例。

您可以在此处找到其中一种实现:https ://github.com/BelBES/libGNG

于 2014-05-21T12:15:54.783 回答