我正在尝试在一个非常大的矩阵上进行一些(k-means)聚类。
该矩阵大约有 500000 行 x 4000 列,但非常稀疏(每行只有几个“1”值)。我想获得大约 2000 个集群。
我有两个问题: - 有人可以推荐一个开源平台或工具来做到这一点(也许使用 k-means,也许有更好的东西)?- 我怎样才能最好地估计算法需要完成的时间?我尝试过一次 weka,但几天后就放弃了这项工作,因为我不知道需要多少时间。
谢谢!
我正在尝试在一个非常大的矩阵上进行一些(k-means)聚类。
该矩阵大约有 500000 行 x 4000 列,但非常稀疏(每行只有几个“1”值)。我想获得大约 2000 个集群。
我有两个问题: - 有人可以推荐一个开源平台或工具来做到这一点(也许使用 k-means,也许有更好的东西)?- 我怎样才能最好地估计算法需要完成的时间?我尝试过一次 weka,但几天后就放弃了这项工作,因为我不知道需要多少时间。
谢谢!