0

我已经使用 spark 实现了 Kmeans。但是由于我的数据量很大并且功能数量很大,我想使用 Apache spark MLlib 实现小批量 kmeans。有没有关于如何实现它的示例或文档?

4

1 回答 1

0

下面的论文不涉及 apache spark MLlib,但它确实介绍了 minibatch kmeans:

斯卡利,大卫。“网络规模的 K 均值聚类。” 在第 19 届万维网国际会议论文集上,1177-1178。ACM,2010。http ://dl.acm.org/citation.cfm? id=1772862

于 2017-08-17T05:30:39.537 回答