我已经使用 spark 实现了 Kmeans。但是由于我的数据量很大并且功能数量很大,我想使用 Apache spark MLlib 实现小批量 kmeans。有没有关于如何实现它的示例或文档?
问问题
457 次
1 回答
0
下面的论文不涉及 apache spark MLlib,但它确实介绍了 minibatch kmeans:
斯卡利,大卫。“网络规模的 K 均值聚类。” 在第 19 届万维网国际会议论文集上,1177-1178。ACM,2010。http ://dl.acm.org/citation.cfm? id=1772862
于 2017-08-17T05:30:39.537 回答