machine-learning - 如何使用 apache spark MLlib 实现 Mini Batch Kmeans？

翻译自：https://stackoverflow.com/questions/43734957 2017-05-02T09:55:50.817

457 次

0

我已经使用 spark 实现了 Kmeans。但是由于我的数据量很大并且功能数量很大，我想使用 Apache spark MLlib 实现小批量 kmeans。有没有关于如何实现它的示例或文档？

1 回答 1

0

下面的论文不涉及 apache spark MLlib，但它确实介绍了 minibatch kmeans：

斯卡利，大卫。“网络规模的 K 均值聚类。” 在第 19 届万维网国际会议论文集上，1177-1178。ACM，2010。http ://dl.acm.org/citation.cfm? id=1772862

于 2017-08-17T05:30:39.537 回答