1

是否有任何现有的 R 集群包(kmeans,分层)利用 RHadoop 或 RHIPE 在分布式 hadoop 集群上运行?

谢谢

4

1 回答 1

1

RHadoop 项目包的RevolutionAnalytics / RHadoop实现通过 rhdfs、rhbase 和 rmr 连接 Hadoop 和 R。

我知道,与仅使用 R(使用 rmr 包,如幻灯片 14-15 所示)相比,以“标准”方式实现 K-means 聚类算法(使用 Python、Pig 和 Java,如幻灯片 8-10 所示):它需要更少的代码,并且可以用一种语言实现

在同一文档中,有一个K-means 在 Python、Java 和 R 中的比较实现,显示了使用 R 是多么容易。

如果你在你的 Hadoop 集群上运行这个包,你肯定可以在 Hadoop 上编写 K-means 集群。

如果 R 不是您的选择,那么 K-means 集群(使用 MapReduce 构建)可在 Hadoop 和 Mahout 上使用,因此您肯定可以在 Hadoop 集群上进行。

于 2012-06-01T23:49:06.900 回答