除了 Mahout 之外还有哪些其他框架用于在 JAVA 中实现机器学习算法,这样底层框架就可以获取 JAVA 代码并在 Hadoop 上运行它?
我正在寻找 Mahout 的替代品,因为我需要在 Hadoop 上实现 SVM 和聚合集群,并且 Mahout 仅支持 SVM。
除了 Mahout 之外还有哪些其他框架用于在 JAVA 中实现机器学习算法,这样底层框架就可以获取 JAVA 代码并在 Hadoop 上运行它?
我正在寻找 Mahout 的替代品,因为我需要在 Hadoop 上实现 SVM 和聚合集群,并且 Mahout 仅支持 SVM。
好吧,如果 SVM 是在 hadoop 上,剩下的就很容易实现了!
请注意,朴素的凝聚聚类算法对于大数据( O(n^2) 复杂度)效率不高。这种复杂性使得算法无法在大型数据集上运行,即使在大型集群上也是如此,除非您尝试以下扩展之一:ftp://193.167.42.127/franti/papers/GraphPnn-TPAMI.pdf
图案。它有一个 Java API,你也可以使用 R。
我向你们推荐基于 Apache Hadoop 的机器学习/数据挖掘库,例如 Apache Mahout。
http://www.openankus.org/pages/viewpage.action?pageId=2195722
mapreduce 作业处理就是这么简单容易。你有兴趣吗?查看更多维基 ( http://www.openankus.org )
快速谷歌搜索给出了以下内容
http://java-ml.sourceforge.net/ - 将近 3 年后,发布了。不确定它的支持程度以及实现了哪些算法。
http://sourceforge.net/projects/weka/ - 其他人最近提出的一些建议看起来不错。
另外,请参阅此线程。
两个都没试过。