0

我想使用 java 使用大型数据集执行多重关联。我找不到任何提供此功能的库。我能找到的最接近的是 [ https://commons.apache.org/proper/commons-math/apidocs/org/apache/commons/math3/stat/correlation/SpearmansCorrelation.html][1]但这只是偏相关不是多重的。我想我可以使用 R 来做到这一点,但我的数据集非常大(万亿),我想从使用 Java 的性能(线程、多核等)中受益。是否有一个库可以进行任何人都知道的多重关联?如果库可以执行逐步多元回归,那也很棒。

4

1 回答 1

0

您最好的选择可能是 Apache Mahout——它在 Hadoop 之上提供了一组可扩展的算法。

https://mahout.apache.org/

于 2014-06-24T12:41:33.817 回答