我已经看到了一些集成 R 和 hadoop 的选项,例如:RHadoop、RHipe、Hadoop Sreaming、RHive。
我在 R 中没有任何经验,但我在 Hadoop 中确实有很好的经验。我正在谈论的方法可能不可行或其他......
但是任何人都可以分享他们对这种方法的看法 -
我们可以使用 JRI 集成 R 和 Hadoop:因为可以从 Java 代码(使用 JRI)调用 R 函数。?我们可以这样做:用 Java 编写一个 hadoop mapreduce 程序,如果我们需要 R 中存在的一些功能,那么在 Java Mapreduce 程序中调用该 R-Function?