我正在尝试使用 R 进行分布式文本挖掘。第一步是让 Hive 在本地机器上使用 R。
所以我执行了以下步骤:
- 在本地机器上安装 Hadoop
- 在本地机器上启动 R。并安装了 rJava 和 Hive
我遇到的主要问题是 R 的 rJava 和 Hive 使用的 Java 库与 Hadoop 使用的不同。
rJava uses java-6-openjdk
hadoop uses java-6-sun
你遇到过这个问题吗?有什么线索吗?
你为什么不使用Rhipe?它是一个更好的选择...查看此http://groups.google.com/group/brumail/browse_thread/thread/e403db404f039e31#在这里我使用了 Rhipe 0.63,但在最新版本 0.66 中,同时运行您需要的工作在 rhoptions 函数中指定库 imperious.so 的位置。