我正在尝试使用 R 将 R 连接到 Hadoop 集群。该集群上安装了 HDFS、Map Reduce、Hive、Pig 和 Sqoop。
R 将在 Windows 环境中运行。我知道 Linux 存在 rhdfs、rhadoop 和 rmr,但我在 Windows 上找不到任何东西。
有人知道要使用的图书馆吗?
谢谢
Revolution Analytrics正试图在这个领域为自己出名。他们有几个不错的包(其中一些是开源的和/或免费用于非商业用途),允许您在 Windows 环境中从 R 流畅地与 Hadoop 交互。