0

我想开始为大数据开发一个推荐系统,比如每天 2GB 的日志数据。为此,在 Rhadoop 和 Apache Mahout 之间,首选哪一个?

请从不同方面回答这个问题,例如代码的可用性,速度等。

4

1 回答 1

1

如果您了解 R 并且您的数据不是那么大,请尝试使用 SparkR,但大多数海量 R 包集合并不能很好地与 Spark 分布式数据集成。

如果您有大数据并且可以使用类似 R 的 Scala API,那么 Mahout 会更好。您可以对样本数据进行数学运算,并且相同的代码将自动扩展到生产规模。

于 2016-05-30T19:02:28.837 回答