Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我想开始为大数据开发一个推荐系统,比如每天 2GB 的日志数据。为此,在 Rhadoop 和 Apache Mahout 之间,首选哪一个?
请从不同方面回答这个问题,例如代码的可用性,速度等。
如果您了解 R 并且您的数据不是那么大,请尝试使用 SparkR,但大多数海量 R 包集合并不能很好地与 Spark 分布式数据集成。
如果您有大数据并且可以使用类似 R 的 Scala API,那么 Mahout 会更好。您可以对样本数据进行数学运算,并且相同的代码将自动扩展到生产规模。