我目前正在使用以下方法在 Hadoop 上运行 Mahout 的(0.8 版)矩阵分解推荐器
mahout Recommendationfactorized -i mahout_parallelALS_output/userRatings/ -o Recommendations/ --userFeatures mahout_parallelALS_output/U/ --itemFeatures mahout_parallelALS_output/M/
--numRecommendations 10
这需要很长时间才能完成地图阶段(超过 4 小时,但到目前为止只完成了 3% 的地图工作。)在我看来,这很不寻常。有人可以告诉我我做错了还是以某种方式优化了性能?