我一直在与 Mahout 合作,根据以下数据创建推荐引擎:
- 10 万用户
- 10k 项
- 400万收视率
我使用以下 JVM 参数在 Tomcat 上运行它:
-Xms1024M -Xmx1024M -da -dsa -XX:NewRatio=9 -server
推荐用了6s左右,好像很慢!我怎样才能提高 Mahout 的性能?
我正在使用以下代码:
这部分在启动时运行一次:
JDBCDataModel jdbcdatamodel = new MySQLJDBCDataModel(dataSource);
dataModel = new ReloadFromJDBCDataModel(jdbcdatamodel);
ItemSimilarity similarity = new CachingItemSimilarity(new EuclideanDistanceSimilarity(model), model);
SamplingCandidateItemsStrategy strategy = new SamplingCandidateItemsStrategy(10, 5);
recommender = new CachingRecommender(new GenericItemBasedRecommender(model, similarity, strategy, strategy));
而且,对于我所做的每个用户请求:
recommender.recommend(userId, howMany);