1

我对来自 audioscrobbler 的示例数据集没意见,该数据集共有 75K 用户和 50K 项。但是我的太小了,因为我在路的起点。所以很高兴知道 Myrrix 中使用的最小数据集是什么。问这个的原因是一个警告:

信息:聚合 2013 年 8 月 14 日晚上 10:15:41 net.myrrix.online.generation.DelegateGenerationManager$RefreshCallable runFactorization 信息:分解完成 2013 年 8 月 14 日晚上 10:15:41 net.myrrix.online.generation.Generation recomputeSolver 警告: X'*X 或 Y'*Y 有小的 inf 范数 (0.9254986853162671); 尝试减少 model.als.lambda 2013 年 8 月 14 日晚上 10:15:41 net.myrrix.online.generation.DelegateGenerationManager$RefreshCallable 调用警告:尚无法计算有效代;等待更多数据

感谢所有可以提供帮助的人

4

1 回答 1

1

我只能摄取包含 10 行关联的文件。顺便说一句,Myrrix 现在正在迁移到 Oryx,您可以在https://groups.google.com/a/cloudera.org/forum/#!forum/oryx-user上询问 Sean Owen

于 2014-04-28T10:07:30.430 回答