我正在更详细地探索 Mahout in Action 中的一些代码示例。我已经建立了一个小测试来计算应用于我的数据的各种算法的 RMS。
当然,多个参数会影响 RMS,但我不理解运行评估时生成的“无法在...情况下推荐”消息。
查看 StatsCallable.java,这是在评估程序遇到 NaN 响应时生成的;训练集中的数据或用户偏好可能没有足够的数据来提供推荐。
似乎 RMS 分数不受大量“无法推荐”案例的影响。这个假设正确吗?我是否应该不仅在 RMS 上评估我的算法,还要评估“无法推荐”案例与我的整体训练集的比率?
我会很感激任何反馈。