2

我试图从这个 Kaggle 中模仿 PySpark ALS 代码 https://www.kaggle.com/vikashrajluhaniwal/matrix-factorization-recommendation-using-pyspark

我注意到当您使用代码时

model.recommendForAllUsers(3).show()

输出仅包含编号。训练集中的用户数(58971 个用户)。

我想知道您如何获得测试集(其他44819个用户)的推荐??我已经尝试搜索其他教程,但我仍然不知道如何获得完整数据集的预测。

还是我只是使用最佳模型的参数,然后再次训练整个数据集而不进行拆分?

非常感谢您的回答。

4

0 回答 0