我正在尝试为类似于 的评级数据集实现这一点Netflix
,并且我已经让它“工作”;0
每次迭代/添加更多特征后,训练误差会被驱动。
我如何确定这将如何预测测试数据集(具有少量未用于训练的评级的用户)?Funk 掩盖了那部分,这真的让我很困惑。
我从以下矩阵开始:
- 用户特征矩阵(用户 x Num_Features)
- 电影特征矩阵(电影 x Num_Features)
- 评分矩阵(电影 x 用户)
我更新前两个矩阵的唯一方法是在算法中通过迭代更新它们。我认为我无法训练这些矩阵,然后再引入一个全新的用户并估计他的特征矩阵是什么样的。
我现在尝试的是从 中删除 20% 的评级Rating Matrix
,将它们移动到测试矩阵中,并用 0 填充两个中的所有空单元格(在成本函数中被忽略)。它不工作。