0

我正在尝试为类似于 的评级数据集实现这一点Netflix,并且我已经让它“工作”;0每次迭代/添加更多特征后,训练误差会被驱动。

我如何确定这将如何预测测试数据集(具有少量未用于训练的评级的用户)?Funk 掩盖了那部分,这真的让我很困惑。

我从以下矩阵开始:

  1. 用户特征矩阵(用户 x Num_Features)
  2. 电影特征矩阵(电影 x Num_Features)
  3. 评分矩阵(电影 x 用户)

我更新前两个矩阵的唯一方法是在算法中通过迭代更新它们。我认为我无法训练这些矩阵,然后再引入一个全新的用户并估计他的特征矩阵是什么样的。

我现在尝试的是从 中删除 20% 的评级Rating Matrix,将它们移动到测试矩阵中,并用 0 填充两个中的所有空单元格(在成本函数中被忽略)。它不工作。

4

1 回答 1

0

你是什​​么意思

它不工作。

通常计算探针组上的 RMSE。随机初始化每个用户的功能,您可以获得每个用户的一些“预测”值。

使用水晶球来解释“它不起作用”。意味着我会说:您不能从探针集的学习集中随机排除 20% 的评级。要为用户做出预测,您至少需要用户的一个评分才能获得这些功能。所以你是对的:

然后介绍一个全新的用户

不可能。也许您将一个用户的所有评分都放入了探测集,因此 Simon Funk 的 SVD 没有更新用户特征。

于 2013-07-13T14:03:02.767 回答