machine-learning - 如何确定 Simon Funk 的增量 SVD 方法的测试误差

Question

我正在尝试为类似于的评级数据集实现这一点Netflix，并且我已经让它“工作”；0每次迭代/添加更多特征后，训练误差会被驱动。

我如何确定这将如何预测测试数据集（具有少量未用于训练的评级的用户）？Funk 掩盖了那部分，这真的让我很困惑。

我从以下矩阵开始：

我更新前两个矩阵的唯一方法是在算法中通过迭代更新它们。我认为我无法训练这些矩阵，然后再引入一个全新的用户并估计他的特征矩阵是什么样的。

我现在尝试的是从中删除 20% 的评级Rating Matrix，将它们移动到测试矩阵中，并用 0 填充两个中的所有空单元格（在成本函数中被忽略）。它不工作。

score 0 · Accepted Answer

你是什么意思

它不工作。

通常计算探针组上的 RMSE。随机初始化每个用户的功能，您可以获得每个用户的一些“预测”值。

使用水晶球来解释“它不起作用”。意味着我会说：您不能从探针集的学习集中随机排除 20% 的评级。要为用户做出预测，您至少需要用户的一个评分才能获得这些功能。所以你是对的：

然后介绍一个全新的用户

不可能。也许您将一个用户的所有评分都放入了探测集，因此 Simon Funk 的 SVD 没有更新用户特征。

1 回答 1