2

这是我的第一个问题,我希望它不会被误导/在错误的地方。

假设我有一个完全填充的数据矩阵,除了一个值。例如,第 1 列是身高,第 2 列是体重,第 3 列是卧推。所以我调查了 20 个人,得到了他们的身高、体重和卧推重量。现在我有一个 5'11 体重 170 磅的人,想预测他/她的卧推重量。您可以将其视为具有缺失值的矩阵,或者您可以将其视为想要在给定自变量向量的情况下预测因变量。这类问题有曲线拟合方法,但我想知道如何使用奇异值分解来回答这个问题。

我知道奇异值分解是一种预测缺失值的方法,但实际上我发现的所有信息都与巨大的、高度稀疏的矩阵有关,涉及Netflix 奖和相关问题。我无法弄清楚如何使用 SVD 或类似方法从一个中小型完全填充(一个缺失值除外)矩阵中预测缺失值。

使用 SVD 解决上述示例的分步算法对我非常有帮助。谢谢!

4

1 回答 1

0

我计划将此作为评论,但它太长了一点,所以我已将其作为答案提交。

我对 SVD 的阅读表明它不太适用于您的示例。特别是,您似乎需要以某种方式为矩阵的卧推列分配一些难度排名,或者个人的一些能力排名。也许两者兼而有之。由于他可以卧推的量仅取决于他自己的身高和体重,我认为 SVD 不会提供任何优化,而不仅仅是计算列表中其他人已经完成的统计平均值并使用它来预测你 5 的结果'11 170 磅升降机。也许如果有 BMI(体重指数)列,如果可以对 BMI 进行排名……可能还有更大的数据集。我认为问题在于矩阵中没有噪声可以通过使用 SVD 来减少。这是一个似乎使用类似问题的 tut:http://www.puffinwarellc.com/index.php/news-and-articles/articles/30-singular-value-decomposition-tutorial.html

于 2013-06-30T21:21:22.730 回答