我正在努力弄清楚如何开始使用带有 MovieLens/Netflix 类型数据集的 SVD 进行评级预测。我非常感谢 python/java 中的任何简单示例,或所涉及过程的基本伪代码。有许多论文/帖子总结了整体概念,但我不确定如何开始实施它,即使使用了一些建议的库。
据我了解,我需要将我的初始数据集转换如下:
初始数据集:
user movie rating
1 43 3
1 57 2
2 219 4
需要转为:
user 1 2
movie 43 3 0
57 2 0
219 0 4
此时,我是否只需将该矩阵注入可用库提供的 SVD 算法中,然后(以某种方式)提取结果,还是需要我做更多的工作?
我读过的一些信息:
http://www.netflixprize.com/community/viewtopic.php?id=1043
http://sifter.org/~simon/journal/20061211.html
http://www.slideshare.net/NYCPredictiveAnalytics/building-a -recommendation-engine-an-example-of-a-product-recommendation-engine
http://www.slideshare.net/bmabey/svd-and-the-netflix-dataset-presentation
.. 和其他一些论文
一些库:
LingPipe(java)
Jama(java)
Pyrsvd(python)
任何提示都将不胜感激,尤其是在基本数据集上。非常感谢,奥利