我想创建自己的简单推荐系统,关于书籍。但是有一些问题——一个人不可能(至少,非常困难)组织算法的训练数据集。
那么,有没有关于人们投票、哪些书以及他们喜欢多少信息的免费数据集或测验?
第二个问题是关于书的参数。对于某些基于项目的预测,确实必须使用书籍的评分(例如语言、平均单词长度、段落中的平均单词数,我已经计算了大约 30 个这样的参数)及其权重(例如,书籍的语言被评分1 分,平均单词长度为 0.314)。那么,是否有任何准备好的信息?
事实上,如果我得到第一个问题的答案,我可以找到第二个问题的解决方案,但我确信,需要的信息是存在的。
另外,我正在阅读推荐系统手册,它提供了完整的信息(附有参考资料),但很难阅读。在这种情况下,你能建议一些额外的书吗?