我正在考虑编写一个应用程序来根据家庭成员的喜好对 HTPC 中的电影进行分类。
我不知道统计或人工智能,但这里的东西看起来很有趣。我不知道从哪里开始做。
这是我想要完成的事情:
根据每个用户的喜好组成一组样本,分别对每个样本属性进行评分。例如,也许一个用户非常喜欢西方电影,所以西方类型对该用户来说会带来更多的权重(对于其他属性,如演员、导演等)。
用户可以根据其他用户的喜好获得建议。例如,如果用户 A 和 B 都喜欢 Spielberg(用户之间的联系),并且用户 B 喜欢 Batman Begins,但用户 A 讨厌 Katie Holmes,则相应地为用户 A 权衡电影(同样,每个属性单独,例如,也许用户 A 不太喜欢动作片,所以稍微降低评分,因为凯蒂·霍姆斯不是主要明星,所以不要像其他属性一样考虑这一点)。
基本上,将用户 A 的集合与用户 B 的集合进行比较,然后得出用户 A 的评分。
我对如何实现这个有一个粗略的想法,但我敢肯定一些聪明的人已经想到了一个更好的解决方案,所以......有什么建议吗?
实际上,经过快速研究,贝叶斯过滤器似乎可以工作。如果是这样,这会是更好的方法吗?会不会像“规范化”电影数据、为每个用户训练分类器、然后对每部电影进行分类一样简单?
如果您的建议包括一些令人费解的概念(我在这些主题方面没有经验,特别是在 AI 方面),如果您还包括一些基础知识列表供我在深入研究肉类之前进行研究,我将不胜感激。
谢谢!