我想推荐带有标签并分为三个价格类别(便宜、普通和昂贵)的商品。我知道使用 Mahout 推荐可以实现,但这就是我不知道如何使用它的原因。
Mahout 基于其他用户的意见,但我要推荐的所有新项目都只是尚未设置任何偏好的新项目。
Mahout 是解决此问题的正确工具吗?这是基于内容的吗?(哪个 mahout 还不支持????)还是我应该使用分类?
谢谢!
我想推荐带有标签并分为三个价格类别(便宜、普通和昂贵)的商品。我知道使用 Mahout 推荐可以实现,但这就是我不知道如何使用它的原因。
Mahout 基于其他用户的意见,但我要推荐的所有新项目都只是尚未设置任何偏好的新项目。
Mahout 是解决此问题的正确工具吗?这是基于内容的吗?(哪个 mahout 还不支持????)还是我应该使用分类?
谢谢!
因为我从来没有建立过任何推荐系统——不要太认真地对待这个答案(没有人回答过,所以我试试)
推荐系统必须建立在一些已知(或部分已知的数据)之上。如果您只有新的(未见过的)数据,则只能使用一些聚类算法来构建一些聚类。
如果这些集群没问题,它们可以用于训练一些推荐系统。
Mahout 只是一个实现各种 ML 方法的工具。您可以使用其他工具,例如 Weka、R、...
如果您根本没有关于新用户的数据,那么无论您做什么,都无法提出建议。零输入可以将这个人与其他任何人区分开来。
然而,好的系统应该能够在第一个输入可用后做一些合理的事情。
这本质上不是分类器问题,不是。它也不是一个聚类工具,尽管有其他答案。
价格类别不是您将使用的任何记录流程的核心。您大概还有其他数据,它是什么?这很重要。
最后是否使用 Mahout 取决于口味。如果你想使用 Java 和 Hadoop,你会使用它。反过来,如果您有非常大的输入,并且很少有人拥有这么多数据(例如至少超过 10M 的数据点),您只会考虑使用 Hadoop。
(嗯,不完全——我在 Mahout 中推荐的文章早于 Hadoop,适用于在线的小型应用程序。如果您使用 Java,您可能确实对此感兴趣。)