我对 Mahout 中偏好值的含义有疑问。从 Mahout in Action 一书中,它说:
偏好值可以是任何值,只要更大的值意味着更强的积极偏好。例如,这些值可能是 1 到 5 的评分,其中 1 表示用户无法忍受的项目,而 5 表示最喜欢的项目。
这是否意味着推荐者总是将较小的值解释为负面偏好(不喜欢)?
我正在尝试创建一个没有负面偏好的推荐器。我的意思是我根本没有偏好,但我可以根据不同的加权指标(点击/编辑次数、编辑量、编辑方式等)推导出它们。但是,在我的实现中,当用户编辑了某个页面时,这并不意味着用户不喜欢该页面,而是在一定程度上喜欢它(并且喜欢的强度是如上所述的)。
我曾尝试仅使用布尔偏好(对数似然和谷本相似度),但它们表现不佳,并且在大多数情况下,它们无法产生推荐(超过 50%)。
我想利用数字来获得偏好,因此推荐会更好,但我不确定如何。我尝试过从 5 到 10 的偏好值,然后每个用户对人造物品的偏好值为 1(意思是不喜欢它)。但是我认为这不是一个好方法,因为这意味着每个用户都不喜欢同一个项目。
有人对我如何应用一些仅具有“积极”(喜欢)偏好值的基于用户和基于项目的算法有更好的了解吗?