在分解推荐系统的评分矩阵时,评分矩阵可以写为 P* t(Q),其中 P 表示用户因子矩阵,Q 表示项目因子矩阵。Q的维度可以写成等级*项目数。我想知道 Q 矩阵中的值是否真的代表任何东西,例如物品的重量?还有,有没有办法找出 Q 矩阵中的一些隐藏模式?
问问题
162 次
1 回答
0
将特征视为多维数据中变化的重要方向。想象一个 3-d 图表,绘制用户购买了 3 件商品中的哪一件。这将是一个无定形的斑点,但斑点的实际轴或方向可能不沿着 x、y、z 轴。它所沿的向量是向量形式的特征。将其用于大维数据(许多用户,许多项目),并且这些高维数据通常可以由少量向量跨越,大多数不沿着这些新轴的方差非常小,甚至可能是噪声。因此,像 ALS 这样的算法会找到代表大部分数据跨度的这几个向量。因此,“特征”可以被认为是数据变化的主要模式,或者换句话说,描述一个项目如何与另一个项目不同的原型。
请注意,推荐器中的 PQ 分解依赖于丢弃无关紧要的特征来实现潜在的巨大数据压缩。这些无关紧要的特征(在用户/项目输入中占很小差异的特征)可以被丢弃,因为它们通常被解释为噪声,并且在实践中会产生更好的丢弃结果。
你能找到隐藏的模式吗?当然。可以使用聚类、KNN 等技术处理新的更小但密集的项目和用户向量。它们只是由新基向量(新轴)定义的新“空间”中的向量。当您想解释此类操作的结果时,您需要将它们转换回项目和用户空间。
ALS(PQ矩阵分解)的本质是将用户的特征向量转化为物品空间,并根据物品的权重进行排名。推荐排名最高的项目。
于 2017-07-20T17:31:35.497 回答