问题标签 [matrix-factorization]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1048 浏览

r - R 的 `chol` 与 MATLAB 的 `cholcov` 不同。如何进行类似 Cholesky 的协方差分解?

我一直在尝试在 R 中重现类似 Cholesky 的协方差分解 - 就像在 Matlab 中使用cholcov(). 示例取自https://uk.mathworks.com/help/stats/cholcov.html

作为示例的原始cholcov()函数的结果:

我试图T在 R 中复制它。我试过:

我的结果:

C2恢复C1,但T1与 MATLAB 的解决方案完全不同。然后我想也许这将是协方差矩阵的 Cholesky 组合:

但我明白了

这也不对。

谁能给我一个提示如何cholcov()在 Matlab 中计算以便我可以在 R 中复制它?

0 投票
2 回答
361 浏览

data-science - 非负矩阵分解中的评分预测

我正在关注这个博客http://www.quuxlabs.com/blog/2010/09/matrix-factorization-a-simple-tutorial-and-implementation-in-python/(这里也附上矩阵)用于评级预测使用矩阵分解。最初我们有一个稀疏的用户电影矩阵 R 。

在此处输入图像描述

然后我们应用 MF 算法来创建一个新的矩阵 R',它是 2 矩阵 P(UxK) 和 Q(DxK) 的乘积。然后,我们将 R 和 R' 中给出的值的误差“最小化”。到目前为止一切都很好。但在最后一步,当矩阵被填满时,我不太相信这些是用户将给出的预测值。这是最终的矩阵:

在此处输入图像描述

这些实际上是“预测”评级的理由是什么?另外,我打算使用 P 矩阵 (UxK) 作为用户的潜在特征。我们能否以某种方式“证明”这些实际上是用户的潜在特征?

0 投票
1 回答
861 浏览

python - LightFM 用户/项目产生 Nan 嵌入

我正在尝试使用 Python 中的 LightFM 库创建冷启动建议。https://github.com/lyst/lightfm

这对于协同过滤按预期工作,没有用户和项目特征,即:

这会产生很好的预测。但是,当我添加:

我得到了 Nan 的用户和项目嵌入。

0 投票
1 回答
9702 浏览

python - LU分解使用python 3

我需要实现 LU 分解,然后将其与np.linalg.solvenumpy 中的函数进行比较。

代码中的函数(见下文)运行没有任何问题,但是当我使用它来求解矩阵时,我不断收到错误消息:

在线上:

这是整个代码:

有任何想法吗?谢谢!

0 投票
1 回答
1909 浏览

svm - 解释 lightFM 的结果

我在用户项目事务数据集上构建了一个推荐模型,其中每个事务由 1 表示。

这是结果

谁能帮我解释一下这个结果?我是如何获得如此好的 auc 分数和如此糟糕的精度/召回率的?对于“bpr”贝叶斯个性化排名,精确度/召回率变得更糟。

预测任务

结果

如何解释预测分数?

谢谢

0 投票
1 回答
373 浏览

python - 在 Tensorflow 中处理 eval() 时内存溢出

我正在使用 Tensorflow 来处理一个简单的矩阵分解算法。每一步都正确,但在最后一步,我想要eval()一个张量来存储它,程序没有工作,只会占用越来越多的内存。那么我的代码有问题吗?我是 Tensorflow 的初学者,我不知道问题出在哪里。下面是我的代码。

程序在最后两行停止并占用内存_run(),其中包含W.eval()C.eval()。那么我应该怎么做才能修复它呢?有人可以帮忙吗?

0 投票
1 回答
4242 浏览

tensorflow - 在 TensorFlow 中使用 coo_matrix

我正在 TensorFlow 中进行矩阵分解,我想使用 Spicy.sparse 中的 coo_matrix,因为它使用的内存更少,并且可以轻松地将我的所有数据放入我的矩阵中以进行训练数据。

是否可以使用 coo_matrix 初始化 tensorflow 中的变量?

或者我是否必须创建一个会话并使用 sess.run() 和 feed_dict 将我输入的数据输入到 tensorflow 中。

我希望您理解我的问题和我的问题,否则发表评论,我会尝试解决它。

0 投票
0 回答
161 浏览

tensorflow - 在 TensorFlow 中,如何获取 SparseTensor 行的所有非零值

我需要能够使用它们的索引和非零值的值来获取所有非零值。有人这样做过或知道如何帮助我走上正轨。

是否有可能我可以在 SparseTensor 中获取一行的所有元素(我知道一行可能没有任何保存的值,因此它返回 null 或 none)

0 投票
1 回答
74 浏览

r - 通过 Householder 成功找到 Q & R 后无法在 R 中获得线性回归系数

我正在手动尝试计算回归系数,而不是对数据使用任何默认值http://people.sc.fsu.edu/~jburkardt/datasets/regression/x31.txt

这是我的代码,它可以正确生成满足 A=QR 的 Q&R。但我无法找到系数作为 Q & R 产生问题的维度。任何专家可以在这里帮助我吗?当我有适当的问答时,如何找到系数会出错?

0 投票
1 回答
1020 浏览

apache-spark - PySpark 如何在构建推荐器时结合用户项目功能?

PySparks mllib 包提供了 train() 和 trainimplicit() 方法,分别用于在显式和隐式数据上训练推荐模型。

我想训练一个关于隐式数据的模型。更具体地说,项目购买数据。由于在我的情况下,用户多次购买一件商品的情况非常罕见,因此“评分”或“偏好”始终为 1。所以我的数据集如下所示:

u1, i1, 1 u1, i2, 1 u2, i2, 1 u2, i3, 1 ... un, im, 1

其中 u 代表用户,i 代表项目。

我确实有很多关于用户人口统计、位置等的特性以及项目特性。但我不能将用户或项目特征合并到pyspark.mllib.als.trainpyspark.mllib.als.trainimplicit方法中。

或者,我考虑过使用 fastFM 或 libfm。两者都是 Factorization Machines 的包,它实现了 ALS 求解器和框架推荐作为回归/分类问题。使用这些案例,我可以将训练数据中的用户、项目和更多特征包含为X. 但是,预测变量y将只是一个向量(我没有明确的评级只购买)。

我该如何解决这个问题?