问题标签 [matrix-factorization]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R 的 `chol` 与 MATLAB 的 `cholcov` 不同。如何进行类似 Cholesky 的协方差分解?
我一直在尝试在 R 中重现类似 Cholesky 的协方差分解 - 就像在 Matlab 中使用cholcov()
. 示例取自https://uk.mathworks.com/help/stats/cholcov.html。
作为示例的原始cholcov()
函数的结果:
我试图T
在 R 中复制它。我试过:
我的结果:
C2
恢复C1
,但T1
与 MATLAB 的解决方案完全不同。然后我想也许这将是协方差矩阵的 Cholesky 组合:
但我明白了
这也不对。
谁能给我一个提示如何cholcov()
在 Matlab 中计算以便我可以在 R 中复制它?
data-science - 非负矩阵分解中的评分预测
我正在关注这个博客http://www.quuxlabs.com/blog/2010/09/matrix-factorization-a-simple-tutorial-and-implementation-in-python/(这里也附上矩阵)用于评级预测使用矩阵分解。最初我们有一个稀疏的用户电影矩阵 R 。
然后我们应用 MF 算法来创建一个新的矩阵 R',它是 2 矩阵 P(UxK) 和 Q(DxK) 的乘积。然后,我们将 R 和 R' 中给出的值的误差“最小化”。到目前为止一切都很好。但在最后一步,当矩阵被填满时,我不太相信这些是用户将给出的预测值。这是最终的矩阵:
这些实际上是“预测”评级的理由是什么?另外,我打算使用 P 矩阵 (UxK) 作为用户的潜在特征。我们能否以某种方式“证明”这些实际上是用户的潜在特征?
python - LightFM 用户/项目产生 Nan 嵌入
我正在尝试使用 Python 中的 LightFM 库创建冷启动建议。https://github.com/lyst/lightfm
这对于协同过滤按预期工作,没有用户和项目特征,即:
这会产生很好的预测。但是,当我添加:
我得到了 Nan 的用户和项目嵌入。
python - LU分解使用python 3
我需要实现 LU 分解,然后将其与np.linalg.solve
numpy 中的函数进行比较。
代码中的函数(见下文)运行没有任何问题,但是当我使用它来求解矩阵时,我不断收到错误消息:
在线上:
这是整个代码:
有任何想法吗?谢谢!
svm - 解释 lightFM 的结果
我在用户项目事务数据集上构建了一个推荐模型,其中每个事务由 1 表示。
这是结果
谁能帮我解释一下这个结果?我是如何获得如此好的 auc 分数和如此糟糕的精度/召回率的?对于“bpr”贝叶斯个性化排名,精确度/召回率变得更糟。
预测任务
结果
如何解释预测分数?
谢谢
python - 在 Tensorflow 中处理 eval() 时内存溢出
我正在使用 Tensorflow 来处理一个简单的矩阵分解算法。每一步都正确,但在最后一步,我想要eval()
一个张量来存储它,程序没有工作,只会占用越来越多的内存。那么我的代码有问题吗?我是 Tensorflow 的初学者,我不知道问题出在哪里。下面是我的代码。
程序在最后两行停止并占用内存_run()
,其中包含W.eval()
和C.eval()
。那么我应该怎么做才能修复它呢?有人可以帮忙吗?
tensorflow - 在 TensorFlow 中使用 coo_matrix
我正在 TensorFlow 中进行矩阵分解,我想使用 Spicy.sparse 中的 coo_matrix,因为它使用的内存更少,并且可以轻松地将我的所有数据放入我的矩阵中以进行训练数据。
是否可以使用 coo_matrix 初始化 tensorflow 中的变量?
或者我是否必须创建一个会话并使用 sess.run() 和 feed_dict 将我输入的数据输入到 tensorflow 中。
我希望您理解我的问题和我的问题,否则发表评论,我会尝试解决它。
tensorflow - 在 TensorFlow 中,如何获取 SparseTensor 行的所有非零值
我需要能够使用它们的索引和非零值的值来获取所有非零值。有人这样做过或知道如何帮助我走上正轨。
是否有可能我可以在 SparseTensor 中获取一行的所有元素(我知道一行可能没有任何保存的值,因此它返回 null 或 none)
r - 通过 Householder 成功找到 Q & R 后无法在 R 中获得线性回归系数
我正在手动尝试计算回归系数,而不是对数据使用任何默认值http://people.sc.fsu.edu/~jburkardt/datasets/regression/x31.txt
这是我的代码,它可以正确生成满足 A=QR 的 Q&R。但我无法找到系数作为 Q & R 产生问题的维度。任何专家可以在这里帮助我吗?当我有适当的问答时,如何找到系数会出错?
apache-spark - PySpark 如何在构建推荐器时结合用户项目功能?
PySparks mllib 包提供了 train() 和 trainimplicit() 方法,分别用于在显式和隐式数据上训练推荐模型。
我想训练一个关于隐式数据的模型。更具体地说,项目购买数据。由于在我的情况下,用户多次购买一件商品的情况非常罕见,因此“评分”或“偏好”始终为 1。所以我的数据集如下所示:
u1, i1, 1
u1, i2, 1
u2, i2, 1
u2, i3, 1
...
un, im, 1
其中 u 代表用户,i 代表项目。
我确实有很多关于用户人口统计、位置等的特性以及项目特性。但我不能将用户或项目特征合并到pyspark.mllib.als.train
或pyspark.mllib.als.trainimplicit
方法中。
或者,我考虑过使用 fastFM 或 libfm。两者都是 Factorization Machines 的包,它实现了 ALS 求解器和框架推荐作为回归/分类问题。使用这些案例,我可以将训练数据中的用户、项目和更多特征包含为X
. 但是,预测变量y
将只是一个向量(我没有明确的评级只购买)。
我该如何解决这个问题?