问题标签 [nmf]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

70 问题

0 投票

1 回答

730 浏览

r - 如何撤消日志转换以删除负值

我得到了一个已经被前一个用户转换的数据集。当我尝试使用此代码创建/绘制 NMF 时：

我不能，因为我收到这些错误：

我的想法是，所看到的负值是由于之前使用的转换，因为基因表达数据本质上是非负的。

我将如何撤消已完成的转换以便创建 NMF？

r logging transform nmf

2019-11-11T10:48:44.510

0 投票

2 回答

135 浏览

python-3.x - 如何使用 Python 提取点的 x 坐标

我正在尝试建立一个用于主题提取的 NMF 模型。对于模型的重新训练，我必须将参数传递给 nmf 函数，为此我需要从算法返回的给定点传递 x 坐标，这是供参考的代码：

在倒数第三行，tfidf.shape 将一个点 (3,1000) 返回到变量“no_topics”，但是我希望该变量仅设置为 x 坐标，即 (3)。如何从该点仅提取 x 坐标？

python-3.x machine-learning coordinate-systems nmf

2019-12-26T05:17:42.477

0 投票

1 回答

1863 浏览

python - 如何计算 NMF 的 sklearn 实现中的连贯性分数？

我正在尝试构建一个实用程序，其中 NMF 模型每隔几天就会处理一次数据集。为此，在第一次运行中，我提供了主题数量的起始值。如何计算整个数据集的一致性分数？我打算使用这个计算的分数来重建模型，这样它会更准确。下面是我使用的代码。

python machine-learning scikit-learn tfidfvectorizer nmf

2020-01-13T07:06:24.197

0 投票

1 回答

584 浏览

python - 惊喜 NMF 抛出 ZeroDivisionError：浮点除法

我正在尝试做一个基本的推荐系统。我为此使用了Surprise的 NMF 模型。

这是我开始使用 NMF 之前的数据集：

在此之后，我运行下面的代码来准备这个数据集来训练模型：

在这些步骤之后，下面的代码会引发错误：

该系统运行良好。我认为问题出在数据集上。但我无法弄清楚是什么原因造成的。我检查了空值、零值等。所有值都不是空值，并且仅在数量（等级）列中为零。

如果有人知道可能导致此错误的原因，我会很高兴。如果您需要，我可以提供有关数据集的更多信息。

我不知道这是否正确，但这里有一个数据样本供您使用。您可以将其保存为 json 并使用 pandas 读取：

python nmf

2020-02-10T13:49:47.303

0 投票

0 回答

167 浏览

r - 错误：带有R包NMF的.C [调用'silhouette.default']不支持长向量（参数1）

目前，我在具有 264 GB 内存和 Intel(R) Xeon(R) CPU的debian服务器上运行 r 。现在我正在尝试运行nmf计算 a about ，当我设置特定等级时效果很好，例如：version 3.6.0 (2019-04-26)(5*10^4) * 1100 matrix

它返回：

但是，当我尝试设置一系列排名数字时，例如：

然后它抛出了一个错误：

我会说这让我有点恼火......我在互联网上做了一些研究，但仍然不知道如何解决它。也许原因是我确实达到了nmf包本身的一些内存限制，或者它只是达到了服务器本身的内存限制？任何信息将不胜感激。

r matrix vector debian-based nmf

2020-03-26T06:52:21.463

0 投票

0 回答

100 浏览

numpy - Scikit-learn NMF 返回 NAN 值

我正在使用 6650254x5650 稀疏矩阵，其值采用 numpy.float64 格式。

我正在使用 scikit-learn 的 NMF 实现，如下所示

似乎更多的n_components我得到W了所有元素都在的矩阵NaN。例如 ifn_components大于 7 - 但它在n_components19 时有效！我想知道是什么导致了这种情况，还有哪些其他库可以有效地处理如此大的矩阵，我可以对其进行基准测试。

更新如果其他人有类似的问题，同时，我正在使用隐式库

numpy scikit-learn sparse-matrix matrix-decomposition nmf

2020-04-09T10:28:01.910

0 投票

1 回答

41 浏览

scikit-learn - 有没有办法在 python 中为 NMF 重塑多个图像？

我是 python 的新手Nmf。我正在尝试创建图像列表以获取组件。这是代码：

然后出现下一个错误：

scikit-learn scikit-image nmf

2020-04-28T11:45:34.030

0 投票

1 回答

524 浏览

python - NMF 负值 Python

我正在使用 Scikit-Learn NMF 算法，我想知道是否有任何方法可以在算法中使用负值，我需要它来处理 BVH 文件。

我正在使用 python 3.7.5

代码已经逐行读取 bvh 文件并验证它是否在 Motion 部分中，该部分是必须通过 NMF 的部分，但它通常具有许多负值并且算法会拒绝它们。欢迎任何帮助，谢谢。

python python-3.x scikit-learn scikits nmf

2020-04-29T00:44:10.540

0 投票

1 回答

279 浏览

python-3.x - 主题建模上下文中的短文本

我正在研究主题建模，我很好奇在这种情况下究竟什么是短文本？例如，如果有一篇研究论文，研究论文的标题和摘要是否会被视为短文本？

python-3.x nlp lda topic-modeling nmf

2020-06-09T10:29:10.957

0 投票

1 回答

255 浏览

r - 优化 for 循环 RcppArmadillo 中的矩阵乘法

目的是在 R 中实现正交投影非负矩阵分解 (opnmf) 的快速版本。我正在翻译此处提供的 matlab 代码。

我实现了一个香草 R 版本，但它比我的数据（~225000 x 150）的 20 因子解决方案的 matlab 实现慢得多（慢约 5.5 倍）。

所以我认为使用 c++ 可能会加快速度，但它的速度与 R 相似。我认为这可以优化但不知道如何作为 c++ 的新手。这是一个讨论类似问题的线程。

这是我的 RcppArmadillo 实现。

这个建议的问题证实了matlab相当快，那么使用R/c++时没有希望了吗？

测试是在 Windows 10 和 Ubuntu 16 以及 R 版本 4.0.0 上进行的。

编辑

在下面的答案中有趣的评论之后。我正在发布其他详细信息。我在带有 R 3.5.3（微软提供的）的 Windows 10 机器上进行了测试，比较表明带有微软 R 的 RcppArmadillo 是最快的。

R 与 RcppArmadillo

微软的开放 R

微软与 RcppArmadillo 合作

r matrix-multiplication rcpparmadillo nmf

2020-06-20T13:07:36.637

1 2 3 4 5 6 7 8 9 10

问题标签 [nmf]

Reference