问题标签 [nmf]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
730 浏览

r - 如何撤消日志转换以删除负值

我得到了一个已经被前一个用户转换的数据集。当我尝试使用此代码创建/绘制 NMF 时:

我不能,因为我收到这些错误:

我的想法是,所看到的负值是由于之前使用的转换,因为基因表达数据本质上是非负的。

我将如何撤消已完成的转换以便创建 NMF?

0 投票
2 回答
135 浏览

python-3.x - 如何使用 Python 提取点的 x 坐标

我正在尝试建立一个用于主题提取的 NMF 模型。对于模型的重新训练,我必须将参数传递给 nmf 函数,为此我需要从算法返回的给定点传递 x 坐标,这是供参考的代码:

在倒数第三行,tfidf.shape 将一个点 (3,1000) 返回到变量“no_topics”,但是我希望该变量仅设置为 x 坐标,即 (3)。如何从该点仅提取 x 坐标?

0 投票
1 回答
1863 浏览

python - 如何计算 NMF 的 sklearn 实现中的连贯性分数?

我正在尝试构建一个实用程序,其中 NMF 模型每隔几天就会处理一次数据集。为此,在第一次运行中,我提供了主题数量的起始值。如何计算整个数据集的一致性分数?我打算使用这个计算的分数来重建模型,这样它会更准确。下面是我使用的代码。

0 投票
1 回答
584 浏览

python - 惊喜 NMF 抛出 ZeroDivisionError:浮点除法

我正在尝试做一个基本的推荐系统。我为此使用了Surprise的 NMF 模型。

这是我开始使用 NMF 之前的数据集:

在此之后,我运行下面的代码来准备这个数据集来训练模型:

在这些步骤之后,下面的代码会引发错误:

该系统运行良好。我认为问题出在数据集上。但我无法弄清楚是什么原因造成的。我检查了空值、零值等。所有值都不是空值,并且仅在数量(等级)列中为零。

如果有人知道可能导致此错误的原因,我会很高兴。如果您需要,我可以提供有关数据集的更多信息。

我不知道这是否正确,但这里有一个数据样本供您使用。您可以将其保存为 json 并使用 pandas 读取:

0 投票
0 回答
167 浏览

r - 错误:带有R包NMF的.C [调用'silhouette.default']不支持长向量(参数1)

目前,我在具有 264 GB 内存和 Intel(R) Xeon(R) CPU的 现在我正在尝试运行计算 a about ,当我设置特定等级时效果很好,例如:version 3.6.0 (2019-04-26)(5*10^4) * 1100 matrix

它返回:

但是,当我尝试设置一系列排名数字时,例如:

然后它抛出了一个错误:

我会说这让我有点恼火......我在互联网上做了一些研究,但仍然不知道如何解决它。也许原因是我确实达到了包本身的一些内存限制,或者它只是达到了服务器本身的内存限制?任何信息将不胜感激。

0 投票
0 回答
100 浏览

numpy - Scikit-learn NMF 返回 NAN 值

我正在使用 6650254x5650 稀疏矩阵,其值采用 numpy.float64 格式。

我正在使用 scikit-learn 的 NMF 实现,如下所示

似乎更多的n_components我得到W了所有元素都在的矩阵NaN。例如 ifn_components大于 7 - 但它在n_components19 时有效!我想知道是什么导致了这种情况,还有哪些其他库可以有效地处理如此大的矩阵,我可以对其进行基准测试。

更新 如果其他人有类似的问题,同时,我正在使用隐式库

0 投票
1 回答
41 浏览

scikit-learn - 有没有办法在 python 中为 NMF 重塑多个图像?

我是 python 的新手Nmf。我正在尝试创建图像列表以获取组件。这是代码:

然后出现下一个错误:

0 投票
1 回答
524 浏览

python - NMF 负值 Python

我正在使用 Scikit-Learn NMF 算法,我想知道是否有任何方法可以在算法中使用负值,我需要它来处理 BVH 文件。

我正在使用 python 3.7.5

代码已经逐行读取 bvh 文件并验证它是否在 Motion 部分中,该部分是必须通过 NMF 的部分,但它通常具有许多负值并且算法会拒绝它们。欢迎任何帮助,谢谢。

0 投票
1 回答
279 浏览

python-3.x - 主题建模上下文中的短文本

我正在研究主题建模,我很好奇在这种情况下究竟什么是短文本?例如,如果有一篇研究论文,研究论文的标题和摘要是否会被视为短文本?

0 投票
1 回答
255 浏览

r - 优化 for 循环 RcppArmadillo 中的矩阵乘法

目的是在 R 中实现正交投影非负矩阵分解 (opnmf) 的快速版本。我正在翻译此处提供的 matlab 代码。

我实现了一个香草 R 版本,但它比我的数据(~225000 x 150)的 20 因子解决方案的 matlab 实现慢得多(慢约 5.5 倍)。

所以我认为使用 c++ 可能会加快速度,但它的速度与 R 相似。我认为这可以优化但不知道如何作为 c++ 的新手。是一个讨论类似问题的线程。

这是我的 RcppArmadillo 实现。

这个建议的问题证实了matlab相当快,那么使用R/c++时没有希望了吗?

测试是在 Windows 10 和 Ubuntu 16 以及 R 版本 4.0.0 上进行的。

编辑

在下面的答案中有趣的评论之后。我正在发布其他详细信息。我在带有 R 3.5.3(微软提供的)的 Windows 10 机器上进行了测试,比较表明带有微软 R 的 RcppArmadillo 是最快的。

R

R 与 RcppArmadillo

微软的开放 R

微软与 RcppArmadillo 合作