问题标签 [nmf]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
169 浏览

python - Assign Topic from NNMF Topic Modelling

I have a list of text comments that are fed into a non-negative matrix factorization topic modelling program.

The example output may be something like:

How can I assign a specific comment from the file a specific topic? e.g., the comment "My computer has an issue of turning off intermittently" would be mapped to Topic 1 "problem"

0 投票
0 回答
77 浏览

r - 当我在 R 中绘制 NMF 等级调查时无法更改标签

我正在对我拥有的数据集实施 R 分析。这是剧情

在此处输入图像描述

基本上我想更改数据标签。我设法更改了标题,但更改标签的常用脚本不起作用。基本上我的想法是:

先感谢您

0 投票
0 回答
90 浏览

r - R中线性代数函数的Rcpp端口

以下是我试图移植到 Rcpp 的对称非负矩阵分解的目标函数:

这是我在 Rcpp 翻译中的刺探(肯定有很多错误):

什么是正确(和最快)的单核翻译?

理论背景:这个函数的迭代驱动收敛到一个H近似HH^T等于的W。有关背景,请参阅此问题(以及我的答案)。

0 投票
1 回答
288 浏览

machine-learning - sklearn中NMF(非负矩阵分解)中的n_components是什么?

n_components里面有什么sklearn.NMF

0 投票
1 回答
193 浏览

r - Fast NMF in R on sparse matrices

I'm looking for a fast NMF implementation for sparse matrices in R.

The R NMF package consists of a number of algorithms, none of which impress in terms of computational time.

NNLM::nnmf() seems state of the art in R at the moment, specifically the method = "scd" and loss = "mse", implemented as alternating least squares solved by sequential coordinate descent. However, this method is quite slow on very large, very sparse matrices.

The rsparse::WRMF function is extremely fast, but that's due to the fact that only positive values in A are used for row-wise computation of W and H.

Is there any reasonable implementation for solving NMF on a sparse matrix?

Is there an equivalent to scikit-learn in R? See this question

There are various worker functions, such as fnnls, tsnnls in R, none of which surpass nnls::nnls (written in Fortran). I have been unable to code any of these functions into a faster NMF framework.

0 投票
1 回答
106 浏览

python-3.x - 如何使用混淆矩阵评估 NMF 主题建模?

我正在使用 NMF 模型进行主题建模。我想通过混淆矩阵来评估它的性能,或者如果有其他更好的方法来评估 NMF,我也可以。我试图在互联网上查找教程或其他资源,但找不到任何可以帮助我解决问题的东西。下面是我用于 NMF 主题建模的完整代码。

提前感谢您的建议和意见。

0 投票
2 回答
720 浏览

python - 如何使用sklearn的矩阵分解来预测新用户的推荐分数

我正在尝试使用包含有关用户如何评价项目的数据sklearn.decomposition.NMF的矩阵R来预测他们尚未看到的项目的用户评分。

矩阵的行是用户,列是项目,值是分数,0 分数意味着用户还没有评价这个项目。

现在使用下面的代码,我只设法得到两个矩阵,当它们相乘时返回原始矩阵。

问题是,模型不会预测新值来代替0's,这将是预测的分数,而是按原样重新创建矩阵。

如何让模型代替原始矩阵的零点来预测用户分数?

0 投票
0 回答
84 浏览

python - (NMF) 每次调用方法时,在 NMF 中计算一致性会产生不同的输出

我正在尝试计算每个主题的一致性值,但每次运行代码时都会生成不同的值。

如果有人能回答这个问题,那将是一个很大的帮助。

先感谢您

这是我在项目中使用的代码。

输出要求:每次我运行我的代码一致性应该是相同的。

如果您能帮助我解决这种方法,那将是一个很大的帮助

太感谢了。

0 投票
1 回答
30 浏览

scikit-learn - 文本簇中的关键字数

我正在处理一个相当大的数据集,并希望确定哪些主题是有意义的。我同时使用了 NMF 和 LDA(sklearn 实现),但关键问题是:什么是成功的合适衡量标准。在视觉上,我在许多主题中只有几个高度权重的关键字(其他权重 ~ 0),以及一些主题分布更钟形的主题。目标是什么:一个有几个词的主题,高权重,休息低(尖峰)或钟形分布,在大#关键字上逐渐减少权重 NMF 在此处输入图像描述

或 LDA 方法

在此处输入图像描述 这主要是一个钟形(显然不是曲线)

我还使用了加权 jaccard(设置关键字的重叠,加权;毫无疑问有更好的方法,但这有点直观

你对此有何看法?

最好的,

安德烈亚斯

https://scikit-learn.org/stable/auto_examples/applications/plot_topics_extraction_with_nmf_lda.html?highlight=document%20word%20matrix的代码

0 投票
2 回答
199 浏览

python - 如何在 python sklearn 中为 NMF 选择最佳组件数量?

python 的 sklearn 中没有内置函数来执行此操作。

在我的研究中,我发现可以通过以下方式计算“精度分数”错误(组件)

在此处输入图像描述

组件的最佳数量将具有最小的 err(c)。

给定以下测试代码,如何在 python 中实现精度分数?