问题标签 [nmf]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Assign Topic from NNMF Topic Modelling
I have a list of text comments that are fed into a non-negative matrix factorization topic modelling program.
The example output may be something like:
How can I assign a specific comment from the file a specific topic? e.g., the comment "My computer has an issue of turning off intermittently" would be mapped to Topic 1 "problem"
r - R中线性代数函数的Rcpp端口
以下是我试图移植到 Rcpp 的对称非负矩阵分解的目标函数:
这是我在 Rcpp 翻译中的刺探(肯定有很多错误):
什么是正确(和最快)的单核翻译?
理论背景:这个函数的迭代驱动收敛到一个H
近似HH^T
等于的W
。有关背景,请参阅此问题(以及我的答案)。
machine-learning - sklearn中NMF(非负矩阵分解)中的n_components是什么?
n_components
里面有什么sklearn.NMF
?
r - Fast NMF in R on sparse matrices
I'm looking for a fast NMF implementation for sparse matrices in R.
The R NMF
package consists of a number of algorithms, none of which impress in terms of computational time.
NNLM::nnmf()
seems state of the art in R at the moment, specifically the method = "scd"
and loss = "mse"
, implemented as alternating least squares solved by sequential coordinate descent. However, this method is quite slow on very large, very sparse matrices.
The rsparse::WRMF
function is extremely fast, but that's due to the fact that only positive values in A
are used for row-wise computation of W
and H
.
Is there any reasonable implementation for solving NMF on a sparse matrix?
Is there an equivalent to scikit-learn
in R? See this question
There are various worker functions, such as fnnls
, tsnnls
in R, none of which surpass nnls::nnls
(written in Fortran). I have been unable to code any of these functions into a faster NMF framework.
python-3.x - 如何使用混淆矩阵评估 NMF 主题建模?
我正在使用 NMF 模型进行主题建模。我想通过混淆矩阵来评估它的性能,或者如果有其他更好的方法来评估 NMF,我也可以。我试图在互联网上查找教程或其他资源,但找不到任何可以帮助我解决问题的东西。下面是我用于 NMF 主题建模的完整代码。
提前感谢您的建议和意见。
python - 如何使用sklearn的矩阵分解来预测新用户的推荐分数
我正在尝试使用包含有关用户如何评价项目的数据sklearn.decomposition.NMF
的矩阵R
来预测他们尚未看到的项目的用户评分。
矩阵的行是用户,列是项目,值是分数,0 分数意味着用户还没有评价这个项目。
现在使用下面的代码,我只设法得到两个矩阵,当它们相乘时返回原始矩阵。
问题是,模型不会预测新值来代替0
's,这将是预测的分数,而是按原样重新创建矩阵。
如何让模型代替原始矩阵的零点来预测用户分数?
python - (NMF) 每次调用方法时,在 NMF 中计算一致性会产生不同的输出
我正在尝试计算每个主题的一致性值,但每次运行代码时都会生成不同的值。
如果有人能回答这个问题,那将是一个很大的帮助。
先感谢您
这是我在项目中使用的代码。
输出要求:每次我运行我的代码一致性应该是相同的。
如果您能帮助我解决这种方法,那将是一个很大的帮助
太感谢了。
scikit-learn - 文本簇中的关键字数
我正在处理一个相当大的数据集,并希望确定哪些主题是有意义的。我同时使用了 NMF 和 LDA(sklearn 实现),但关键问题是:什么是成功的合适衡量标准。在视觉上,我在许多主题中只有几个高度权重的关键字(其他权重 ~ 0),以及一些主题分布更钟形的主题。目标是什么:一个有几个词的主题,高权重,休息低(尖峰)或钟形分布,在大#关键字上逐渐减少权重 NMF
或 LDA 方法
我还使用了加权 jaccard(设置关键字的重叠,加权;毫无疑问有更好的方法,但这有点直观
你对此有何看法?
最好的,
安德烈亚斯
https://scikit-learn.org/stable/auto_examples/applications/plot_topics_extraction_with_nmf_lda.html?highlight=document%20word%20matrix的代码
python - 如何在 python sklearn 中为 NMF 选择最佳组件数量?
python 的 sklearn 中没有内置函数来执行此操作。
在我的研究中,我发现可以通过以下方式计算“精度分数”错误(组件)
组件的最佳数量将具有最小的 err(c)。
给定以下测试代码,如何在 python 中实现精度分数?