问题标签 [nmf]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1096 浏览

python-3.x - 主题建模输出的可视化

对于主题建模,我使用称为 nmf(非负矩阵分解)的方法。现在,我想将其可视化。所以,有人可以告诉我主题建模的可视化技术吗?

0 投票
1 回答
163 浏览

scikit-learn - 如何在sklearn中获取NMF主题的频率

我现在使用 NMF 来生成主题。我的代码如下所示。但是,我不知道如何获得每个主题的频率。有没有人可以帮助我?谢谢!

0 投票
0 回答
42 浏览

machine-learning - 创建基于 3 列的预测模型

我有一个包含 3 列的数据集。客户、商店和客户在特定商店购物的次数。

我需要提出一个模型来描述客户在特定商店购买的概率。我尝试过 NMF 和朴素贝叶斯,但没有成功。我是一个初学者,我很难想出一个模型。

0 投票
2 回答
408 浏览

python - 如何从函数的结果中删除 None?

很抱歉,但我仍然无法解决此无问题。我正在使用 NMF 算法来获取语料库的主题,然后我尝试检索附加到每个主题的文档。但是没有人阻止我!当我尝试检索文档时,出现错误

脚本:

我试图设置一个忽略名称的条件,但它不起作用。我仍然有同样的错误。

主题 0:

订单取消交货日期不希望商店总是提前

话题一:

产品没有破损,只有包裹到货了颜色颜色交付

主题二:

产品不退货网站商店收据订单可提前预订

没有任何

与主题相关的文件

Traceback(最近一次调用最后一次):文件“NMF.py”,第 49 行,范围内的主题(len(topics)):

TypeError:“NoneType”类型的对象没有 len()

我需要这个结果:

主题 0:

订单取消交货日期不希望商店总是提前

话题一:

产品没有破损,只有包裹到货了颜色颜色交付

主题二:

产品不退货网站商店收据订单可提前预订

与主题相关的文件

主题 0:

文字文字文字

文字文字文字

文字文字文字

话题一:

文字文字文字

文字文字文字

文字文字文字

主题二:

文字文字文字

文字文字文字

文字文字文字

一些(愚蠢的)数据示例:

0 投票
1 回答
617 浏览

python - 如何在 NMF Python 上执行交叉验证

我正在尝试对 NMF 执行交叉验证以找到要使用的最佳参数。我尝试使用 sklearn 交叉验证,但收到一个错误,指出 NMF 没有评分方法。这里有人可以帮我吗?谢谢你们

0 投票
1 回答
2741 浏览

python - NMF 作为 Python Scikit 中的聚类方法

我正在为 NMF 文本数据聚类实现 Python 脚本。在我的工作中,我使用的是 Scikit NMF 实现,但是据我所知,在 Scikit NMF 中,它更像是分类方法而不是聚类方法。

我已经开发了一个简单的脚本来处理一些示例文章。我正在对它们进行预处理并作为 NMF 的输入。根据我教授分享的论文,我收到了一些集群,但是我不知道如何可视化/呈现它们。

你们中的任何人都知道如何使这个易于阅读吗?:)

主脚本代码如下:

0 投票
1 回答
484 浏览

python - 为什么在 NMF 和 LDA 算法中使用 random_state 参数?使用每次生成的随机主题有什么好处?

对于主题建模,
为什么在 NMF 和 LDA 算法中使用 random_state 参数?
使用每次生成的随机主题有什么好处?

0 投票
1 回答
53 浏览

r - 凸 NMF 实现

我需要 Convex NMF 来探索 R 中的一些数据集。我在包中找不到任何 Convex NMF 实现:NMF, NMFgpu. 知道如何搜索它吗?

0 投票
0 回答
819 浏览

r - R png()/pdf() 在运行脚本时不起作用,但在逐步执行时起作用

我正在创建一个脚本来将我的数据聚集在服务器中。我还需要保存文本输出和图像。文本输出工作得很好,但是当我尝试使用png()++保存plot()绘图dev.off()时,没有创建图像。

[为澄清而添加]

我需要做的是在运行模式下保存绘图(即生成图像文件)。如果我逐步运行代码,则会创建文件。

我已经尝试使用相应的函数将图像格式更改为 PDF 和 JPG,但是当将代码作为脚本运行时,我仍然没有得到任何图像作为输出。踩踏时,效果很好。

由于在我逐步运行时 R 渲染图像需要一点时间,因此我尝试Sys.sleep(2)在命令之间添加(下面的代码)但没有任何改变。

我认为这个问题可能与我正在使用的包及其生成的对象类型(library(NMF))有关。我查看了文档以查看该plot()函数与聚类算法生成的对象类型的工作方式是否存在某些问题,但文本含糊不清:

“结果(estim.r <- nmf(esGolub, 2:6, nrun=10, seed=123456)例如)是类的 S3 对象NMF.rank,其中包含一个 data.frame,其中列中包含质量度量,行中包含 r 的值。它还包含每个 r 值的共识矩阵列表”。

“可以使用该方法一次绘制所有测量值plot(图 1),并且该函数consensusmap会为每个等级值生成共识矩阵的热图”。

集群运行后可以生成另一种类型的图像:consensusmap. 这适用于两种情况(步进和跑步)。

剧本很短。这里是:

summary.txt文件也生成了consensus.pngmetrics.png不是。这里发生了什么??

0 投票
1 回答
228 浏览

python - 近端交替线性化最小化算法的python实现

在此处输入图像描述 梯度的更新在某种程度上是错误的。

我已经实现了以下给定的算法。我做错了什么

在此处输入图像描述

我相信从 W 的第二行和 D 的第二列中 D 和 W 的更新是错误的