问题标签 [runumap]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
356 浏览

r - RunUMAP 给出分段错误

我尝试了以下

我看不出它应该在sigfault这里获得的原因。在过去的几个月中,我多次运行此功能。这似乎是从大约一周开始发生的。

任何帮助表示赞赏。

更新:我现在已经重新启动了一台机器,删除了整个旧R安装,从全新安装开始。我仍然收到完全相同的错误,包括address 0xffffffffffffffffffa ....

萨米特

0 投票
1 回答
3297 浏览

r - 有没有办法为数据表绘制 UMAP 或 t-SNE 图?

我有一个巨大的文件(下面是一小部分数据),如下所示,我想绘制一个 PCA,我可以使用 PCA 函数绘制 PCA,但它看起来有点乱,因为我有 200 列所以我想也许 t- SNE 或 UMAP 效果更好,但我无法使用它们进行绘图。

我想在图中显示列(列名)之间的关系和聚类。事实上,我从不同的研究中收集了 A、B 和 ...数据,我喜欢检查它们之间是否存在任何批次效应。

如果有人可以帮助我,将不胜感激!

东风:

0 投票
1 回答
149 浏览

r - umap 突出显示两种不同的模型

我正在尝试为来自人类样本和 ptx 样本的单细胞数据创建一个 umap。我可以获得显示不同集群的 umap 图,但我想显示 ptx 样本和人类样本的位置。

我的代码如下:

0 投票
1 回答
96 浏览

r - 使用 purrr 中的 map 函数在 R 中的一个 UMAP 函数上测试 2 个参数

新手再次需要帮助。我正在使用 UMAP(一种降维工具)来处理数据集。像这样的东西将有 2 个参数需要调整和查看。以前我用过 tSNE,它需要一个参数调整。对于 tSNE,该参数称为 perplexity。为了尝试一些困惑值并可视化结果,我认为 purrr 中的 map 函数可以很好地实现自动化。

时态()的结果将为每一行(样本)生成 ax/y 坐标,然后我可以绘制它们。虽然,这里有一点帮助来教我如何自动绘制所有 4 个测试结果会很棒,否则我必须使用 plot 4 次,每次使用 x=tsne[,1] 和 y=tsne[,2]。

现在,对于我要测试的 umap。我想以相同的方式测试 2 个参数 n_neighbors 和 min_dist 。复杂性在于我为 n_neighbors 选择的每个值,我想测试所有 min_dist 测试值。例如,如果:n_neighbors= 10,50,20 min_dist= 0.1, 0.5, 1, 10 我想在我的数据上运行 umap 函数以获取 n_neighbors=10,然后迭代 min_dist= 0.1, 0.5, 1, 10。然后重复此操作对于 n_neighbors 值的其余部分。

然后我被 purrr 中的 map 函数困住了。我想我只能在函数中传递 1 个向量。

然后是绘图问题。UMAP 还给出了一个列表,一个矩阵是包含行的 x/y 坐标的布局。

0 投票
2 回答
1304 浏览

python - UMAP 错误类型错误:需要一个类似字节的对象,而不是“列表”

我正在尝试根据此处的工作运行利用 UMAP 进行降维的代码:https ://umap-learn.readthedocs.io/en/latest/basic_usage.html

我在 Spyder (Python 3.7) 上运行。我收到此错误: TypeError: a bytes-like object is required, not 'list'

这是我的代码:

这是我在运行时收到的消息:

0 投票
1 回答
280 浏览

python - UMAP PicklingError:(“不能腌制: ...)

尝试运行 UMAP 会导致错误:

PicklingError: ("Can't pickle <class 'numpy.dtype[float32]'>: it's not found as numpy.dtype[float32]", 'PicklingError while hashing array([[ 0., 1., 2., 3 ., 4.],\n [ 5., 6., 7., 8., 9.],\n [10., 11., 12., 13., 14.],\n [15., 16., 17., 18., 19.],\n
[20., 21., 22., 23., 24.]], dtype=float32): PicklingError("Can't pickle <class 'numpy. dtype[float32]'>: 找不到 numpy.dtype[float32]")')

我该如何解决这个问题?

0 投票
1 回答
238 浏览

r - Seurat UMAP 可视化结果在两个相同环境中运行后镜像

当我在本地计算机 RStudio (R 4.0.2) 和 Code Ocean R 4.0.3 上运行相同的 R 代码时,我有两个不同的 UMAP 可视化结果,它们被镜像

[ 在此处输入图像描述]

在此处输入图像描述

我在两种环境中都使用 Seurat 3.2.0 版本,特别是对于 umap 可视化,这里是一行:

我不能给出一个可重复的例子,但也许有人以前遇到过这个问题?

0 投票
1 回答
1403 浏览

python - 无法导入 umap:无法从“numba.experimental”导入名称“structref”

我试图在我的 jupyter 笔记本中导入 umap 但出现以下错误:

我试图更新 conda 但不起作用。我能做些什么 ?

0 投票
1 回答
399 浏览

python - Python 使 UMAP 更快(呃)

我正在使用 UMAP ( https://umap-learn.readthedocs.io/en/latest/# ) 来减少数据中的维度。我的数据集包含 4700 个样本,每个样本有 120 万个特征(我想减少)。然而,尽管使用了 32 个 CPU 和 120GB RAM,这仍需要相当长的时间。特别是嵌入的构建速度很慢,并且在过去 3.5 小时内详细输出没有变化:

有什么方法可以加快这个过程。我已经在使用稀疏矩阵(scipy.sparse.lil_matrix),如下所述:https ://umap-learn.readthedocs.io/en/latest/sparse.html 。此外,我还安装了 pynndescent(如此处所述:https ://github.com/lmcinnes/umap/issues/416 )。我的代码如下:

是否有任何技巧或想法如何使计算更快?我可以更改一些参数吗?我的矩阵仅由零和一组成是否有帮助(这意味着我的矩阵中的所有非零条目都是一)。

0 投票
0 回答
304 浏览

python - 使用 UMAP 和 HDBScan 进行集群

我有大量的文本数据,大约有 5000 人输入。我使用 Doc2vec 为每个人分配了一个向量,使用 UMAP 减少到二维并使用 HDBSCAN 突出显示包含在其中的组。目的是突出具有相似主题相似性的组。这导致了下面的散点图。

使用 UMAP 和 HDBSCAN 创建的散点图

这看起来可以接受。但是,当我在 Bokeh 中使用相同的数据(以创建交互式图表)时,输出看起来非常不同。尽管使用了与以前相同的坐标和组,但之前看到的清晰分组已经消失了。相反,图表是一团糟,所有颜色都混合在一起。

散景图

当应用过滤器来选择一个随机组时,这些点在整个绘图中分布得非常好,无论如何都不像一个有凝聚力的“组”。例如,第 41 组在图的每个角落附近都有点。

使用以下代码将文档向量简化为 X、Y 坐标:

并使用此代码分配组:

使用此代码生成的具有清晰组的 Matplotlib 图:

然后将其插入到 Pandas Dataframe 中:

并创建了散景图:

我在这里做错了吗?或者这是技术或数据的限制?我在初始情节中的彩色组是否真的按他们的组分组,如果是这样,为什么散景图中的不是?

任何帮助都将不胜感激。