问题标签 [runumap]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - RunUMAP 给出分段错误
我尝试了以下
我看不出它应该在sigfault
这里获得的原因。在过去的几个月中,我多次运行此功能。这似乎是从大约一周开始发生的。
任何帮助表示赞赏。
更新:我现在已经重新启动了一台机器,删除了整个旧R
安装,从全新安装开始。我仍然收到完全相同的错误,包括address 0xffffffffffffffffffa ...
.
萨米特
r - 有没有办法为数据表绘制 UMAP 或 t-SNE 图?
我有一个巨大的文件(下面是一小部分数据),如下所示,我想绘制一个 PCA,我可以使用 PCA 函数绘制 PCA,但它看起来有点乱,因为我有 200 列所以我想也许 t- SNE 或 UMAP 效果更好,但我无法使用它们进行绘图。
我想在图中显示列(列名)之间的关系和聚类。事实上,我从不同的研究中收集了 A、B 和 ...数据,我喜欢检查它们之间是否存在任何批次效应。
如果有人可以帮助我,将不胜感激!
东风:
r - umap 突出显示两种不同的模型
我正在尝试为来自人类样本和 ptx 样本的单细胞数据创建一个 umap。我可以获得显示不同集群的 umap 图,但我想显示 ptx 样本和人类样本的位置。
我的代码如下:
r - 使用 purrr 中的 map 函数在 R 中的一个 UMAP 函数上测试 2 个参数
新手再次需要帮助。我正在使用 UMAP(一种降维工具)来处理数据集。像这样的东西将有 2 个参数需要调整和查看。以前我用过 tSNE,它需要一个参数调整。对于 tSNE,该参数称为 perplexity。为了尝试一些困惑值并可视化结果,我认为 purrr 中的 map 函数可以很好地实现自动化。
时态()的结果将为每一行(样本)生成 ax/y 坐标,然后我可以绘制它们。虽然,这里有一点帮助来教我如何自动绘制所有 4 个测试结果会很棒,否则我必须使用 plot 4 次,每次使用 x=tsne[,1] 和 y=tsne[,2]。
现在,对于我要测试的 umap。我想以相同的方式测试 2 个参数 n_neighbors 和 min_dist 。复杂性在于我为 n_neighbors 选择的每个值,我想测试所有 min_dist 测试值。例如,如果:n_neighbors= 10,50,20 min_dist= 0.1, 0.5, 1, 10 我想在我的数据上运行 umap 函数以获取 n_neighbors=10,然后迭代 min_dist= 0.1, 0.5, 1, 10。然后重复此操作对于 n_neighbors 值的其余部分。
然后我被 purrr 中的 map 函数困住了。我想我只能在函数中传递 1 个向量。
然后是绘图问题。UMAP 还给出了一个列表,一个矩阵是包含行的 x/y 坐标的布局。
python - UMAP 错误类型错误:需要一个类似字节的对象,而不是“列表”
我正在尝试根据此处的工作运行利用 UMAP 进行降维的代码:https ://umap-learn.readthedocs.io/en/latest/basic_usage.html
我在 Spyder (Python 3.7) 上运行。我收到此错误:
TypeError: a bytes-like object is required, not 'list'
这是我的代码:
这是我在运行时收到的消息:
python - UMAP PicklingError:(“不能腌制: ...)
尝试运行 UMAP 会导致错误:
PicklingError: ("Can't pickle <class 'numpy.dtype[float32]'>: it's not found as numpy.dtype[float32]", 'PicklingError while hashing array([[ 0., 1., 2., 3 ., 4.],\n [ 5., 6., 7., 8., 9.],\n [10., 11., 12., 13., 14.],\n [15., 16., 17., 18., 19.],\n
[20., 21., 22., 23., 24.]], dtype=float32): PicklingError("Can't pickle <class 'numpy. dtype[float32]'>: 找不到 numpy.dtype[float32]")')
我该如何解决这个问题?
python - 无法导入 umap:无法从“numba.experimental”导入名称“structref”
我试图在我的 jupyter 笔记本中导入 umap 但出现以下错误:
我试图更新 conda 但不起作用。我能做些什么 ?
python - Python 使 UMAP 更快(呃)
我正在使用 UMAP ( https://umap-learn.readthedocs.io/en/latest/# ) 来减少数据中的维度。我的数据集包含 4700 个样本,每个样本有 120 万个特征(我想减少)。然而,尽管使用了 32 个 CPU 和 120GB RAM,这仍需要相当长的时间。特别是嵌入的构建速度很慢,并且在过去 3.5 小时内详细输出没有变化:
有什么方法可以加快这个过程。我已经在使用稀疏矩阵(scipy.sparse.lil_matrix),如下所述:https ://umap-learn.readthedocs.io/en/latest/sparse.html 。此外,我还安装了 pynndescent(如此处所述:https ://github.com/lmcinnes/umap/issues/416 )。我的代码如下:
是否有任何技巧或想法如何使计算更快?我可以更改一些参数吗?我的矩阵仅由零和一组成是否有帮助(这意味着我的矩阵中的所有非零条目都是一)。
python - 使用 UMAP 和 HDBScan 进行集群
我有大量的文本数据,大约有 5000 人输入。我使用 Doc2vec 为每个人分配了一个向量,使用 UMAP 减少到二维并使用 HDBSCAN 突出显示包含在其中的组。目的是突出具有相似主题相似性的组。这导致了下面的散点图。
这看起来可以接受。但是,当我在 Bokeh 中使用相同的数据(以创建交互式图表)时,输出看起来非常不同。尽管使用了与以前相同的坐标和组,但之前看到的清晰分组已经消失了。相反,图表是一团糟,所有颜色都混合在一起。
当应用过滤器来选择一个随机组时,这些点在整个绘图中分布得非常好,无论如何都不像一个有凝聚力的“组”。例如,第 41 组在图的每个角落附近都有点。
使用以下代码将文档向量简化为 X、Y 坐标:
并使用此代码分配组:
使用此代码生成的具有清晰组的 Matplotlib 图:
然后将其插入到 Pandas Dataframe 中:
并创建了散景图:
我在这里做错了吗?或者这是技术或数据的限制?我在初始情节中的彩色组是否真的按他们的组分组,如果是这样,为什么散景图中的不是?
任何帮助都将不胜感激。