问题标签 [tsne]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
32 浏览

python - 是否可以使用列标签在 T-SNE 中定义点?

我有 67382 行数据的 pandas DataFrame。其中目标 - 时间戳中的日期时间。

在此处输入图像描述

我创建了用于绘图、计算 T-sne 的代码,并在下面的代码中显示了 T-sne 点:

在此处输入图像描述

但是,可以将列的标签映射到点(确定哪个点到哪个列)和图例,如下图所示?例如:

在此处输入图像描述

其中,人口 A - TDS7,人口 B - TDS8,人口 C - TDS9。

0 投票
1 回答
45 浏览

python - 对于 most_similar 20 案例,如何在 word2vec(从 gensim 创建)上绘制 tsne?

我正在使用 TSNE 绘制经过训练的 word2vec 模型(从 gensim 创建):

就像内置的 gensim 方法“most_similar”一样,每个 ex。

将输出 20 个与“单词”最相似的单词,我只想绘制给定单词中最相似的单词 (n=20)。关于如何修改情节以做到这一点的任何建议?

0 投票
1 回答
52 浏览

python - 计算 t-SNE 中的集群大小

我一直在使用 DBSCAN 处理我的数据的 t-SNE。然后我将获得的值分配给原始数据框,然后用 seaborn 散点图绘制它。这是代码:

这是图像的显示方式:

在此处输入图像描述

我已经看到人们计算集群的大小(单元格数量、百分比等)并进行其他我没有找到任何类型代码的分析后工作。现在有没有人可以例如圈出确切的集群,显示其中的单元格数量等等......我有几个这样的图表,它真的会帮助我让他们的结果看起来更容易理解。

0 投票
1 回答
18 浏览

embedding - 运行与 _t_sne.py 文件关联的clustimage模块时出错

运行此模块时发生错误,clustimage。错误是指“embedding='tsne'”时的“embedding”设置。如果我在“embedding='none'”时运行代码,它工作正常。值得关注的是,嵌入对于视觉目的非常实用,应该使用。任何想法为什么会发生此错误以及如何解决它?

clustimage 资源链接: https ://erdogant.github.io/clustimage/pages/html/Abstract.html

集群图像模块

_t_sne.py 代码

错误

0 投票
0 回答
10 浏览

python - 如何使用降维来交互可视化不同图像的集群?

所以,我有一个训练有素的 ML 模型,它以 7 个变量作为输入(每个变量的范围从 -1 到 1)并输出一个图像。我生成了 100 张这样的图像,并根据它们的视觉相似性将它们分成 10 个簇。使用降维,我将生成如下图所示的图形。我希望用户能够将鼠标移动到图形上,并根据鼠标悬停的点,在屏幕上显示不同的设计或设计集群。所以,我的第一个问题是:我不确定如何让图形像这样交互。 此外,我希望图表右侧有 7 个滑块,它们代表 7 个不同的变量(同样,每个图像都由这 7 个变量的不同组合表示)。当用户将鼠标悬停在某个点上时,我希望滑块调整并反映代表该点/图像的 7 个变量。我的第二个问题是:我该如何实现这些滑块?

如果有人至少可以向我指出与这些问题相关的一些在线资源,那就太好了——我只知道基本的 python,所以不确定我应该寻找什么来编码/实现这两个交互元素。

在此处输入图像描述

0 投票
0 回答
21 浏览

python - OpenTSNE 腌制/保留变压器

尝试使用 openTSNE 是因为它能够将嵌入转换为现有的嵌入空间。

我正在尝试保存适合/训练过的嵌入对象,以便以后可以使用它,但总是在酸洗时出错。

这是我想要实现的示例,我总是得到 PermissionError: WinError 32 The process cannot access the file because it is being used by another process: ...\AppData\Local\Temp\tmp703si9k_\tmp.ann'

还是我做错了什么?我也在尝试将我的嵌入保存为 numpy 数组并使用 numpy 数组作为 embeddigns 重新初始化 openTSNE.TSNEEmbedding 类对象,但是我将需要一个相似对象以及我也无法腌制的对象。问题是什么?或者什么是解决这个问题的最佳解决方案?

0 投票
0 回答
31 浏览

r - R 在 Rtsne 期间崩溃,没有错误消息

我编写了一个 R 脚本,它从 fcs 文件导入数据,通过 FlowSOM 执行聚类,我想检查它并在 t-SNE 上可视化我的数据。它适用于少量数据,但是当我尝试处理大量数据(大约 4000 个单元格)时,它会在达到 310 000 个单元格时崩溃而没有任何错误消息。

data_Rtsne 是一个 4000000*10 的矩阵。

使用较小的数据集(大约 500 000 个单元格),它可以毫无问题地工作。所以应该是内存限制问题。

有人可以向我解释为什么我没有来自 R 的任何错误消息(它关闭,仅此而已)以及为什么我在 Windows 的任务管理器上看不到 RAM 饱和?

提前感谢您的帮助!

编辑:好的,我再次尝试使用较小的数据集(大约 500 000 个单元格),它可以正常工作。所以应该是内存限制问题。有人可以向我解释为什么我没有来自 R 的任何错误消息(它关闭,仅此而已)以及为什么我在 Windows 的任务管理器上看不到 RAM 饱和?

0 投票
1 回答
24 浏览

r - R中多个数据集的t-SNE

我有 7 个数据集,每个数据集都有两种类型的数据框:元数据,包含一个超级重要的列,显示谁是响应者,谁不是响应者,以及一个关于细胞类型的数据框。

使用 dput的示例:这是来自其中一个数据集的示例。第一个数据帧是细胞数据帧,第二个是元数据,其中包含有关药物益处(响应/无响应)的信息:

这些数据集是关于癌症治疗的。中的列cells1是样本,行是单元格类型。这是所有 7 个数据集中的方式。所有的行都完全相同,而样本不同(因此在每个数据集中都有不同数量的样本)。其中一些样本是响应者,有些是非响应者。

元数据:

目标:加入单元格数据框(我使用 cbind 完成),现在在我有一个包含 1000 多列且只有 38 行的大数据框后,我需要构建两个t-SNE 图,一个是按数据集(cells1)为样本着色, cells2, cells6 ...) ,第二个是通过响应(响应/无响应)对样本进行着色。

我的代码:我尝试按数据集着色,我认为示例名称列表是个好主意,但被困在那里:

如果需要任何其他信息,请告诉我