问题标签 [multi-dimensional-scaling]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
398 浏览

pca - t-SNE 选择维数

我正在使用 t-SNE 进行探索性数据分析。我使用它而不是 PCA,因为 PCA 是线性的,而 t-SNE 是非线性的。

知道使用 PCA 捕获必要的方差需要多少维度非常简单。我如何知道使用 t-SNE 的数据需要多少维?

我已经阅读了一个非常有用信息的流行网站,但它没有讨论维度。 https://distill.pub/2016/misread-tsne/

0 投票
4 回答
3113 浏览

python - 在给定的点集中选择最远点的子集

想象一下,给定 3 个维度的 n 个点的集合 S。任何两点之间的距离都是简单的欧几里得距离。您想从该集合中选择 k 个点的子集 Q,使它们彼此相距最远。换句话说,不存在k个点的其他子集Q',使得Q中所有成对距离的min小于Q'中的min。

如果 n 约为 1600 万,k 约为 300,我们如何有效地做到这一点?

我的猜测是这个 NP-hard 所以我们可能只想专注于近似。我能想到的一个想法是使用多维缩放对一条线上的这些点进行排序,然后使用二进制搜索的版本来获取这条线上相距最远的点。

0 投票
0 回答
946 浏览

python - 使用 matplotlib 绘制不同比例的 3 y

我想绘制一个函数,并显示 3 个不同的y轴,每个轴都有不同的比例、对数和线性比例。我按照这个其他示例尝试修改它以考虑到我之前提到的差异。

编辑:我有数据来绘制 a(t) = t^(1/2),我可以改变 a 轴的比例,因为我知道变换 z(a) = 1/a - 1,所以它是就像绘制 z(t),但我希望通过更改 y 轴的显示方式使 a(t) 和 z(t) 看起来相同,因此 a 轴和 z 轴等效于遵守 z(a) .

问题是该图显示了 3 条曲线,就好像它是不同的函数一样,我希望它们看起来相同,因此我不相信每个 y 轴的转换。

具体问题是,我怎样才能改变 y 轴的比例。

这就是我所做的:

这是我得到的情节。

0 投票
0 回答
1397 浏览

python - Python:用 sklearn 流形绘制预先计算的距离矩阵

在 Python 3.6.3 中,我有一个预先计算的距离矩阵D

我正在尝试绘制,以便可视化集群。我正在使用这个,按照这里sklearn.manifold.MDS()给出的第一个例子:

但是,由于position=k==label=False. 我应该能够可视化这两个集群。

0 投票
1 回答
384 浏览

python - 将索引保留在 Jaccard 距离矩阵的散点图中

我有一个距离矩阵,我想将其绘制为 2D 散点图。

我通过 sklearn.manifold 找到了一种方法:

jac_sim 是我的距离矩阵,看起来像这样: 在此处输入图像描述

这段代码给了我下一个情节: 在此处输入图像描述

我想从距离矩阵中携带列或索引的名称,以便我可以按 Indiv 编号对图中的点进行颜色编码,并能够放置标签。我试图检查 X_r 文件,但它只包含散点图的坐标,但没有原点信息。

如何按列/索引名称对其进行颜色编码?

0 投票
1 回答
199 浏览

spss - 在 MDS 图中添加类别

一)问题

假设我有一个这样的矩阵,其中包含不同人家之间的距离(以公里为单位)。

我有一个这样的数据表:

我想做多维缩放(距离不同)来可视化 i)每个人与另一个人的生活距离;ii)每个人投票给哪个政党(每个政党的颜色不同)

二)目前的结果

我当前的 MDS 图(用 SPSS 制作)是这样的(我不使用代码行,而是 SPSS 中的菜单命令)。:

没有颜色的 MDS 图

III) 预期结果

我想根据这个人投票给哪个政党为每个人添加不同的颜色:

带颜色的 MDS 图

四)问题(S)

我可以在SPSS中做到吗?如何在矩阵中添加有关投票的数据以及如何在 MDS 图中显示?

编辑 R. R 有完全相同的问题和解决方案 )创建双标签 MDS 图 但我想在 SPSS 中进行。

0 投票
1 回答
195 浏览

r - 如何对 Wish (1971) 报告的 12 国数据集进行多维缩放

我目前正在自学多维缩放。其中,我研究了 Borg & Groenen (2005):现代多维尺度:理论与应用。

在第 10 页,他们展示了 Wish (1971) 报告的真实数据集。Wish (1971) 要求 18 名学生以 9 点评分标准对法国和中国等不同国家的全球相似性进行评分,评分范围从 1 = 非常不同到 9 = 非常相似。由于数据集是公开的,因此我想在 R 中复制结果以供练习。作为第一步,我想复制同样在 Borg & Groenen (2005, p. 10) 中提出的以下配置。

在此处输入图像描述

我进行如下:

由于数据集包含相似性评级,我使用 MASS 包的 isoMDS 命令应用了非度量多维缩放。尽管教科书作者提到“二维 MDS 配置”,但我也尝试了更高维的解决方案。因此,我编写了一个循环,对包含 2 到 9 维的配置执行多维缩放。

所得到的图都与 Borg & Groenen (2005, p. 10) 中提出的图不同。例如,二维的地图如下:

在此处输入图像描述

我检查了数据集是否与 Borg & Groenen (2005, p. 10) 报告的数据集相同。我还尝试了如下度量缩放:

同样,我无法复制 Borg & Groenen (2005, p. 10) 报告的结果。但是,我不确定在尝试复制结果时是否犯了任何错误。

0 投票
1 回答
569 浏览

r - 寻找类似 SIMPROF 的聚类分析,但允许每个类别进行许多观察

我需要对一些生物数据进行聚类或相似性分析,并且我正在寻找 SIMPROF 给出的输出。又名树状图或层次聚类。

但是,我每组有 3200 个观察值/行。SIMPROF,请参见此处的示例,

似乎期望每组只有一次观察(本例中为美国州)。现在,我的生物数据(总共 140k 行)每组大约有 3200 个 obs。我正在尝试将在提供的变量中具有相似表示的组聚集在一起。就像在上面的示例中一样,AK 将由多个观察值表示。对于函数/包/分析,我最好的选择是什么?

干杯,莫


论文中的示例:

Simprof 示例

0 投票
1 回答
192 浏览

javascript - 拖出图表限制时控制画布的缩放

当我将数据点拖出图表的刻度限制时,例如从最大 x 和 y 轴值,画布增加限制太快。我怎样才能控制这个缩放速度?以便它随着图表配置中定义的特定数字而增加。

这是js小提琴链接。 https://jsfiddle.net/rz7pw6j0/67/

JS

HTML

CSS

我想控制缩放速度。

0 投票
0 回答
41 浏览

matlab - 调整大型 3D 数组大小的内存有效方法是什么?

我有来自传感器的数据,该数据针对每个给定时间戳的每个 (x,y) 坐标对处理每个事件。

来自传感器的数据示例如下:

我遇到的问题是来自传感器的大量数据。分辨率为 180x240,我可以预期多达 400,000 个唯一时间戳。我的目标是将数据大小调整为 28x28x400000。我目前采用的方法是分块进行,构建 3D 阵列的一部分并执行转换以将其降低到 28x28。很多数据只是零,所以我尝试使用稀疏数组但没有运气。关于如何改进这一点的任何建议?