问题标签 [dimensionality-reduction]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
6 回答
9116 浏览

algorithm - 如何在高维数据中高效地找到k近邻?

所以我有大约 16,000 个 75 维数据点,对于每个点,我想找到它的 k 个最近邻居(使用欧几里德距离,如果这样更容易,目前 k=2)

我的第一个想法是为此使用 kd-tree,但事实证明,随着维度数量的增加,它们变得相当低效。在我的示例实现中,它只比穷举搜索稍微快一点。

我的下一个想法是使用 PCA(主成分分析)来减少维数,但我想知道:是否有一些聪明的算法或数据结构可以在合理的时间内准确地解决这个问题?

0 投票
2 回答
437 浏览

machine-learning - 传感器网络中支持向量机的降维

我正在寻找一些关于我目前面临的问题的建议。

我有一组传感器,比如 S1-S100,它在执行某些事件 E1-E20 时触发。假设通常E1触发S1-S20,E2触发S15-S30,E3触发S20-s50等,E1-E20是完全独立的事件。有时,事件 E 可能会触发任何其他不相关的传感器。

我正在使用 20 svm 的集合来分别分析每个事件。我的功能是传感器频率 F1-F100、每个传感器被触发的次数以及其他一些相关功能。

我正在寻找一种可以降低传感器特征维度的技术(F1-F100)/或一些包含所有传感器并降低维度的技术(我最近几天一直在寻找一些信息论概念)。我不认为平均化、最大化是一个好主意,因为我冒着丢失信息的风险(它没有给我带来好的结果)。

有人可以建议我在这里缺少什么吗?一篇论文或一些开始的想法......

提前致谢。

0 投票
1 回答
1295 浏览

math - 非维度化数学

我有一组我需要无量纲化的变量H, W, P, &的耦合方程。T有没有办法在 Mathematica 中实现这一点,因为事实证明手动操作很困难。

参数单位:a = /H/单位时间;b = /H/单位时间;B = /H/单位时间;theta = T/H/单位时间;ap = /P/单位时间;bp = /P/单位时间;up = /P/单位时间;v = /P/单位时间;L = W/P/单位时间;R = /T/单位时间;bt = /T/单位时间;phi = /T/单位时间;g = /W/单位时间;k = 常数。

0 投票
1 回答
363 浏览

indexing - 地理空间索引的划分查询

我正在研究使用类似 geohash 的索引存储地理空间信息,也许使用希尔伯特曲线。我的问题是关于如何最好地拆分此类索引上的区域查询。

例如,本文展示了如何将一个区域查询拆分为多个查询,以避免查询表现出较差局部性的范围(参见图)。如果您想使用 Z 曲线(如普通 geohash)通过单个查询来搜索圆形区域,您将不得不查询整个左下象限,它只有我们关注的区域的一小部分。

在这种情况下,最好将搜索拆分为几个查询,但是我无法找到有关如何最好地执行此操作的任何信息。是否有将这样的范围查询拆分为覆盖原始区域的较小范围的算法?

0 投票
1 回答
1074 浏览

machine-learning - 减少数据集的维数后,我得到负特征值

我在大型数据集上使用了降维方法(此处讨论:随机投影算法伪代码)。

将维度从 1000 减少到 50 后,我得到了我的新数据集,其中每个样本如下所示:

[1751。-360。-2069。...,2694。-3295。-1764.]

现在我有点困惑,因为我不知道负特征值应该是什么意思。有这样的负面特征可以吗?因为在还原之前,每个样本都是这样的:

3、18、18、18、126 ...

这是正常的还是我做错了什么?

0 投票
3 回答
639 浏览

cluster-analysis - 聚类:可变数据维度的训练数据集

我有一个包含 n 个数据的数据集,其中每个数据都由一组提取的特征表示。通常,聚类算法需要所有输入数据具有相同的维度(相同数量的特征),即输入数据 X 是由 n 个数据点组成的*d 矩阵,每个数据点具有 d 个特征。在我的例子中,我之前已经从我的数据中提取了一些特征,但是每个数据的提取特征的数量很可能是不同的(我的意思是,我有一个数据集 X,其中数据点的特征数量不同)。有什么方法可以调整它们,以便使用一些需要数据具有相同维度的常见聚类算法对它们进行聚类。

谢谢

0 投票
1 回答
881 浏览

machine-learning - 手写数字的散点图

我想创建一个手写数字 0 和 1 的散点图(http://yann.lecun.com/exdb/mnist/)。我取了 4 个样本,即两个 0 和两个 1。

每个手写数字的像素值都具有 1 维交叉 778 矩阵。

现在我想在二维中对这些数字进行散点图,以检查它们是否可分离。

我尝试在 R 中绘制这些图,但最终的图只是点的混合。我应该如何绘制才能使每个数字的散点图看起来都不同。我在绘图时是否朝着正确的方向前进?

请指教。

0 投票
2 回答
53 浏览

constraints - 这个图嵌入是否可行?它有名字吗?

我想将一个无向图投影到二维平面中,这样:

  1. 欧几里得距离保留了逐步距离(即如果A和B之间的最短路径短于C和D之间的最短路径,那么A和B之间的欧几里得距离小于A和B之间的欧几里得距离)

  2. 欧几里得距离和逐步距离之间的最小差异被最小化。理想情况下,如果没有唯一的最小值,则生成或描述一组解决方案。

如果这是不可能的,那么图上使之成为可能的最小约束集是什么?我一般对这个问题很感兴趣,尽管目前我希望它是一个有限晶格,并去除了它的最小值。

0 投票
1 回答
5738 浏览

matlab - How to use Linear Discriminant Analysis for projection in MatLab?

Is it possible to project a multidimensional data to a 2D map using LDA? It seems that the tool Matlab provided does not provide such functions...

Thanks for reply. My data now is having 6 classes, so does it mean that if I have 6 classes, I can only reduce it to 5 dimensions? Or can it be done in a similar way with PCA, which takes the top 2 eigenvalues, and use these 2 for projection? The PCA does not quite work for my problem as an unsupervised approach, so I am wondering if LDA might help.

0 投票
1 回答
3090 浏览

image-processing - 图像的降维方法

我正在尝试使用Matlab Toolbox for Dimensionality Reduction来减少一组图像的尺寸。问题是:我对降维知之甚少。所以我通过反复试验尝试每一个,将数据集传递给函数。到目前为止,我已经尝试了 6,PCA 正在返回一个带有复数的矩阵。其他的是冷冻matlab。哪些图像缩小方法适用于图像?