问题标签 [dimensionality-reduction]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
1799 浏览

machine-learning - 由主特征向量的特征值给出的主成分方差

主成分分析

我想知道为什么投影到主成分上的数据具有与主特征向量对应的特征值的方差?

我在教科书中找不到解释。

0 投票
1 回答
1142 浏览

matlab - 如何对非常大的数据集进行潜在语义分析

我正在尝试对一个非常大的数据集(大约 50,000 个文档和超过 300,000 个单词/术语)运行 LSA 或主成分分析,以降低维度,以便我可以在二维中绘制文档。

我在 Python 和 MATLAB 中尝试过,但由于数据集的体积,我的系统在任一实例中都内存不足并崩溃。有谁知道我可以如何减少负载,或者做某种可以更快更有效地运行的近似 LSA/PCA?我的总体目标是在 300k 单词上进行大幅降维。

0 投票
2 回答
726 浏览

pca - 用 PCA 决定降维

我有二维数据(我有一个零均值归一化数据)。我知道它的协方差矩阵、特征值和特征向量。我想决定是否将维度减少到 1(我使用主成分分析,PCA)。我该如何决定?有什么方法论吗?

我在找…… 就像如果你看这个比率,如果这个比率很高,那么继续降维是合乎逻辑的。

PS 1: PoV(变化比例)是否代表它?

PS 2:这是一个答案:https ://stats.stackexchange.com/questions/22569/pca-and-proportion-of-variance-explained它是测试它的标准吗?

0 投票
1 回答
565 浏览

pca - 有没有好的图书馆可以快速做 NMF?

我有一个稀疏矩阵,其形状为570000*3000。我试过nima做 NMF(使用默认的 nmf 方法,并设置max_iter为 65)。但是,我发现 nimfa 非常慢。有没有人使用更快的库(可以被 Python/R 使用)或软件来做 NMF?

0 投票
2 回答
1004 浏览

string - 通过删除连续重复来减少字符串长度

我有一个包含 2 个字段的 R 数据框:

我想通过只保留字母而不是重复的重复字母来简化带有重复字母的单词:

例如:AAAAABBBBB应该给我ABABCAAABBBDDD应该给我ABCABD

任何人都知道如何做到这一点?

0 投票
1 回答
186 浏览

pca - 推荐降维算法(PCA不适合)

对于这个应用程序,我想使用一种降维算法,这样给定数量的组件都可以解释数据中相同数量的方差。

因此,主成分分析不适合,因为解释的方差从第一个主成分到每个后续主成分急剧下降。

我可以使用哪些算法?

0 投票
1 回答
150 浏览

matlab - 我怎么知道哪些维度是主要组成部分?

我使用matlab的princomp函数做PCA。根据我的理解,我可以检查潜在的来决定我需要多少个维度。

通过使用 trainMatrix = coeff(:,1:10) (我选择前 10 个维度)和 newData = data*trainMatrix,我可以获得减少的数据。

但是我怎么能知道哪个维度减少了,剩下的10个维度呢?

我的意思是如果我有 30 个特征,我可以在 princomp 之后弄清楚我保留了哪 10 个特征(原始数据的列索引)吗?

谢谢。

0 投票
1 回答
1455 浏览

matlab - How to add an image thumbnail as(or beside) a plot marker in MATLAB?

I am running Isomap Dimensionality reduction in MATLAB on a series of images. I want to plot the image's thumbnail beside the point on the manifold corresponding to it.

Examples of manifolds

I am currently using 2 differnt isomaps http://isomap.stanford.edu/ and http://robotics.cs.brown.edu/projects/stisomap/ .

0 投票
1 回答
275 浏览

neural-network - 使用 SOM 降低数据的维度

作为学校项目的一部分,我不得不阅读 Steven Lawrence 的一篇关于使用 SOM 和 CCN 检测人脸的论文。对于那些好奇的人,这里的论文:http ://clgiles.ist.psu.edu/papers/UMD-CS-TR-3608.face.hybrid.neural.nets.pdf

在论文的第 12 页,Lawrence 描述了他如何使用 SOM 来降低人脸数据的维度。但是,我不明白这是如何工作的。在此示例中,Lawrence 使用 5x5x5 SOM,输入向量为 25D。如果我的理解是正确的,那么当训练过程完成时,你会留下一个 25D 向量,连接到网络中的每个神经元。那么,这如何减少数据的维度呢?自组织地图上的降维数据到底在哪里?我在很多地方进行了研究,但由于某种原因,我找不到这个问题的答案。由于这个问题已经困扰了我一段时间,如果有人可以为我回答,将不胜感激。

0 投票
2 回答
842 浏览

matlab - 如何评价降维技术?

我有一个二进制形式的 NxM 数据集。我在上面应用了各种维度技术,并绘制了前两个维度。这就是我如何直观地了解该技术是否适合我的数据集。是否有更合适/方法/启发式/正式的方法来测试我使用的降维技术的适用性?