问题标签 [pca]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
11 回答
98774 浏览

python - Python中的主成分分析

我想使用主成分分析(PCA)进行降维。numpy 或 scipy 是否已经拥有它,还是我必须自己使用numpy.linalg.eigh

我不只是想使用奇异值分解 (SVD),因为我的输入数据是相当高维的(~460 维),所以我认为 SVD 会比计算协方差矩阵的特征向量慢。

我希望找到一个预制的、经过调试的实现,它已经为何时使用哪种方法做出了正确的决定,并且可能会进行我不知道的其他优化。

0 投票
1 回答
848 浏览

r - 当您在 R 中进行主成分分析时,如何判断首先标准化您的数据矩阵是否更好?

我试图在 R 中进行主成分分析。我相信有两种方法可以做到这一点。一种是立即进行主成分分析,另一种方法是首先使用 s = scale(m) 标准化矩阵,然后应用主成分分析。
我如何判断哪个结果更好?我应该特别关注哪些价值观。我已经设法找到 eigenvalues 和 eigenvectors ,使用这两种方法的每个特征向量的方差比例。

我注意到没有标准化的第一个 pca 的方差比例具有更大的值。它有什么意义吗?不总是这样吗?

最后,如果我应该预测一个变量,即权重,我应该在进行主成分分析时从我的数据矩阵中删除变量,即权重吗?

0 投票
1 回答
22161 浏览

r - 如何在 R 中拟合具有两个主成分的线性回归模型?

假设我有一个数据矩阵 d

那么这应该适合线性回归模型吧?

但后来我得到这个错误:

我想那里有一个包可以自动执行此操作,但这也应该有效吗?

0 投票
1 回答
1649 浏览

r - 如何在 R 中显示所有样本主成分图?

我注意到 R 中有一些东西,比如pc将 PCA 应用于数据矩阵的结果,并且 pc$x是我的样本主成分矩阵。

当 try 时plot(pc$x),它只会绘制第一个主成分 ( pc1) 与第二个 ( pc2),但我实际上有超过 2 个主成分。我如何显示所有这些?

0 投票
2 回答
990 浏览

math - 主成分和因子分析

我对主成分和因子分析有一些疑问。

对于PCA,特征值是从协方差矩阵还是相关矩阵É计算的重要吗?FA呢,如果我使用协方差或相关矩阵É,特征值的结果是否相同

0 投票
4 回答
12139 浏览

matlab - MATLAB 中的 SVM 可视化

在 Matlab 中执行 SVM 训练后,如何可视化 SVM 分类?

到目前为止,我只训练了 SVM:

0 投票
3 回答
9196 浏览

matlab - MATLAB 内存不足,但不应如此

我正在尝试使用已标准化的PCA对我的数据应用 PCA。princomp(x)

数据是<16 x 1036800 double>。这运行了我们的内存,这也是意料之中的,除了这是一台新计算机,这台计算机拥有 24GB 的 RAM 用于数据挖掘。MATLAB 甚至在内存检查中列出了可用的 24GB。

MATLAB 在执行 PCA 时实际上是否内存不足,或者 MATLAB 是否没有充分利用 RAM?任何信息或想法都会有所帮助。(我可能需要增加虚拟内存,但假设 24GB 就足够了。)

0 投票
1 回答
1940 浏览

php - PCA 上的 C++ 与 PHP 性能

我可以知道 C++ 还是 PHP 在运行 PCA(主成分分析)方面更有效?

我正在开发一个基于 Web 的系统,该系统使用 php 获取上传的图像,然后处理图像,以便我可以使用 PCA 分析图像,以确定图像是否与已存储在数据库中的另一个图像匹配。

但我想知道使用哪种语言C++ 或 PHP 或任何其他更好的替代方案)以获得更好的性能来完成PCA任务。

tq~

0 投票
1 回答
404 浏览

algorithm - PCA:这个算法有什么问题?

有人可以确认或更正这个用于计算第一个主成分的维基百科算法吗?我想要一个简单的 D 中 PCA 实现,它没有任何现有的 PCA AFAIK 库。我已经尝试过实现这一点,但我在简单示例上的结果似乎与我从 R 或 Octave 获得的内容不匹配。我很确定这不是一个实现错误,因为我已经多次检查了我的实现,甚至从头开始重写它,这是一个非常简单的算法。

0 投票
5 回答
3204 浏览

algorithm - 如何在 500,000 个点的 100 维空间中找到最近的 2 个点?

我有一个在 100 维空间中有 500,000 个点的数据库,我想找到最接近的 2 个点。我该怎么做?

更新:空间是欧几里得,对不起。并感谢所有的答案。顺便说一句,这不是家庭作业。