问题标签 [pca]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
12187 浏览

r - R中的主成分分析

使用该prcomp函数,我如何使用从同一数据集上的数据集派生的无监督主成分拆分为测试和训练?

0 投票
0 回答
4087 浏览

r - 计算主成分分析的特征向量和特征值

我正在尝试对一些 3D 扫描执行主成分分析,但是在计算和使用特征值和特征向量时我被卡住了。

扫描采用 .obj 文件格式。

有 6449 个向量、12894 个面和 115 次扫描。我的理解是,由于数据是 3D 的,我无法使用内置princomp功能,而且由于数据量大,我可能会在笔记本电脑上遇到一些内存问题,最后我想学习手动进行 PCA。

我相信执行此操作有 5 个阶段

  1. 计算平均 3D 扫描。酒吧X
  2. 从每个扫描中减去平均值。Xa - BarX = 酒吧 Xa
  3. 创建一个 Bar Xa * Bar Xa = Ma 的矩阵
  4. 计算 Ma 的特征值和特征向量。帕
  5. 将平均形状 BarX 添加到 Pa 以根据特征值和特征向量查看形状变形

我希望我没有过度简化这一点,但由于我不是数学家/统计学家,这是我目前的理解。

第 1 阶段和第 2 阶段我已经完成了,因为它们很简单,但我对以下阶段感到困惑。

由于我担心遇到内存问题,我将分别为 x、y 和 z 创建一个矩阵。所以我正在创建一个 6449x6449 的对角矩阵,其中 x * x。这是我用来为第一次扫描的 x 创建矩阵的代码。

我对 x、y 和 z 执行此操作。然后使用计算特征值和特征向量

在这个阶段我不确定我所做的是否正确?但是从这里开始,我不知道如何将特征向量和特征值组合成一种格式,我可以将它们添加到 BarX 上以查看形状变形?

如果有人有建议或指导,将不胜感激。

提前致谢。

0 投票
2 回答
335 浏览

r - 如何在 R 中跳过前几个主成分进行 PCA 图?

我有一些数据要在其上进行 PCA 绘图。但是,前两个主成分完全是由于 3 个异常值样本(共 32 个),我想跳过这些,只从第 3 个开始绘制主成分。这是可能的,还是我必须做一些计算才能从数据中减去前两个主成分,然后绘制余数?

0 投票
1 回答
3384 浏览

c# - 8 X 8 矩阵的特征向量和特征值

我有一个 8 x 8 浮点数矩阵,需要从中计算特征向量和特征值。这是为了使用 PCA(主成分分析)减少特征,如果通过传统方法完成,这是一项非常耗时的工作。我尝试使用幂法,Y = C*X,其中 X 是我的 8 X 8 矩阵。

我知道这是不正确的,但无法弄清楚。我需要帮助来使用幂法或更有效的计算方法。

提前致谢。

0 投票
1 回答
847 浏览

visualization - 支持向量机背后的基本理念

我正在通过阅读大量材料来研究支持向量机 (SVM)。但是,似乎大部分都集中在如何通过使用线性、多项式、RBF/高斯等多个内核映射输入的 2D 数据来对其进行分类。

我的第一个问题是,SVM 可以处理高维(nD)输入数据吗?

根据我的发现,答案是YES!

如果我的理解是正确的,nD 输入数据将是

  1. 在希尔伯特超空间中构造,那么这些数据将是
  2. 通过使用某些方法(例如 PCA ?)将其组合在一起/将其投影回 2D 平面来简化,以便
  3. 内核方法可以将其映射为适当的形状,例如直线或曲线可以将其分成不同的组。

这意味着大多数指南/教程都集中在步骤 (3) 上。但是如果输入数据大于 2D,我检查过的一些工具箱无法绘制。投影到二维后的数据如何?

如果没有数据的投影,他们如何分类呢?

我的第二个问题是:我的理解正确吗?

0 投票
1 回答
1968 浏览

r - General questions about Principal Component Analysis (PCA) in R

I would like to produce some nice PCA plots in R. As usual, in R, there are several ways to perform a principal component analysis. I found so far 3 different ways of how to calculate your components and 3 ways of plotting them. I was wondering whether people who are familiar with these functions can give me some advise on the best combination of functions to produce the following plots:

  • Scores Plot
  • Loadings Plot
  • Histogram / Bar chart of the variances explained by each principal component

My research on functions and plots used for PCA in R resulted in:

Functions:

  • pca.xzy()
  • prcomp()
  • princomp()
  • dudi.pca()

Plot:

  • plot.pca (this one seems to belong to the function pca.xzy())
  • ggplot2
  • plot
  • biplot

I also found the following webpage:

http://pbil.univ-lyon1.fr/ade4/ade4-html/dudi.pca.html

And I was wondering if you can draw those circles and lines starting from each of the circle centers with one of the other functions mentioned above as the function dudi.pca from the ade4 package seems to be the most complicated one.

0 投票
1 回答
3960 浏览

pca - scikit-learning 如何对 libsvm 格式的稀疏数据执行 PCA?

我正在使用 scikit-learning 做一些降维任务。我的训练/测试数据采用 libsvm 格式。它是一个有 50 万列的大型稀疏矩阵。

我使用 load_svmlight_file 函数加载数据,并通过使用 SparsePCA,scikit-learning 抛出输入数据错误的异常。

如何解决?

0 投票
1 回答
642 浏览

matlab - 使用 eigs 或 eig 减小尺寸

我有一个 1024x704x256 的图像,我已将其重组为 2D 矩阵。每行代表一个能量通道,每列代表一个像素。我正在执行 PCA 以使用代码减少频段数量:

其中 A = 均值调整后的 2D 数据集,V = 特征向量矩阵, D = 特征值矩阵。

我的问题是 V 和 D 的输出(使用 eigs 或 eig)自动按升序排列。在较小的数据集上使用这些函数之前,我没有遇到过这个问题。我需要知道哪些向量/值对对应于矩阵 A 中的行以进行进一步分析。有任何想法吗?

0 投票
3 回答
1799 浏览

machine-learning - 由主特征向量的特征值给出的主成分方差

主成分分析

我想知道为什么投影到主成分上的数据具有与主特征向量对应的特征值的方差?

我在教科书中找不到解释。

0 投票
3 回答
5319 浏览

java - 人脸识别中的主成分分析-python/java

我想通过使用主成分分析算法来执行面部识别。我想自己在 python 或 java 中实现该算法,但是我不确定从哪里开始。希望有一些代码示例/教程/参考可以帮助我入门。