问题标签 [prcomp]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

37 问题

0 投票

0 回答

75 浏览

r - 如何在 R 中使用行标签标记双图 - 现在已解决

我是 R 的初学者，使用 prcomp 执行 PCA，除了默认行号之外，无法获得任何标记的点。我的档案是不同地点的物种存在和缺失。例如在这里，我设置了一个小测试文件，我想使用 SITES 列中的标签来标记我在 biplot 中的点。

然后当我尝试设置行名时，我收到以下错误消息

但是我可以成功运行 PCA，但没有我需要 prcomp biplot的标签

我检查了行名，没有一个是重复的。我在设置行名时做错了什么？我搜索了 stackoverflow 和其他网站，并看到了类似的问题。我已经尝试了建议的解决方案，但未能解决问题。我希望这是显而易见的事情，但经过长时间的搜索，我被难住了。

解决方案是在 PRCOMP 和 BIPLOT 指令模型之间设置行名 <-prcomp(testfile2[,-1],scale=TRUE)

摘要（型号）

行名<-testfile2$SITES

双标图（模型）

r row names prcomp

2021-05-04T12:58:57.247

0 投票

2 回答

87 浏览

r - 无法将 PCA prcomp 中的标签从行号更改为站点名称

我已按照https://stackoverflow.com/questions/38900698/how-to-change-labels-from-pca-using-prcomp-to-sample-names中的答案进行操作，但无法使其正常工作。我设置了一个 7 列 12 行的虚拟文件（称为 tf4）并将其导入 R Studio。前几行看起来像这样

head(tf4)

然后我将行名设置为第 7 列

#将行名设置为第7列

并收到警告信息

警告消息：不推荐在 tibble 上设置行名称。

当我再次使用 head(tf4) 进行检查时，行名尚未重置并保持不变。

但是当我在 R studio 'environment' 中查看文件时，它已经重置了行名

环境中文件的剪辑和草图图像

但是，当我运行 prcomp

图中未使用站点标识符

双图的剪辑和草图视图

我无法解决这个问题。似乎将行名称设置为第 7 列无法正常工作。

我错过了一步吗？
在 prcomp 中我需要额外的指令吗？

r prcomp biplot

2021-06-19T15:22:47.977

0 投票

1 回答

118 浏览

r - 如何理解“prcomp”结果？'$ sdev'/'$ rotation'/'$ center'/'$ scale $ x'

如何理解“prcomp”结果？运行以下代码后，我们得到 prcomp 结果“res.pca”。它包括' $ sdev'/' $ rotation'/' $ center'/' $ scale $ x'，如何理解它们。谢谢。

r prcomp

2021-10-08T01:56:57.517

0 投票

0 回答

23 浏览

r - 如何对不同的放电站进行主成分分析？

这对我来说是一个概念性问题。我有车站排放数据。一个可重现的例子如下所示：

现在我需要对上述基于站的数据集执行 PCA。我执行它的方式如下：

但我的同事告诉我，这是在空间分布的站点上执行 PCA 的错误方法。根据他们的说法，以下应该是结果的正确格式pca：

因此，我应该拥有与每年的站点数量相同的 PC 数量。我不确定如何通过调整数据框格式或prcomp我不知道的东西来获得所需的结果。任何帮助表示赞赏。谢谢你。

r dataframe statistics pca prcomp

2021-10-20T05:47:25.300

0 投票

1 回答

29 浏览

r - prcomp() 缺失值插补的最佳选择

我有近 1,000,000 个基因座（行）的大约 200 个个体基因组（列）的基因型数据集。由于测序数据不佳，大多数行包含 1-2 个缺失的基因型。

如果我使用

我的新数据框只包含几千行，这导致数据丢失比通过每行输入一两个缺失值得到的数据要大得多。我一直在网上寻找如何使用与 na.option 和 prcomp() 关联的插补选项，但找不到示例。我想从最简单的方法开始，例如用中值或类似的东西替换 NA。

有人可以指导我在 prcomp 的上下文中如何执行此操作的示例吗？

r pca prcomp

2021-12-16T19:14:26.293

0 投票

1 回答

42 浏览

r - R中的PCA聚类和聚类分析

我正在尝试对包含调查结果的数据集执行 PCA。该调查是针对公司进行的（公司在行中），他们被问到多个问题（问题和答案在列中）。大多数问题都基于“请从一组 X 的答案 X = {1,2,3,4...} 中选择一个答案。有一些布尔值，但大部分答案有更多的变化。

我想做的是缩小维度并寻找公司之间的相似之处。为此，我想执行 PCA。

我将使用的数据集可以从以下网址下载：https ://www.kaggle.com/jakubdbrowski/datapca

我需要删除没有任何信息的第一列。数据集是事先清理和准备好的。现在我可以执行 PCA。

现在我想寻找可以从我的数据中获得的集群数量。

看起来很难在这个特定的数据集中找到集群。

但是，我想继续分析以完成整个分析过程。一旦我收到更新的数据，也许结果会更好。

所以我将按照建议创建两个集群。

在这一点上，我的问题来了。现在，我想尝试查看集群并确定哪些负载负责集群并表征两个集群？

我还想问一下，是否可以确定最重要的负载，减少它们的数量（现在有 150 个，这使得图表过于复杂）并以更清晰的方式绘制它们？下面的两张图都很混乱。

非常感谢您！

r pca prcomp

2022-01-07T17:12:55.043

0 投票

0 回答

26 浏览

r - 使用 R 对复杂数据进行 PCA 分析

我正在尝试对填充有复数的数据框进行一些主成分分析。我正在使用 R，并尝试了基本包prcomp()功能和PCA()来自 factominer 的功能。

该prcomp()函数运行，但是当我尝试使用ggbiplot()可视化输出时出现以下错误：

使用时PCA()我得到：

（对我所有的变量重复）。

问题仅仅是可视化步骤，还是我错过了关于复杂变量的 PCA 的更基本的东西？

任何帮助将不胜感激！

r pca complex-numbers ggbiplot prcomp

2022-01-21T15:56:39.337

1 2 3 4 5 6 7 8 9 10

问题标签 [prcomp]

Reference