问题标签 [prcomp]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 如何在 R 中使用行标签标记双图 - 现在已解决
我是 R 的初学者,使用 prcomp 执行 PCA,除了默认行号之外,无法获得任何标记的点。我的档案是不同地点的物种存在和缺失。例如在这里,我设置了一个小测试文件,我想使用 SITES 列中的标签来标记我在 biplot 中的点。
然后当我尝试设置行名时,我收到以下错误消息
但是我可以成功运行 PCA,但没有我需要 prcomp biplot的标签
我检查了行名,没有一个是重复的。我在设置行名时做错了什么?我搜索了 stackoverflow 和其他网站,并看到了类似的问题。我已经尝试了建议的解决方案,但未能解决问题。我希望这是显而易见的事情,但经过长时间的搜索,我被难住了。
解决方案是在 PRCOMP 和 BIPLOT 指令模型之间设置行名 <-prcomp(testfile2[,-1],scale=TRUE)
摘要(型号)
行名<-testfile2$SITES
双标图(模型)
r - 无法将 PCA prcomp 中的标签从行号更改为站点名称
我已按照https://stackoverflow.com/questions/38900698/how-to-change-labels-from-pca-using-prcomp-to-sample-names中的答案进行操作,但无法使其正常工作。我设置了一个 7 列 12 行的虚拟文件(称为 tf4)并将其导入 R Studio。前几行看起来像这样
head(tf4)
然后我将行名设置为第 7 列
#将行名设置为第7列
并收到警告信息
警告消息:不推荐在 tibble 上设置行名称。
当我再次使用 head(tf4) 进行检查时,行名尚未重置并保持不变。
但是当我在 R studio 'environment' 中查看文件时,它已经重置了行名
但是,当我运行 prcomp
图中未使用站点标识符
我无法解决这个问题。似乎将行名称设置为第 7 列无法正常工作。
我错过了一步吗?
在 prcomp 中我需要额外的指令吗?
r - 如何理解“prcomp”结果?'$ sdev'/'$ rotation'/'$ center'/'$ scale $ x'
如何理解“prcomp”结果?运行以下代码后,我们得到 prcomp 结果“res.pca”。它包括' $ sdev
'/' $ rotation
'/' $ center
'/' $ scale
$ x
',如何理解它们。谢谢。
r - 如何对不同的放电站进行主成分分析?
这对我来说是一个概念性问题。我有车站排放数据。一个可重现的例子如下所示:
现在我需要对上述基于站的数据集执行 PCA。我执行它的方式如下:
但我的同事告诉我,这是在空间分布的站点上执行 PCA 的错误方法。根据他们的说法,以下应该是结果的正确格式pca
:
因此,我应该拥有与每年的站点数量相同的 PC 数量。我不确定如何通过调整数据框格式或prcomp
我不知道的东西来获得所需的结果。任何帮助表示赞赏。谢谢你。
r - prcomp() 缺失值插补的最佳选择
我有近 1,000,000 个基因座(行)的大约 200 个个体基因组(列)的基因型数据集。由于测序数据不佳,大多数行包含 1-2 个缺失的基因型。
如果我使用
我的新数据框只包含几千行,这导致数据丢失比通过每行输入一两个缺失值得到的数据要大得多。我一直在网上寻找如何使用与 na.option 和 prcomp() 关联的插补选项,但找不到示例。我想从最简单的方法开始,例如用中值或类似的东西替换 NA。
有人可以指导我在 prcomp 的上下文中如何执行此操作的示例吗?
r - R中的PCA聚类和聚类分析
我正在尝试对包含调查结果的数据集执行 PCA。该调查是针对公司进行的(公司在行中),他们被问到多个问题(问题和答案在列中)。大多数问题都基于“请从一组 X 的答案 X = {1,2,3,4...} 中选择一个答案。有一些布尔值,但大部分答案有更多的变化。
我想做的是缩小维度并寻找公司之间的相似之处。为此,我想执行 PCA。
我将使用的数据集可以从以下网址下载:https ://www.kaggle.com/jakubdbrowski/datapca
我需要删除没有任何信息的第一列。数据集是事先清理和准备好的。现在我可以执行 PCA。
现在我想寻找可以从我的数据中获得的集群数量。
看起来很难在这个特定的数据集中找到集群。
但是,我想继续分析以完成整个分析过程。一旦我收到更新的数据,也许结果会更好。
所以我将按照建议创建两个集群。
在这一点上,我的问题来了。现在,我想尝试查看集群并确定哪些负载负责集群并表征两个集群?
我还想问一下,是否可以确定最重要的负载,减少它们的数量(现在有 150 个,这使得图表过于复杂)并以更清晰的方式绘制它们?下面的两张图都很混乱。
非常感谢您!
r - 使用 R 对复杂数据进行 PCA 分析
我正在尝试对填充有复数的数据框进行一些主成分分析。我正在使用 R,并尝试了基本包prcomp()
功能和PCA()
来自 factominer 的功能。
该prcomp()
函数运行,但是当我尝试使用ggbiplot()
可视化输出时出现以下错误:
使用时PCA()
我得到:
(对我所有的变量重复)。
问题仅仅是可视化步骤,还是我错过了关于复杂变量的 PCA 的更基本的东西?
任何帮助将不胜感激!