问题标签 [factominer]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 使用 fviz_pca 在 Biplot 上添加圆圈以将具有第二个因素的个人分组
谢谢你读我。我是 R 新手,所以我迷路了:如何在使用 fviz_pca 制作的双图上添加由第二个因素定义的组圆?我有这张表,并想应用 PCA 来获得一个双标图,其中个人按“UsoReg”(土地使用)因子分类(着色)(直到这里都很好),但我也想添加圆圈(或一些椭圆形)用第二个因素包围(组)个人,根据“Estacion”(一年中的季节)列命名,但我不知道该怎么做。那么,如何在使用 FactoMiner 制作的 Biplot 上添加圆圈以通过第二个因素包围(分组)个人?(第一个因素是“UsoReg”,并通过fill.ind
功能,第二个因素是“Estacion”,我不知道如何根据他们的“Estacion”类绘制圆圈来分组/包围个人)。我想在 3 个不同的土地利用类别(CoigueIX、MixtaIX、AgricolaIX)上可视化 3 个不同的季节(Estacion:Otono、Invierno、Primavera),谢谢。我使用以下代码:
跑
返回
谢谢!
r - HCPC 和 PCA:如何将补充个体分配到集群?
背景:我正在尝试 1)基于某些个体定义集群,以及 2)将其他个体分配给定义的集群。
已完成的工作:我使用FactoMineR
函数PCA()
并HCPC()
根据 Husson, F., Josse, J., Pages, J., 2010 描述的工作流程。主成分方法 - 层次聚类 - 分区聚类:我们为什么需要选择可视化数据?技术报告 – Agrocampus 17。
问题:可以分配每个补充个体(PCA(..., ind.sup =***)
层次聚类分析中定义的集群?
类似的问题:这个问题已经在 stackoverflow 上被问过了,但那是 5 年前的事了,答案不适合 HCPC 工作流程。
请使用基本 R 数据集在下面的一些代码中找到mtcars
:
预期输出:预期输出是这样的,其中补充个体被分配到集群并明确标识:. 例如,将菲亚特 X-9 和 Lotus Europa(补充人员)分配到集群中,菲亚特 128。
r - MCA 使用 FactorMineR 库在 R 中输出多少个主成分?
我不确定 R 中 FactoMineR 库中 MCA() 函数的输出。
例如我想要 10 个组件,所以我运行以下代码:
ncp(代表维数)是否给了我 10 个组件?
r - 重复测量的降维:PCA?外交部?(FactoMiner)
我有一个重复测量样本,要求每个参与者在 5 年内完成一项睡眠调查(基线至随访的第 4 年)。每个调查项目都相当相关(例如,当您上床睡觉时与您的睡眠时间相关),因此我们有兴趣采用类似 PCA 的方法并使用每台 PC 上的负载来创建随时间变化的综合得分(例如,综合根据每个时间点的这些假设的“PC”“加载”得分)。然后,我们希望在混合模型中采用每个参与者的时变复合测量来预测我们感兴趣的纵向结果。
我们最初对所有数据(所有参与者和所有时间点)执行 PCA,但这里有一些假设。但是,经过进一步思考,我开始质疑 PCA 是否能够区分基于参与者或基于时间的可变性。因此,我正在寻找一种方法来对重复测量样本执行类似的降维方法。
根据我发现的一些以前的堆栈问题,看起来 MFA 可能是一个不错的选择。但是我在网上看到的所有例子都不包括纵向分析。
1. MFA 看起来是正确的方法吗?
2. 如果是这样,下面的代码是否正确library(FactoMineR)
下面是一个示例数据集,说明了我认为我会运行的结构和代码:
因此,对于每个参与者,我对变量 1 到 3 进行了多次测量。
根据 MFA 手册,我的预感是运行这样的代码来执行 MFA。我猜,这假设所有var1
, var2
,var3
变量都在它们自己的“组”中。
最后......是否res_MFA$ind$coord
给了我相当于每个维度的“加载”?
r - R中kmeans中心的层次聚类
我有一个庞大的数据集(200,000 rows * 40 columns)
,其中每一行代表一个观察值,每一列都是一个变量。对于这个数据,我想做hierarchical clustering
. 不幸的是,由于行数很大,所以使用我的计算机不可能做到这一点,因为我需要计算所有观察对的距离矩阵所以(200,000 * 200,000)
矩阵。
这个问题的答案建议首先使用kmeans
计算中心的数量,然后hierarchical clustering
使用库对这些中心的坐标执行FactoMineR
。
问题:应用相同的方法时,我不断收到错误消息!
#例子
但
r - 为什么 FactorMineR 中的 CA 函数告诉我选择了未定义的列?
我正在使用一个名为DataUniv的数据框,它由 13 个变量组成。当我尝试使用 FactoMineR 运行对应分析时:
它给我发回了这个错误:
我真的不明白为什么它会给我发回这种类型的错误,因为如果我运行这些列似乎是有效定义的:
它返回了一些好东西...
r - 如何使 klaR 的 greedy.wilks 函数在后 HCPC 数据帧上工作?
所以基本上我正在使用 klaR 对我通过来自 factomineR 的 HCPC 函数获得的数据帧执行 greedy.wilks。
这是我的起始数据框(我只对 1 到 15 个变量感兴趣):
我现在正在使用来自 factomineR 的 PCA 和 HCPC:
我得到一个新的数据框,其中包含从 HCPC 计算的集群列:
现在我想使用 greedy.wilks,我尝试了“默认”和“公式”的用法,但它们都返回错误:
我可能在某些事情上错了,但我找不到在哪里。
r - FactomineR 中的 HCPC:如何计算集群中的个体?
标题说明了一切。我在 FactomineR 中使用 factoshiny 进行了多重对应分析 (MCA),然后进行了 HPCP。我现在在我的 2 个维度上有 3 个集群。虽然 factoshiny 界面确实有助于轻松可视化和导航分析,但我无法找到一种方法来计算集群中的个体。此外,我很想将集群变量分配给我的数据集上的个人。使用 hclust 可以轻松执行这些操作,但它们的算法不适用于分类数据。
我现在想要一个具有 3 个级别的变量 data$cluster,以便我可以计算集群中的个人。