问题标签 [factor-analysis]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 为因子分析计算 omega:NA 结果
我试图在探索性因素分析后计算欧米茄估计,以估计我发现的组件的可靠性。使用包中的omega()
函数psych
我得到这个输出:
这就是我调用函数的方式:
omega(df[,items],nfactors=3)
搜索指导后,我找不到为什么没有为第三个因素计算欧米茄。我不确定这是否与以下警告消息之一有关:
r - Getting data frame from loadings of factor analysis (fa function in psych)
I have a data frame such as follows:
I am running a factor analysis with the fa
funciton from the psych
package:
This results in the following output:
I would like to save the table with MR1 and MR2 as a data frame. Does anyone know how could this be done? Thank you.
r - R中有序分类数据的因子分析的因子得分
我无法从对有序分类数据的探索性因子分析中计算因子得分。我已经设法评估了要绘制多少个因子,并使用 psych 包运行因子分析,但无法弄清楚如何为单个参与者获取因子分数,并且在网上找不到太多帮助。这是我卡住的地方:
编辑:我找到了一种使用 irt.fa() 和 scoreIrt() 获取分数的方法,但它涉及将我的有序类别转换为数字,所以我不确定它是否有效。任何建议将不胜感激!
factor-analysis - 如何定义并行分析中的因子数
我对我的数据进行了探索性因子分析(主轴因子分解),并想确定要提取的因子数量。霍恩的平行分析。
但是我有两个问题:
并行分析建议提取 1 个因子,但是该图显示了我的“FA 实际数据”和“FA 模拟数据”线的多个交点。我不明白为什么它只是一个因素(第一个交叉点)然后......这个图看起来不像其他平行分析图的典型。
为什么要提取的因子数量会随着我陈述的观察次数(n.obs)而变化?我的意思是我只是将观察数从 50 更改为 500(这是一个谎言),但是并行分析建议提取 5 个因素而不是 9 个。我不明白为什么....
非常感谢您提供任何有用的提示。瓦莱丽
fa.parallel(cor(My_Data), n.obs = 50, fa="fa", fm="pa")
并行分析表明因子数 = 1,分量数 = NA
python - Python中的验证性因子分析
是否有在 python 中执行验证性因子分析的包?我发现了一些可以在 python 中执行探索性因子分析(scikitlearn、factor_analyzer 等),但我还没有找到一个可以执行 CFA 的包。
sas - 当一个目标有多个数据时,如何进行因子分析?
20 名受访者 -> 100 份问卷(每份 10 个相同的问题)关于 5 个品牌
每个受访者 -> 5 份问卷(5 个品牌)
我应该预处理数据(例如,根据品牌计算平均值,新输入只有 5 个数据:品牌 1 到 5 数据)还是应该直接做 FA?
顺便说一句,不问编码,只是纯粹的统计问题。
r - lavaan 是从 EM 算法开始,然后过渡到准牛顿法吗?
当我使用 FIML 在 lavaan 中执行以下 CFA 时,似乎该算法首先使用 EM,然后使用 NLMINB(准牛顿)。我想我知道如何使用参数控制 NLMINB 优化的各个方面control
,但我不知道如何或是否可以控制 EM 部分。这是一个例子。
所以很明显,EM 是在 NLMINB 之前完成的。所以,首先我想知道为什么。其次,我可以修改关于这个初始 EM 步骤的任何内容吗?我尝试使用em
参数,如em.fx.tol
,em.iter.max
和em.dx.tol
, 没有任何效果。
或者
但无论哪种情况,EM 迭代都超过 5。
classification - 降维、归一化、重采样、k-fold CV……按什么顺序?
在 Python 中,我正在研究旅游保险欺诈检测的二元分类问题。这是我的数据集的特征:
- 包含具有 20 个特征的 40,000 个样本。经过一次热编码后,特征数为 50(4 个数字,46 个分类)。
- 大多数未标记:在 40,000 个样本中,33,000 个样本未标记。
- 高度不平衡:在 7,000 个标记样本中,只有 800 个样本(11%)是阳性(欺诈)。
指标是精度、召回率和 F2 分数。我们更注重避免误报,因此高召回率是值得赞赏的。作为预处理,我使用 SMOTE-NC 对阳性案例进行过采样,它也考虑了分类变量。
在尝试了包括自我训练的半监督学习和标签传播/标签传播等在内的几种方法后,我获得了很高的召回率(训练时 80%,测试时 65-70%)。但是,我的精度分数显示了一些过度拟合的痕迹(训练时 60-70%,测试时 10%)。我知道训练的精度很好,因为它是重新采样的,而测试数据的精度很低,因为它直接反映了测试数据中类别的不平衡。但是这个精度分数低得令人无法接受,所以我想解决它。
因此,为了简化模型,我正在考虑应用降维。我发现了一个名为 prince
FAMD(混合数据因子分析)的软件包。
问题 1:我应该如何进行标准化、FAMD、k-fold 交叉验证和重采样?我下面的方法正确吗?
问题2:该包prince
没有类似fit
或transform
类似的方法Sklearn
,所以我无法执行下面描述的第3步。fit
还有其他transform
适合 FAMD 的好套餐吗?还有没有其他好的方法可以减少这种数据集的维数?
我的做法:
- 做 k 个折叠并隔离其中一个进行验证,其余的用于训练
- 规范化训练数据和转换验证数据
- 在训练数据上拟合 FAMD,并转换训练和测试数据
- 使用 SMOTE-NC 仅对训练数据重新采样
- 训练任何模型,评估验证数据
- 重复 2-5 k 次并取精度的平均值,召回 F2 分数
*我也很感激任何关于我解决这个问题的整体方法的建议
谢谢!
r - 我想将不同指标的因子得分放在一个数据框中进行因子得分路径分析
我正在做因子得分路径分析
我正在对潜在变量进行因子得分路径分析,因此我进行了因子得分分析以生成因子得分。现在我想生成一个方差-协方差矩阵,所以我想把我生成的因子分数放到一个数据框中,以便能够这样做。问题是指标,我的论点意味着不同的行数。
data.frame 中的错误(bcscores$scores,dvscores$scores,fcscores$scores,:参数暗示不同的行数:101、102、99、103、104、100
有人可以帮我解决这个问题吗?谢谢
r - 用于执行 Q 模式因子分析的 R 函数或包
我正在使用 factanal() 对几个矩阵(每个矩阵代表一个位置)进行因子分析,其中包括几个案例(行)和几个测量变量(列)。有了这个,我可以研究变量如何在因子双图上分布。现在我想使用“Q 模式”(例如在 Statistica 中)来研究所有矩阵的所有案例(例如行)如何分布在因子双图中。是否有 R 函数/包可以做到这一点?
我一直在搜索,找到了“qrfactor”包,但是已经从RCRAN中删除了,不知道是否可靠。