问题标签 [factor-analysis]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 因子分析中的错误 - 起始值
我有一个 = 1008 xp = 45 数据矩阵,我正在尝试使用 factanal() 函数对数据进行因子分析。无论我决定适应多少因素,我都会遇到相同的错误:“事实错误(rios,3,rotation =“varimax”):无法从这个起始值进行优化”
我已经尝试了几组唯一性起始值,使用 start 参数,即便如此,似乎没有一个适合。有人能帮我吗?
我的数据包括来自 45 条巴西河流(84 年 x 12 个月 = 1008 次观测)的每月流出量(以 m³/s 为单位)。河流是变量(p = 45)。我已附上包含此类数据的 .csv 文件的链接:
https://www.dropbox.com/s/swz1mqxmol7tofx/Rivers%20as%20variables%20%28csv%29.csv?dl=0
提前致谢!
scikit-learn - sklearn 中的因子分析:解释方差
scikit-learn 中的 PCA 有一个名为“explained_variance”的属性,它捕获每个组件解释的方差。对于 scikit-learn 中的 FactorAnalysis,我没有看到类似的情况。如何计算因子分析的每个组件解释的方差?
r - R(lavaan)中的CFA与序数数据 - 包括多变量相关性?
我想用序数数据计算验证性因子分析(CFA R
)lavaan
。数据来自一份问卷,包含按李克特量表结构的 16 个项目。
我假设 4 因子模型最适合我的数据。为了计算 CFA,我搜索了信息并在本文中找到了一些有用的建议。
建议使用 DWLS 估计和多变量相关。R
在使用该lavaan
软件包时,我已设法使用 DWLS 计算 CFA 。我发现在 M plus DWLS 估计或相同的 WLSMV 中使用polychoric correlation,不幸的是我从未使用过 M plus并且想使用R
,所以我想知道lavaan
它是否相同。
到目前为止,我这样计算 CFA:
我指定了一个模型(model.4),有 4 个因素(AV、AW、AB、AA),(每个因素有 4 个项目)
然后我用了这个"ordered"
函数,因为我的有序数据,lavaan
包里推荐的
这运作良好。我得到了一个包含所有相关拟合指数(CFI、RMSEA 等)的输出。现在我的问题是,如果这自动基于 M plus中的多面相关性?如果不是 - 我如何添加命令来使用多色相关?包中有一些lavaan
关于 polychoric correlation的信息lavCor
,但我不知道它是否对我的问题有用,不幸的是我不知道如何使用它。
我试过这样:
))
但是> summary(model.ord1, fit=T)
没有用。我没有收到任何结果。
总结一下:我的 CFA 是否自动基于多元相关性?如果没有,我该如何改变我的函数来实现多色相关?
r - R(lavaan):如何比较用 DWLS 估计的 CFA 模型(别名 WLSMV)
如何比较使用 DWLS / WLSMV 估计的两个 CFA 模型?
为了找出最适合我的数据的 CFA 模型,我将 DWLS 估计器用于序数数据lavaan
并指定了两个模型:
- 4-factor-model,即model.ordinalX
- 2-factor-model,即model.ordinalY
代码:
随后,我指定了 2 因子模型。比较这两者时,lavaan
返回错误。
代码:
警告信息是:
lav_test_diff_af_h1(m1 = m1, m0 = m0) 中的错误:lavaan 错误:m0 和 m1 中的无约束参数集不同。
(请注意:如果我使用正常的最大似然,我可以比较模型。)
我注意到输出存在差异。对于最大似然估计,输出中有 AIC 和 BIC 值,而 DWLS 输出中缺少这些值。这些似乎与比较相关,因为最大似然模型的比较输出包含这些值。
java - 如何使用以下数据计算主题的最佳理由...
我想获取/计算一个话题为什么在用户之间成为如此热门话题的原因。本主题是歌手/演员制作并上传到服务器的短视频,有一个可以观看该视频的移动应用程序,用户(粉丝)可以制作的数据如下:< /p>
- 眉毛(将由每个浏览此视频的人制作(多/用户))
- 喜欢(一个/用户)
- 分享
- 加入收藏
- 挑战(就这个视频向他/她提出挑战)
- 奖励(用户可以通过支付奖励他/她)
现在,从这些数据中计算/分析为什么这个话题在用户中如此受欢迎的原因是什么?或者这些数据如何帮助我们分析结果?
更新:
除了上述数据,我还可以得到用户的IP 地址。
例子:
话题“来跳舞”可以有以下数据:
浏览-----点赞-----分享-----收藏-----挑战-----奖励
45600-----145-----4180-----120-------------7--------------- -434
r - 联立因子求解 - 因子分析
为了复制先前研究的结果,我试图应用一种矩阵的因子分析方法,该方法在Horst (1965)中被描述为“具有同时因子解的基本结构”。
我将如何在 R 中使用这种方法?
给定一个矩阵m
,并假设我提取了两个因素,我尝试应用以下内容:
但我不认为这种方法是正确的。
才发现。
做这项工作。Horst 指的是也称为特征值分解的东西。也可以使用 eigen() 来完成并获得相同的结果。
.. 不是真的.. 负载看起来很接近,但从数学上看,我不确定下面描述的方法实际上类似于特征值分解,更仔细地观察,该方法直接应用于原始数据,没有产品动量计算是必须的..
..我正在尝试(慢慢地)自己计算数学并理解计算指令所描述的内容。
供您参考,这是用于在原始教科书中的示例中进行的计算的标准化矩阵:
这是计算说明和示例
...我想知道这是否只是因子分析或主成分分析中的一种标准方法.. 如果是,是哪一个?介绍说,从因子得分和因子负载矩阵的主要乘积产生的残差恰好等于原始矩阵减去因子数量的残差,这种方法是降级类型的解决方案。
这种特定类型的分析在直接对原始数据执行的意义上是“直接的”(充其量是归一化矩阵)。
r - 因子分析 - 按行分配分数
我用 进行因子分析fa
,我获得了 8 个因子(我将只使用其中的 5 个,SS Loading >1 的那些),现在我想为我的原始数据集的每一行(我的调查的受访者)分配每个因素的得分。
分数存储在哪里?如何创建五个新列并为每个列分配因子分数?
CorrMatrix 是项目的相关矩阵(30x30 矩阵)
原始数据集包含 2994 名受访者,每行一名受访者
item1 item2 item3 ... item30
1 3 5 ... 4
3 4 2 ... 5
我想做的是在原始数据集的末尾添加五个新列
对于所有 2994 名受访者
r - 使用比较数据确定 EFA (R) 中的因子数量
我正在寻找确定 Rfactanal
函数中最佳因子数量的方法。我已经知道最常用的方法(进行 pca 并使用碎石图来确定因子的数量)。我发现这里描述的方法对于像我这样的非技术人员来说更容易。不幸的是,不再可以访问实现该方法的 R 脚本。我想知道 R 中是否有一个包可以做同样的事情?该方法最初是在本研究中提出的:使用已知因子结构的比较数据确定在探索性因子分析中要保留的因子数。
r - 如何利用因子分析结果进行分类?
如下通过R进行因子分析后,我得到了结果。
以下是我可以获得的所有对象:
我想在分类中使用这些因素。但是,我不知道如何将因子加载到我的训练数据集中。