问题标签 [factor-analysis]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R中的因子分析
我试图更好地理解FA,希望你能看看这个,我最大的问题是如何在R中解释FA模型。
我的结果如下所示:我应该查看结果中的哪些值以及 FA 分析的良好指示?
algorithm - FA:选择旋转矩阵,基于“简单结构标准”
使用因子分析最重要的问题之一是它的解释。因子分析经常使用因子轮换来增强其解释。经过令人满意的旋转后,旋转后的因子加载矩阵L'将具有相同的表示相关矩阵的能力,可以用作因子加载矩阵,而不是未旋转的矩阵L。
旋转的目的是使旋转后的因子加载矩阵具有一些理想的性质。使用的一种方法是旋转因子加载矩阵,使旋转后的矩阵具有简单的结构。
LL Thurstone 介绍了简单结构原理,作为因子旋转的一般指南:
简单结构标准:
- 因子矩阵的每一行应至少包含一个零
- 如果有 m 个公因子,则因子矩阵的每一列应至少有 m 个零
- 对于因子矩阵中的每一对列,应该有几个变量的条目在一个列中接近于零,但在另一列中不接近
- 对于因子矩阵中的每一对列,当有四个或更多因子时,大部分变量在两列中的条目都应接近零
- 对于因子矩阵中的每一对列,两列中应该只有少量具有非零条目的变量
理想的简单结构是这样的:
- 每个项目仅在一个因素上具有高负载或有意义的负载,并且
- 每个因素仅对某些项目具有高负载或有意义的负载。
问题是,尝试几种旋转方法的组合以及每种方法接受的参数(特别是对于倾斜的参数),候选矩阵的数量会增加,很难看出哪个更符合上述标准。
当我第一次遇到这个问题时,我意识到我无法仅仅通过“查看”它们来选择最佳匹配,我需要一个算法来帮助我做出决定。在项目截止日期的压力下,我能做的最多就是在 MATLAB 中编写以下代码,它一次接受一个旋转矩阵并返回(在某些假设下)是否满足每个标准。一个新版本(如果我想升级它)将接受一个 3d 矩阵(一组 2d 矩阵)作为参数,并且算法应该返回更符合上述标准的那个。
我只是在征求您的意见(我也认为该方法本身的有用性受到批评),也许是旋转矩阵选择问题的更好方法。如果有人想提供一些代码,我更喜欢 R 或 MATLAB。
PS 上述简单结构准则公式可以在PETT , M., LACKEY, N., SULLIVAN, J.
PS2(来自同一本书):“因子分析成功的测试是它可以再现原始 corr 矩阵的程度。如果您还使用斜解,请在所有中选择产生最多最高和最低因子的那个载荷。” 这听起来像是算法可以使用的另一个约束。
python - Factor Analysis in python
is there a module that contains a function that calculate Factor Analysis (not PCA) in python?
python - 在 Python 中使用 MDP 进行因素分析
原谅我的无知,我对 Python 很陌生。我正在尝试使用 MDP 在 Python 中执行因子分析(尽管如果有更好的解决方案,我可以使用另一个库)。
我有一个 m x n 矩阵(称为矩阵),我试图这样做:
但我得到一个错误。我猜也许我的矩阵没有正确形成?我的目标是找出数据中有多少组件,并找出哪些行加载到哪些组件上。
这是回溯:
有谁知道发生了什么,并想向 Python 新手解释一下?
python - MDP FANode 问题
我正在尝试对距离矩阵(由大约 1700 个点之间的距离组成,所有范围都在 0.0 和 1.0 之间,包括在内)进行因子分析。我是一个完全的FA新手。
无论如何,这段代码:
给我:
我尝试用 0.00001 替换 0 值,但无济于事。知道这可能意味着什么吗?
r - 来自集群和共现因素列表的维恩图
我有一个输入文件,其中包含约 50000 个集群的列表,并且每个集群中都存在许多因素(总共约 1000 万个条目),请参见下面的较小示例:
在另一个问题的帮助下,我得到了一个饼图,用于同时出现以下因素:
但现在我想有一个因素共现的维恩图。理想情况下,也可以采用每个因素的最小计数阈值的方式。例如,不同因素的维恩图使得它们中的每一个都必须在每个集群中出现 n>10 才能被考虑在内。
我试图找到一种方法来使用聚合生成表计数,但无法使其工作。
pca - 有没有好的图书馆可以快速做 NMF?
我有一个稀疏矩阵,其形状为570000*3000。我试过nima做 NMF(使用默认的 nmf 方法,并设置max_iter
为 65)。但是,我发现 nimfa 非常慢。有没有人使用更快的库(可以被 Python/R 使用)或软件来做 NMF?
pca - 推荐降维算法(PCA不适合)
对于这个应用程序,我想使用一种降维算法,这样给定数量的组件都可以解释数据中相同数量的方差。
因此,主成分分析不适合,因为解释的方差从第一个主成分到每个后续主成分急剧下降。
我可以使用哪些算法?
r - 因子分析错误
我正在对 500 个变量和 1316 条记录进行因子分析。我收到以下错误:
我使用的语法是:
任何建议都会有很大帮助。
谢谢
r - psych - 将因子加载作为数据.frame 用于 LaTeX 导出
我正在使用psych
包的fa
命令进行因子分析,因此有一个对象 class fa
。我可以使用 查询载荷fac$loadings
,但我只想提取包含载荷的表,因此我可以使用xtable
(或类似方法)将其转换为 LaTeX 格式。
示例代码:
谁能告诉我我可以用来做someMagicalFunction
什么?