问题标签 [multilevel-analysis]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - “z0 * u[index_clus, 1:NR, drop = FALSE] 中的错误:不一致的数组” 使用 2l.pmm 方法运行鼠标时出错
我正在尝试对具有交叉分类嵌套的数据集执行多重插补(即,数据嵌套在两个不相互嵌套的不同分组变量中;下面代码中的 group1 和 group2)。为了解释多级结构,我在miceadds 包中使用了method="2l.pmm"。但是,当我运行代码时,我收到一条错误消息:
“z0* u[index_clus, 1:NR, drop = FALSE] 中的错误:不一致的数组
我想知道为什么我会收到这条消息。
我试图估算的完整数据集有 279 行和 188 列。因为我在研究中采用了计划缺失,所以其中大约 120 列需要插补。为了缩小错误代码的原因,我尝试将数据集大大减少为两个分组变量和几个其他变量。当我添加第二个分组变量(group2)作为预测变量时,似乎出现了问题。
我怀疑错误可能是由于某些组的样本量仅为 1;但是,当包含的变量只有 group1、VarA 和 VarB 时,代码会运行。group1 的某些级别的样本大小仅为 1,因此这似乎不是问题。
可能导致错误的代码或数据集有哪些潜在问题?任何输入将不胜感激!
r - 多级线性模型中的变量分组
我正在尝试学习 R 中的分层模型,并且我已经为自己生成了一些示例数据。我在编写多级回归问题的正确语法时遇到问题。
我在商学院生成了一些工资数据。我使薪水与工作年限和教员的出版物总数成线性关系。教师在各个部门,我为每个部门制定了不同的基本工资(截距),并且每个部门的年度加薪(斜率)也不同。这样,我的工资的截距(基本工资)和斜率(多年经验)取决于嵌套级别(部门)和斜率 wrt 另一个解释变量(出版物)不依赖于嵌套级别。在 R 中对此进行建模的正确语法是什么?
这是我的数据
我尝试了以下方法:
1)
model.matrix.default(eval(substitute(~foo, list(foo = x[[2]]))) 中的错误:model.matrix() 中的模型框架和公式不匹配
2)
边界(奇异)拟合:参见 ?isSingular
我想看看部门对工资截距和每年加息的估计,以及作为独立(汇总)发布的影响的估计。现在我根本没有让代码工作。
我知道基本工资和部门的年度加息以及出版物的影响(因为我生成了它)。
每发表一篇文章,工资就增加一万。
答案: 感谢@Ben在这里的回答, 我认为正确的模型是
这通过运行给了我以下固定效果
部门级系数如下:
这些是对原始值的相当好的估计。现在我需要学会评估它们“有多好”。:)
r - 是否可以在 R 中为时间序列设计执行多维分段泊松回归?
对于我的研究项目,我正在调查政策变化对某些结果的影响,例如犯罪率。多个国家在不同时间点或不同年份对新政策进行了调整。
到目前为止,我已经对每个国家分别进行了泊松回归形式的时间序列分析。
我拥有的可用数据包含每个国家/地区的以下变量:
所以基本上每年统计犯罪数量,所以时间间隔是1年。
这是我为每个国家/地区创建的模型:
当我使用计数数据时,我使用了泊松模型:为了做到这一点,我使用总体(对数转换)作为偏移变量直接对计数数据(而不是比率)建模,以便转换回比率。
到目前为止,一切都很好!然而,对于一些国家来说,干预前后的数据点非常有限或分布非常不均,这就是为什么我想知道是否可以对汇总数据进行相同的分析,而不仅能够估计对每个国家的影响,也是一个整体的影响。为此,我将包括 2 级变量“国家”。
由于我在 R 中的多级建模方面非常缺乏经验,所以在这一点上我有点无能为力。然而,这是我的第一次尝试:
谁能告诉我这种方法是否有意义或我还能做什么?
非常感谢您的支持。
最好的,液晶
r - 从空模型 lme 输出中找到人内 SD
我只是想确保我正确地解释了我的 lme 输出。我建立了一个空模型,因为有人告诉我可以通过这种方式找到内部人员 SD(Nelzek,2012 年 MLM 章节)。但是这一章是用公式而不是 R 代码编写的。
这是我使用的模型。SubjectID 是人员的分组变量。
这是输出摘要。我假设因变量 (dv1) 的人内 SD 是截距 StdDev,但只是想检查一下。或者,如果我解释错了,请告诉我:)
r - 使用 glmer/lme4 和 predictInterval 时,您将分组因子设置为什么?
问题:使用多级(混合效应)模型,不确定将分组变量设置为什么,以便使用 merTools 的 predictInterval 函数从 glmer 模型生成测量的组级变量的预测概率。
目标:从“第二级”组级变量中生成一系列值的预测概率和 SE/CI。
寻求:关于如何正确执行此操作的建议或其他建议以生成预测概率和 CI 是来自 glmer 模型的组级别变量的值范围。
r - 如何模拟类内相关数据?
我正在模拟混合模型的随机数据集。为了使混合模型有意义,需要关联集群内的数据点 (ICC)。我如何生成这样的数据?
这些是我的变量:
- ID
- 基础(基线,第一次测量)
- 一半(第二次测量)
- 最终(最终测量)
- 对照组(对照组还是实验组?)
- 集群(显示该人属于哪个集群的因子变量)
我需要嵌套在每个集群中的三个测量值来关联。
代码基于我上面写的+我添加了一些噪音,因此
在第 2 和第 3 措施中。
如何使三个测量值在集群内相互关联?
谢谢你。
regression - 在每个参与者进行多次试验的主题设计之间
两组之间的主题实验:每组有一对 10 参与者。(玩家 1 和玩家 2)两组中的对子玩游戏,其中一个因素被操纵。假设:A组得分高于B组。
我可以使用带有随机拦截的混合建模作为玩家和团队作为拦截吗?
分析这个实验设计的好方法是什么?
r - 循环多级回归的变量会产生类型错误
我正在编写一个多级回归模型,在该模型中,我从一个预测变量数据框(来自第一级的系数)和一个预测变量数据框开始第二个级别。两个数据框具有相同数量的观察值。我希望遍历预测变量(第一个数据帧中的列)并使用lm()
它们对预测变量的整个第二个数据帧进行回归。但是,当我这样做时,我得到一个我无法弄清楚的错误。
例子:
我只是无法理解这意味着什么或为什么 R 认为iris1[col]
是list
. 为简单起见,我尝试合并它们:
这个特别令人沮丧,因为它们的长度显然相同。
longitudinal - 如何在多级回归代码中包含日记数据/滞后数据
我使用日记数据,并且正在尝试使用滞后变量进行多级回归。我试着
- 从前一天的连续变量预测二元变量和
- 从前一天的二进制变量预测连续变量。
我不明白如何将这种时间滞后/日记数据格式包含到 R 代码中。另外,我不知道如何控制同一天的预测变量。
我将 lmer 和 glmer 命令用于连续和二元结果,到目前为止只有 1 级预测器
AIC 没有显示出更好的随机系数拟合,但这是我所期待的。到目前为止的回归结果并不显着,但可能是因为我没有正确编写代码。
python - 复杂数据框的多级 Pandas 迭代
我的数据如下所示,这是一个多级 pandas 数据框,我正在尝试对其运行一些操作;但需要帮助访问特定级别...
此外,有关级别的更多信息:
我想遍历这个数据框,一次一个股票代码,并对“关闭”列执行操作。例如,
我希望用这个做更复杂的事情;但是,这段代码会让我到达那里。