问题标签 [multilevel-analysis]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 绘制嵌套数据 - 具有类别预测变量的多级回归
我正在写我的硕士论文,但我被数据的复杂性所困扰。因此,我想绘制我的数据以查看其中的内容。
我的数据框如下所示:我有 333 个感知器 (PID),每个感知器对 60 个目标照片 (TID) 进行评分,结果为 19980 行。每个感知者 (PID) 对每个目标的照片评价他们的可爱程度 (Rating) 并提供多个关于他们自己的自我报告 (SDO_mean、KSA_mean、threshold_overall)。这些照片来自照片类型 A (Dwithin = 0) 或类型 B (Dwithin = 1),这是我的主体内因素,因为每个感知者都看到了所有照片。此外,感知者被分配到两个主体间条件 (Dbetween) 之一:B 型 (Dwithin = 1) 的所有照片 (TID) 都被标记为具有移民背景的人 (Dbetween = 0) 或难民 (Dbetween = 1) )。这导致嵌套设计,其中评级嵌套在 PID 和 TID 中。我的数据如下所示:
现在我想主要通过分类变量 Dwithin 和 Dbetween 来预测讨人喜欢的评级。由于 Dbetween 只能解释为 Dwithin*Dbetween 的交互作用(因为标签仅适用于 Dwitihn=1 目标),因此公式为:
现在我想绘制用于回归的数据。一个选项可以是为每个 Dwithin / Dbetween 条件分别绘制评级。或者按照模型 1 公式绘制回归。但由于这些是分类预测变量,我没有设法以正确的方式绘制数据。我调查了lattice()
但无法将其应用于我的数据。有没有人可以帮我绘制它?提前非常感谢!
@SASpencer:我想到了这样的例子。但我的 y 尺度不是连续的……它只有 1-5 的整数。Dwithin 和 Dbetween 的组合也可能很有趣(就像在你的情节中一样)
这是一个可重现的示例:
r - 使用 mlogit (R) 进行多级多项逻辑回归
我正在尝试对多级多项逻辑回归建模。我有 42 名受试者,每人有 82 次观察。在每次观察中,受试者(“VP”)能够以三种不同的方式做出反应
为了实现随机预测器,我尝试了这个:
但是我怎样才能使科目(“VP”)成为 2 级单位?随机斜率应该在这 42 个科目上有所不同。
抱歉英语不好和新手行为:(
r - r中GLMER多级的模拟“zelig风格”
我用 r 运行逻辑混合效应回归。回归在某种程度上是这样的:
glmer ( Y~ X1 + X2 + X1:X2 + (1 | country), data = hdp, family = binomial)
现在,使用固定效应,我想绘制 Y 的预测概率。我尝试使用 Zelig,因为这是我学到的最简单的模拟和获得预测概率的方法,但我看到新版本不包括多级模型和以前的 Zelig Multilevel 非常“不稳定”。有没有简单的替代方案?如何进行可以绘制的模拟?
提前致谢!
python - 在 Pandas 中按行中的值过滤列
我已经通过 Pandas 中的 df.describe() 获得了我的数据框的统计信息。
我想根据计数过滤统计数据框:
我想得到类似的东西:过滤掉所有计数小于 30 的值,并在新数据框中只显示计数 >30 的列(或者给我一个包含所有计数 > 30 的主要列表)。
对于上面的例子,我想要:
和[Meas4, Meas5]
我努力了
及其变体。
r - 重塑/收集功能以创建数据集以进行多级分析
我有一个大数据集,其中 240 个病例代表 240 名患者。他们都接受了神经心理学测试并填写了问卷。此外,他们的重要其他人(以下简称:代理人)也填写了问卷。由于“患者”和“代理”嵌套在“情侣”中,我想在 R 中进行多级分析。为此,我需要重塑我的数据集以运行此类分析。
简单地说,我想“复制”我的行。对于双主题 ID,添加一个包含 1 和 2 的新变量,其中 1 代表患者数据,2 代表代理数据。然后我希望这些行填充 1. 所有患者数据和包含代理数据的列是 NA 或空或其他,以及 2. 所有代理数据,以及所有患者数据 NA 或空。
假设这是我的数据:
我希望我的数据最终看起来像这样:
或者,如果这是不可能的,像这样:
现在,为了让我到达那里,我尝试了 melt() 函数和 gather() 函数,感觉就像我很接近但它仍然没有按照我想要的方式工作。
请注意,在我的数据集中,患者问卷的变量名称为 bb1:bb54,代理问卷的变量名称为 pbb1:pbb54
我试过的例子
hierarchical-data - stan 有效样本数量
我使用 rethinking 包和 rstan() 复制了分层模型的结果,我只是好奇为什么 n_eff 不接近。
这是使用 rethinking 包对 2 个组 (intercept_x2) 进行随机截距的模型:
代码:
现在这是 rstan() 中的相同模型:
我的问题:
- 使用 rethinking() 时 n_eff 更大。存在模拟差异,但您认为这里发生了其他事情吗?
- 除了 n_eff 不同之外,后验分布的百分位数也不同。我在想 rethinking() 和 rstan() 应该通过 5000 次迭代返回相似的结果,因为 rethinking 只是调用 rstan。两种实现之间的差异是正常的还是不同的?
- 我创建了 data$GROUP_ID 来指示分类分组。这是将分类变量合并到 rstan() 中的层次模型中的正确方法吗?我有 2 个组,如果我有 50 个组,我使用相同的 data$GROUP_ID 向量,但这是标准方式吗?
谢谢你。
python-3.x - 将多级行和列excel表上传到熊猫数据框中
我有一个多列/行电子表格。
因此总数等于 6 列
现在,该表也有多级行。我在每个国家/地区都有国家和城市。
如何将这个预制的 excel 表导入 pandas 数据框?非常感谢您的帮助!
r - 随机效应中的交互项建模和生长模型中的白天编码 lme4
我对 R 中的模型设置有疑问,经过长时间彻底的搜索后,我没有找到回答我的两个问题中的任何一个的线程:
我先描述一下设置:
它是一个重复测量数据集,具有两种不同的干预措施(食物和培训),每个干预措施都有两个级别。所有参与者都经历了各种条件组合。在一天中收集激素样品。年龄和 BMI 作为协变量包括在内。
一个可重现的数据集是这个:
现在我有两个主要问题:
1)首先,我想评估两种干预措施对基线激素水平的相互作用。为此,我设置了以下模型:
但是,无法设置此模型,因为
当我从随机效应中排除交互项时,它确实有效:
m1 <- lmer(激素~训练*食物+年龄+BMI+(1+训练+食物|ID),model.df)
我现在想知道这是否仍然是测试交互的有效模型?因此,我的空模型将是:
现在到第二点:
2)
我们还想监测激素随时间的变化。
但是,我不确定如何在模型中包含一天中的时间。
正如该线程中指出的那样https://stats.stackexchange.com/questions/245866/is-hour-of-day-a-categorical-variable
但是,它可以作为循环变量包含在内,因为我的采样没有涵盖一整天,所以我不确定如何在我的情况下实现它。任何人都可以帮忙吗?
另外,我不确定如何设置包括时间变量在内的模型。
我们仍然对这两种干预措施的相互作用感兴趣,所以我会设置类似以下模型的东西。(现在假设时间为数字)
然而:1)这个模型不收敛
2)你认为这是一个合适的模型吗?
然后将针对以下空模型对其进行测试:
我希望这些不是一个线程的太多问题,我会对任何指针感到非常高兴。非常感谢。