问题标签 [multilevel-analysis]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
611 浏览

python-3.x - 具有随机效应的多级回归中的变量解释

我有一个如下所示的数据集(显示前 5 行)。CPA 是对不同广告投放的实验(处理)的观察结果。航班在活动中按层次分组。

我适合如下模型:

据我所知,这个模型简单地说:

  • 我们有一个斜坡进行治疗
  • 我们有一个全局拦截
  • 我们也有每个广告系列的拦截

所以每个这样的变量只会得到一个

然而,看看下面的结果,我也得到了以下变量的后验:1|campaign_uid_offset. 它代表什么?

在此处输入图像描述

拟合模型和绘图的代码:

0 投票
0 回答
107 浏览

r - 绘制嵌套数据 - 具有类别预测变量的多级回归

我正在写我的硕士论文,但我被数据的复杂性所困扰。因此,我想绘制我的数据以查看其中的内容。

我的数据框如下所示:我有 333 个感知器 (PID),每个感知器对 60 个目标照片 (TID) 进行评分,结果为 19980 行。每个感知者 (PID) 对每个目标的照片评价他们的可爱程度 (Rating) 并提供多个关于他们自己的自我报告 (SDO_mean、KSA_mean、threshold_overall)。这些照片来自照片类型 A (Dwithin = 0) 或类型 B (Dwithin = 1),这是我的主体内因素,因为每个感知者都看到了所有照片。此外,感知者被分配到两个主体间条件 (Dbetween) 之一:B 型 (Dwithin = 1) 的所有照片 (TID) 都被标记为具有移民背景的人 (Dbetween = 0) 或难民 (Dbetween = 1) )。这导致嵌套设计,其中评级嵌套在 PID 和 TID 中。我的数据如下所示:

现在我想主要通过分类变量 Dwithin 和 Dbetween 来预测讨人喜欢的评级。由于 Dbetween 只能解释为 Dwithin*Dbetween 的交互作用(因为标签仅适用于 Dwitihn=1 目标),因此公式为:

现在我想绘制用于回归的数据。一个选项可以是为每个 Dwithin / Dbetween 条件分别绘制评级。或者按照模型 1 公式绘制回归。但由于这些是分类预测变量,我没有设法以正确的方式绘制数据。我调查了lattice()但无法将其应用于我的数据。有没有人可以帮我绘制它?提前非常感谢!

@SASpencer:我想到了这样的例子。但我的 y 尺度不是连续的……它只有 1-5 的整数。Dwithin 和 Dbetween 的组合也可能很有趣(就像在你的情节中一样)

这是一个可重现的示例:

0 投票
0 回答
998 浏览

r - 使用 mlogit (R) 进行多级多项逻辑回归

我正在尝试对多级多项逻辑回归建模。我有 42 名受试者,每人有 82 次观察。在每次观察中,受试者(“VP”)能够以三种不同的方式做出反应

为了实现随机预测器,我尝试了这个:

但是我怎样才能使科目(“VP”)成为 2 级单位?随机斜率应该在这 42 个科目上有所不同。

抱歉英语不好和新手行为:(

0 投票
1 回答
252 浏览

r - r中GLMER多级的模拟“zelig风格”

我用 r 运行逻辑混合效应回归。回归在某种程度上是这样的:

glmer ( Y~ X1 + X2 + X1:X2 + (1 | country), data = hdp, family = binomial)

现在,使用固定效应,我想绘制 Y 的预测概率。我尝试使用 Zelig,因为这是我学到的最简单的模拟和获得预测概率的方法,但我看到新版本不包括多级模型和以前的 Zelig Multilevel 非常“不稳定”。有没有简单的替代方案?如何进行可以绘制的模拟?

提前致谢!

0 投票
2 回答
3707 浏览

python - 在 Pandas 中按行中的值过滤列

我已经通过 Pandas 中的 df.describe() 获得了我的数据框的统计信息。

我想根据计数过滤统计数据框:

我想得到类似的东西:过滤掉所有计数小于 30 的值,并在新数据框中只显示计数 >30 的列(或者给我一个包含所有计数 > 30 的主要列表)。

对于上面的例子,我想要:

[Meas4, Meas5]

我努力了

及其变体。

0 投票
2 回答
180 浏览

r - 重塑/收集功能以创建数据集以进行多级分析

我有一个大数据集,其中 240 个病例代表 240 名患者。他们都接受了神经心理学测试并填写了问卷。此外,他们的重要其他人(以下简称:代理人)也填写了问卷。由于“患者”和“代理”嵌套在“情侣”中,我想在 R 中进行多级分析。为此,我需要重塑我的数据集以运行此类分析。

简单地说,我想“复制”我的行。对于双主题 ID,添加一个包含 1 和 2 的新变量,其中 1 代表患者数据,2 代表代理数据。然后我希望这些行填充 1. 所有患者数据和包含代理数据的列是 NA 或空或其他,以及 2. 所有代理数据,以及所有患者数据 NA 或空。

假设这是我的数据:

我希望我的数据最终看起来像这样:

或者,如果这是不可能的,像这样:

现在,为了让我到达那里,我尝试了 melt() 函数和 gather() 函数,感觉就像我很接近但它仍然没有按照我想要的方式工作。

请注意,在我的数据集中,患者问卷的变量名称为 bb1:bb54,代理问卷的变量名称为 pbb1:pbb54

我试过的例子

0 投票
0 回答
510 浏览

hierarchical-data - stan 有效样本数量

我使用 rethinking 包和 rstan() 复制了分层模型的结果,我只是好奇为什么 n_eff 不接近。

这是使用 rethinking 包对 2 个组 (intercept_x2) 进行随机截距的模型:

代码:

现在这是 rstan() 中的相同模型:

我的问题:

  • 使用 rethinking() 时 n_eff 更大。存在模拟差异,但您认为这里发生了其他事情吗?
  • 除了 n_eff 不同之外,后验分布的百分位数也不同。我在想 rethinking() 和 rstan() 应该通过 5000 次迭代返回相似的结果,因为 rethinking 只是调用 rstan。两种实现之间的差异是正常的还是不同的?
  • 我创建了 data$GROUP_ID 来指示分类分组。这是将分类变量合并到 rstan() 中的层次模型中的正确方法吗?我有 2 个组,如果我有 50 个组,我使用相同的 data$GROUP_ID 向量,但这是标准方式吗?

谢谢你。

0 投票
0 回答
45 浏览

python-3.x - 将多级行和列excel表上传到熊猫数据框中

我有一个多列/行电子表格。

因此总数等于 6 列

现在,该表也有多级行。我在每个国家/地区都有国家和城市。

如何将这个预制的 excel 表导入 pandas 数据框?非常感谢您的帮助!

0 投票
1 回答
446 浏览

r - R + 多级逻辑回归 + 组固定效应

在 Stata 中,我知道如果使用以下命令,我可以获得因变量 ( thkbins) 和两个预测变量 ( cc& tv) 之间每个可能组合的 logits:

在此处输入图像描述

有没有办法在 R 中产生类似的输出?我一直在使用包中的glmer命令lme4,虽然我可以使用交互项获得输出,但这并不是我在 Stata 中可以产生的。

在此处输入图像描述

0 投票
0 回答
891 浏览

r - 随机效应中的交互项建模和生长模型中的白天编码 lme4

我对 R 中的模型设置有疑问,经过长时间彻底的搜索后,我没有找到回答我的两个问题中的任何一个的线程:

我先描述一下设置:

它是一个重复测量数据集,具有两种不同的干预措施(食物和培训),每个干预措施都有两个级别。所有参与者都经历了各种条件组合。在一天中收集激素样品。年龄和 BMI 作为协变量包括在内。

一个可重现的数据集是这个:

现在我有两个主要问题:

1)首先,我想评估两种干预措施对基线激素水平的相互作用。为此,我设置了以下模型:

但是,无法设置此模型,因为

当我从随机效应中排除交互项时,它确实有效:

m1 <- lmer(激素~训练*食物+年龄+BMI+(1+训练+食物|ID),model.df)

我现在想知道这是否仍然是测试交互的有效模型?因此,我的空模型将是:

现在到第二点:

2)

我们还想监测激素随时间的变化。

但是,我不确定如何在模型中包含一天中的时间。

正如该线程中指出的那样https://stats.stackexchange.com/questions/245866/is-hour-of-day-a-categorical-variable

但是,它可以作为循环变量包含在内,因为我的采样没有涵盖一整天,所以我不确定如何在我的情况下实现它。任何人都可以帮忙吗?

另外,我不确定如何设置包括时间变量在内的模型。

我们仍然对这两种干预措施的相互作用感兴趣,所以我会设置类似以下模型的东西。(现在假设时间为数字)

然而:1)这个模型不收敛

2)你认为这是一个合适的模型吗?

然后将针对以下空模型对其进行测试:

我希望这些不是一个线程的太多问题,我会对任何指针感到非常高兴。非常感谢。