“multilevel-analysis”的相关标签问题

0 投票

1 回答

611 浏览

python-3.x - 具有随机效应的多级回归中的变量解释

我有一个如下所示的数据集（显示前 5 行）。CPA 是对不同广告投放的实验（处理）的观察结果。航班在活动中按层次分组。

我适合如下模型：

据我所知，这个模型简单地说：

我们有一个斜坡进行治疗
我们有一个全局拦截
我们也有每个广告系列的拦截

所以每个这样的变量只会得到一个后验。

然而，看看下面的结果，我也得到了以下变量的后验：1|campaign_uid_offset. 它代表什么？

拟合模型和绘图的代码：

2017-04-08T13:09:17.737

0 投票

0 回答

107 浏览

r - 绘制嵌套数据 - 具有类别预测变量的多级回归

我正在写我的硕士论文，但我被数据的复杂性所困扰。因此，我想绘制我的数据以查看其中的内容。

我的数据框如下所示：我有 333 个感知器 (PID)，每个感知器对 60 个目标照片 (TID) 进行评分，结果为 19980 行。每个感知者 (PID) 对每个目标的照片评价他们的可爱程度 (Rating) 并提供多个关于他们自己的自我报告 (SDO_mean、KSA_mean、threshold_overall)。这些照片来自照片类型 A (Dwithin = 0) 或类型 B (Dwithin = 1)，这是我的主体内因素，因为每个感知者都看到了所有照片。此外，感知者被分配到两个主体间条件 (Dbetween) 之一：B 型 (Dwithin = 1) 的所有照片 (TID) 都被标记为具有移民背景的人 (Dbetween = 0) 或难民 (Dbetween = 1) ）。这导致嵌套设计，其中评级嵌套在 PID 和 TID 中。我的数据如下所示：

现在我想主要通过分类变量 Dwithin 和 Dbetween 来预测讨人喜欢的评级。由于 Dbetween 只能解释为 Dwithin*Dbetween 的交互作用（因为标签仅适用于 Dwitihn=1 目标），因此公式为：

现在我想绘制用于回归的数据。一个选项可以是为每个 Dwithin / Dbetween 条件分别绘制评级。或者按照模型 1 公式绘制回归。但由于这些是分类预测变量，我没有设法以正确的方式绘制数据。我调查了lattice()但无法将其应用于我的数据。有没有人可以帮我绘制它？提前非常感谢！

@SASpencer：我想到了这样的例子。但我的 y 尺度不是连续的……它只有 1-5 的整数。Dwithin 和 Dbetween 的组合也可能很有趣（就像在你的情节中一样）

这是一个可重现的示例：

r plot lattice categorical-data multilevel-analysis

2017-04-15T13:35:19.717

0 投票

0 回答

998 浏览

r - 使用 mlogit (R) 进行多级多项逻辑回归

我正在尝试对多级多项逻辑回归建模。我有 42 名受试者，每人有 82 次观察。在每次观察中，受试者（“VP”）能够以三种不同的方式做出反应

为了实现随机预测器，我尝试了这个：

但是我怎样才能使科目（“VP”）成为 2 级单位？随机斜率应该在这 42 个科目上有所不同。

抱歉英语不好和新手行为:(

r logistic-regression multi-level multinomial multilevel-analysis

2017-04-15T19:02:10.257

0 投票

1 回答

252 浏览

r - r中GLMER多级的模拟“zelig风格”

我用 r 运行逻辑混合效应回归。回归在某种程度上是这样的：

glmer ( Y~ X1 + X2 + X1:X2 + (1 | country), data = hdp, family = binomial)

现在，使用固定效应，我想绘制 Y 的预测概率。我尝试使用 Zelig，因为这是我学到的最简单的模拟和获得预测概率的方法，但我看到新版本不包括多级模型和以前的 Zelig Multilevel 非常“不稳定”。有没有简单的替代方案？如何进行可以绘制的模拟？

提前致谢！

r simulation lme4 r-zelig multilevel-analysis

2017-07-06T07:18:43.227

0 投票

2 回答

3707 浏览

python - 在 Pandas 中按行中的值过滤列

我已经通过 Pandas 中的 df.describe() 获得了我的数据框的统计信息。

我想根据计数过滤统计数据框：

我想得到类似的东西：过滤掉所有计数小于 30 的值，并在新数据框中只显示计数 >30 的列（或者给我一个包含所有计数 > 30 的主要列表）。

对于上面的例子，我想要：

和[Meas4, Meas5]

我努力了

及其变体。

python pandas multilevel-analysis

2017-08-21T14:42:06.377

0 投票

2 回答

180 浏览

r - 重塑/收集功能以创建数据集以进行多级分析

我有一个大数据集，其中 240 个病例代表 240 名患者。他们都接受了神经心理学测试并填写了问卷。此外，他们的重要其他人（以下简称：代理人）也填写了问卷。由于“患者”和“代理”嵌套在“情侣”中，我想在 R 中进行多级分析。为此，我需要重塑我的数据集以运行此类分析。

简单地说，我想“复制”我的行。对于双主题 ID，添加一个包含 1 和 2 的新变量，其中 1 代表患者数据，2 代表代理数据。然后我希望这些行填充 1. 所有患者数据和包含代理数据的列是 NA 或空或其他，以及 2. 所有代理数据，以及所有患者数据 NA 或空。

假设这是我的数据：

我希望我的数据最终看起来像这样：

或者，如果这是不可能的，像这样：

现在，为了让我到达那里，我尝试了 melt() 函数和 gather() 函数，感觉就像我很接近但它仍然没有按照我想要的方式工作。

请注意，在我的数据集中，患者问卷的变量名称为 bb1:bb54，代理问卷的变量名称为 pbb1:pbb54

我试过的例子

r reshape melt multi-level multilevel-analysis

2017-08-29T14:42:21.057

0 投票

0 回答

510 浏览

hierarchical-data - stan 有效样本数量

我使用 rethinking 包和 rstan() 复制了分层模型的结果，我只是好奇为什么 n_eff 不接近。

这是使用 rethinking 包对 2 个组 (intercept_x2) 进行随机截距的模型：

代码：

现在这是 rstan() 中的相同模型：

我的问题：

使用 rethinking() 时 n_eff 更大。存在模拟差异，但您认为这里发生了其他事情吗？
除了 n_eff 不同之外，后验分布的百分位数也不同。我在想 rethinking() 和 rstan() 应该通过 5000 次迭代返回相似的结果，因为 rethinking 只是调用 rstan。两种实现之间的差异是正常的还是不同的？
我创建了 data$GROUP_ID 来指示分类分组。这是将分类变量合并到 rstan() 中的层次模型中的正确方法吗？我有 2 个组，如果我有 50 个组，我使用相同的 data$GROUP_ID 向量，但这是标准方式吗？

谢谢你。

hierarchical-data stan hierarchical-bayesian multilevel-analysis

2017-08-31T19:05:41.013

0 投票

0 回答

45 浏览

python-3.x - 将多级行和列excel表上传到熊猫数据框中

我有一个多列/行电子表格。

因此总数等于 6 列

现在，该表也有多级行。我在每个国家/地区都有国家和城市。

如何将这个预制的 excel 表导入 pandas 数据框？非常感谢您的帮助！

python-3.x dataframe multilevel-analysis

2017-11-22T20:35:58.677

0 投票

1 回答

446 浏览

r - R + 多级逻辑回归 + 组固定效应

在 Stata 中，我知道如果使用以下命令，我可以获得因变量 ( thkbins) 和两个预测变量 ( cc& tv) 之间每个可能组合的 logits：

有没有办法在 R 中产生类似的输出？我一直在使用包中的glmer命令lme4，虽然我可以使用交互项获得输出，但这并不是我在 Stata 中可以产生的。

r logistic-regression multilevel-analysis

2017-12-22T14:39:32.353

0 投票

0 回答

891 浏览

r - 随机效应中的交互项建模和生长模型中的白天编码 lme4

我对 R 中的模型设置有疑问，经过长时间彻底的搜索后，我没有找到回答我的两个问题中的任何一个的线程：

我先描述一下设置：

它是一个重复测量数据集，具有两种不同的干预措施（食物和培训），每个干预措施都有两个级别。所有参与者都经历了各种条件组合。在一天中收集激素样品。年龄和 BMI 作为协变量包括在内。

一个可重现的数据集是这个：

现在我有两个主要问题：

1）首先，我想评估两种干预措施对基线激素水平的相互作用。为此，我设置了以下模型：

但是，无法设置此模型，因为

当我从随机效应中排除交互项时，它确实有效：

m1 <- lmer(激素~训练*食物+年龄+BMI+(1+训练+食物|ID),model.df)

我现在想知道这是否仍然是测试交互的有效模型？因此，我的空模型将是：

现在到第二点：

2)

我们还想监测激素随时间的变化。

但是，我不确定如何在模型中包含一天中的时间。

正如该线程中指出的那样https://stats.stackexchange.com/questions/245866/is-hour-of-day-a-categorical-variable

但是，它可以作为循环变量包含在内，因为我的采样没有涵盖一整天，所以我不确定如何在我的情况下实现它。任何人都可以帮忙吗？

另外，我不确定如何设置包括时间变量在内的模型。

我们仍然对这两种干预措施的相互作用感兴趣，所以我会设置类似以下模型的东西。（现在假设时间为数字）

然而：1）这个模型不收敛

2）你认为这是一个合适的模型吗？

然后将针对以下空模型对其进行测试：

我希望这些不是一个线程的太多问题，我会对任何指针感到非常高兴。非常感谢。

r lme4 mixed-models multilevel-analysis

2018-01-30T15:51:03.803

问题标签 [multilevel-analysis]

Reference