问题标签 [lmertest]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
67 浏览

r - 为什么 lmer 将我的因素分成结果中的所有级别?

root.type我正在为具有 4 个级别的预测变量运行单个响应变量的线性混合模型;当我运行模型时,我只想要关于整个因素的信息,但它会不断将其拆分为多个级别。有任何想法吗?

我只期待一个固定效应(root.type)。我更新了软件包,但没有任何改变。

0 投票
0 回答
52 浏览

r - R中线性混合模型的功率仿真

我需要进行线性混合模型模拟以获得不同样本大小的能力。

我的模型是:

评分 = y

固定效应,x = 环

随机效应 = 参与者

我试过的代码如下。它只返回“基于 100 次模拟,(0 个警告,100 个错误)alpha = 0.05,nrow = 2000”......

谢谢!!

0 投票
1 回答
266 浏览

emmeans - 具有许多观察值的 lmerTest 模型的错误事后 emmeans

我用 lmerTest 运行了一个混合模型,我需要一个事后测试。

以下是模型,每个试验连续。然后,我使用 emmeans 但得到以下错误(可能是因为大量的观察)。

我会很感激帮助或以其他方式运行后挂钩,因为我尝试过的其他方式也不起作用。PS当我尝试添加参数'lmerTest.limit = 13812'时它根本不起作用。

0 投票
0 回答
24 浏览

r - 多参数测试以在 R 中的线性混合效应模型中获得主效应?

如果我把这个问题放在错误的地方,请原谅我。我已经用 R 中的 lme4 包和 lmerTest 包构建了一个 lmer 模型,但我正在努力获得主效应的正确 F 值,因为我的一个自变量具有三个级别。我的模型如下:

使用 anova(mod) 给我以下估计:

当然,我可以通过将误差平方和除以适当的自由度来手动计算 F 值。但是在 R 中有没有捷径可以做到这一点?使用 base::lm() 我可以重新拟合不包括感兴趣的自变量的模型,并将其与包含该自变量的完整模型进行比较。为此,我可以使用 anova(full_model, main_effect_model)。但是,这似乎不适用于混合效果模型。我得到:

有没有办法来解决这个问题?

0 投票
0 回答
32 浏览

r - 为什么我在 glmer 中收到“错误数据”错误?

我想从我的模型中删除异常值(残差超过 2.5sd)。我试过这段代码:

我收到以下错误消息:

错误:错误的“数据”:

我在不同的数据集上运行相同的代码,它运行顺利,没有任何问题。

0 投票
1 回答
71 浏览

r - 在尊重可变对比度编码的同时,如何使用 anova() 对 lm 和 lmer 对象进行显着性测试?

我对在 lm 或 lmer 对象上调用的 summary() 输出中显示的显着性测试结果与在同一对象上调用的 anova() 输出中显示的结果之间的关系感到困惑。具体来说,我不明白(a)为什么对于 df=1 的因素(应该可以比较结果),结果并不总是一致;(b) 为什么 summary() 尊重分配给每个因素的对比权重,但 anova() 没有。

以下是 lm 的示例:

当 Species 的对比编码发生变化时,拟合 lm 中 Petal.Length 的显着性检验会发生变化——这是有道理的,因为该模型评估了每个因子,正交因子保持为零。但是,anova 结果中 Petal.Length 的显着性检验是相同的,并且与任一 lm 的结果都不匹配。

lmer 的行为(通过 lmerTest 包完成显着性测试)在相关方面令人困惑:

在这里,变量编码似乎仍然会影响 summary() 的输出中显示的结果,但不会影响 anova() 的输出中显示的结果。但是,两个 anova() 结果都与使用 sum 编码时获得的 lmer() 结果相匹配。

在我看来,在这两种情况下,anova() 都忽略了使用的变量编码并使用其他一些变量编码——在 lmer 的情况下,这似乎是总和编码——来评估重要性。我想知道如何执行使用分配的变量编码的统计测试。至少对于 lmer 来说,我可以使用 matchMD(); 例如,

但是,我不知道如何对 lm 进行等效测试(大概使用 glht,但我不知道正确的函数调用)。所以,我的问题是:

  1. 从概念上讲,为什么 anova() 不尊重分配的变量编码?(大概这都是预期的行为,但原因对我来说是不透明的。)

  2. 实际上,在 lm 对象上调用 anova() 时使用了哪些变量编码?

  3. 如何使用 lm 对象执行我想要的那种显着性测试?(我在上面使用了 df=1 的示例,因为它们可以在模型输出和 anova() 输出之间进行比较,但当然我真正想做的是测试 df>1 的效果。)

0 投票
1 回答
146 浏览

r - R模型中的错误.frame.default - 可变长度不同

也是这里的第一篇文章,这只是我第二次使用 R,所以请温柔。

我正在做一个项目,我在 R 中尝试通过 lmer 函数使用 lme4 和 lmeTest 包进行多项分析。为此,我列出了要分析的变量名称列表,我使用 for 循环进行迭代。因此它看起来像这样:

但是,这会产生此错误:

我很确定这个问题与 lmer 声明有关,也许与i当我手动将过去的值复制到i. 但是,由于“列表”中有很多值,我需要某种循环。

我已经在谷歌上搜索了很多,并在这里找到了几个试图解决相同/类似问题的答案,但对我来说它们不起作用。下面是一些更好的解决方案的链接列表,但是它们并没有解决我的问题。

任何人都可以对这种现象提供一些见解吗?

编辑 1 - @r2evans 要求提供可重现的示例。这在下面提供。

此时会在它说的地方生成错误:

关于数据的设置,我无法提供完整的数据集(显然),但是下面提供了一个演示结构的示例。这是原始变量的数据。

对于列表中的数据,上面示例数据的数据结构就是这样。

包含 raw 和 list 数据的两个文件都是 csv 文件。在整个过程中,只产生了一个错误(至少在我的结尾)。但是,如果您执行两次代码,它会抱怨文件夹已经存在。但是,除此之外它只会产生一个错误。我注意到的另一个细节是,i发生此错误时变量卡在 ID1,因此它不会浏览整个列表,它在第一个对象处失败。我希望这有助于澄清。如果您想要/需要重现错误的更多详细信息,请告诉我。

0 投票
1 回答
50 浏览

r - 如何从 ML 拟合的 lme4::lmer 模型中提取信息标准,并与 REML 拟合模型中的模型摘要相结合

我正在尝试从summary使用最大似然 (ML) 拟合的 HLM 模型中访问 AIC、BIC、logLik 和偏差数据lme4::lmer,并与使用受限最大似然 (REML) 拟合的基本相同的模型相结合。从返回的对象的结构lmersummary一团糟,我无法找出这些数据的存储位置/方式。

[更新:]根据我得到的回复,我更新了代码以反映所取得的进展:

代码示例:

我本质上想修改输出以类似于summaryif的输出REML = FALSE(不工作):
0 投票
1 回答
30 浏览

r - 如何从 lmerTest 模型中获得 CI 预测?

我们目前正在研究植物物候学。

我们为研究区域中存在的每个物种建立了一个线性混合模型。

我们将融雪天数(从融雪到夏季访问日的天数总和)设置为响应变量,而平均物候(每个地块的平均物候状态(每个地点有 3 个)由来自的平均物候状态计算每个小区分为12个子小区。从1-6,数字越大循环越高级)。嵌套在本地的年份和地块被设置为随机因素。

一旦模型建立和修改,我们想要预测每个物种从融雪开始的天数,以达到感兴趣的物候阶段,这些阶段恰好有 2、3、4 和 5 的平均值。(对应于营养、开花、水果发育和分散,分别)我已经尝试过这个功能predict(),但我没有得到每个物种的阶段之间的异质性,进展似乎是线性的(如图像文件所示)。

这可能仅仅是因为是一个线性模型,所以它只会给出线性响应吗?有没有其他方法可以从这些模型中获得预测并显示它们的 CI?

在此处输入图像描述

0 投票
0 回答
20 浏览

r - 如何测试一组预测之间的统计差异?R工作室

我们目前正在研究植物物候学。

我们为研究区域中存在的每个物种组(A Vs B)建立了一个线性混合模型。

我们将平均物候设置为响应变量(每个小区的平均物候状态(每个地方有 3 个)是通过将 12 个子小区的平均物候状态划分为每个小区来计算的。从 1 到 6,数字越大更高级的周期)而融雪天数(从融雪到夏季访问日的天数总和)是自变量。嵌套在该地区内的年份和地块被设置为随机因素。

模型建立和修改后,我们希望预测每个物种组(A vs B)沿生长季节的平均物候阶段,我们将其分为 10 个 DFSM 值(10、20、30、50、60、70、80 ,90,100)。即,我们要预测每个 DFSM 值 (10-100) 的平均物候状态

我们通过以下步骤做到了这一点:

现在的问题是,如何在同一 DFSM 级别测试每个组的预测之间的统计差异?(即,10 DFSM 的 A 组VS 10 DFSM的 B 组,... 20 DFSM的 A 组VS 20 DFSM的 B 组,... 30 DFSM 的 A 组VS 30 DFSM的 B 组 ...nDFSM)

我尝试rnorm()设置为每个组和每个 DFSM 级别获得的平均值,这样我可以获得一个不错的数据表示,然后运行一个简单ANOVA的比较平均值。但问题在于,相同 DFSM 水平预测的组之间的差异总是显着的。原因是我认为组内的差异很小,因为我获得平均值的方式,它总是会显示 A 组和 B 组之间的差异。

欢迎任何建议。太感谢了。