9

我在 R 中使用 glmulti 进行模型平均。我的模型中有大约 10 个变量,使得详尽的筛选不切实际 - 因此我需要使用遗传算法 (GA)(调用:method = "g")。

我需要包含随机效果,所以我使用 glmulti 作为 lme4 的包装器。此处提供了执行此操作的方法http://www.inside-r.org/packages/cran/glmulti/docs/glmulti并且 glmulti 包中还包含一个 pdf,其中包含更详细的信息。问题是当告诉 glmulti 在此设置中使用 GA 时,它会无限期地运行,即使在找到最佳模型之后也是如此。

这是从 glmulti 包中包含的 pdf 中获取的示例:

library(lme4)
library(glmulti)

# create a function for glmulti to act as a wrapper for lmer:
lmer.glmulti <- function (formula, data, random = "", ...) {
lmer(paste(deparse(formula), random), data = data, REML=F, ...)
}

# set some random variables:
y = runif(30,0,10) # mock dependent variable
a = runif(30) # dummy covariate
b = runif(30) # another dummy covariate
c = runif(30) # an another one
x = as.factor(round(runif(30),1))# dummy grouping factor

# run exhaustive screening with lmer:
bab <- glmulti(y~a*b*c, level = 2, fitfunc = lmer.glmulti, random = "+(1|x)")

这工作正常。问题是当我告诉它使用遗传算法时:

babs <- glmulti(y~a*b*c, level = 2, fitfunc = lmer.glmulti, random = "+(1|x)", method = "g")

它只是无限期地运行,AIC 不会改变:

...

After 19550 generations:
Best model: y~1
Crit= 161.038899734164
Mean crit= 164.13629335762
Change in best IC: 0 / Change in mean IC: 0

After 19560 generations:
Best model: y~1
Crit= 161.038899734164
Mean crit= 164.13629335762
Change in best IC: 0 / Change in mean IC: 0

After 19570 generations:
Best model: y~1
Crit= 161.038899734164
Mean crit= 164.13629335762

... etc.

我尝试使用告诉 glmulti 何时停止的调用(deltaB = 0,deltaM = 0.01,conseq = 6),但似乎没有任何效果。我认为问题必须在于设置功能(?)。这可能是非常明显的事情,但是我是 R 新手,我无法解决。

对此的任何帮助将不胜感激。

4

2 回答 2

5

我从包维护者那里收到了解决方案。问题是探索的模型数量是由参数设置的confsetsize。默认值为 100。

根据?glmulti,这个论点是:

要查找的模型数量,即返回的置信集的大小。

解决方法是设置confsetsize为小于等于模型总数。

从 OP 中没有停止的示例开始:

babs <- glmulti(y~a*b*c, level = 2, fitfunc = lmer.glmulti, 
                random = "+(1|x)", method = "g")

glmulti将使用以下方法确定候选模型的总数method = "d"

babs <- glmulti(y~a*b*c, level = 2, fitfunc = lmer.glmulti, 
                random = "+(1|x)", method = "d")



Initialization...
TASK: Diagnostic of candidate set.
Sample size: 30
0 factor(s).
3 covariate(s).
...
Your candidate set contains 64 models.

因此,设置confsetsize为小于或等于 64 将导致所需的行为。

babs <- glmulti(y~a*b*c, level = 2, fitfunc = lmer.glmulti, 
                random = "+(1|x)", method = "g", confsetsize = 64)

但是,对于小型模型,使用穷举搜索(method = "h")可能就足够了:

babs <- glmulti(y~a*b*c, level = 2, fitfunc = lmer.glmulti, 
                random = "+(1|x)", method = "h")
于 2013-05-15T17:25:30.947 回答
2

是的,我已经解决了这个问题 - 问题是我用来测试运行这个包的示例(上面)只包含 3 个变量。当您添加第四个时,它可以正常工作:

d = runif(30)

并再次运行告诉它使用 GA:

babs <- glmulti(y~a*b*c*d, level = 2, fitfunc = lmer.glmulti, random = "+(1|x)", method = "g")

回报:

...

After 190 generations:
Best model: y~1
Crit= 159.374382952181
Mean crit= 163.380382861026
Improvements in best and average IC have bebingo en below the specified goals.
Algorithm is declared to have converged.
Completed.

如果您尝试使用少于三个变量的 GA,则使用带有 GLM 的开箱即用的 glmulti 会得到相同的结果。这不是一个真正的问题,但是如果您只有三个变量,则可以进行详尽的搜索。问题就是例子。

于 2012-09-02T15:48:12.353 回答