2

运行中介分析时,如何遍历包含变量名称排列的数据框行lavaan

假设我有 4 个变量var1, var2, var3, var4:

df<- data.frame(var1 = rnorm(100), 
                var2 = rnorm(100), 
                var3 = rnorm(100),
                var4 = rnorm(100))

使用gtools::permutations()I 将 4 个变量的所有可能排列保存在 3 个组中:

permut <- 
  gtools::permutations(n = 4, r = 3, v = names(df), repeats.allowed = FALSE)

colnames(permut) <- c("Y", "X", "M")

> head(permut)
     Y      X      M     
[1,] "var1" "var2" "var3"
[2,] "var1" "var2" "var4"
[3,] "var1" "var3" "var2"
[4,] "var1" "var3" "var4"
[5,] "var1" "var4" "var2"
[6,] "var1" "var4" "var3"

然后我使用lavaan语法设置中介模型,我对 and 之间的关系的中介效应M感兴趣:XY

mod <- "
    M ~ a * X
    Y ~ c * X + b * M
    ind := a*b
    tot := c + (a*b)
    "

我想运行模型并存储它的结果以供将来检查:

library(lavaan)
library(dplyr)

#fit the model
fit <- sem(mod, df, se = "robust")

#save results
result <-
parameterestimates(fit) %>% filter(op != "~~")

我的问题是这样的:

如何指示R使用Y,X,M的每一行中的变量名,permut使用来自的数据df和模型语法来拟合模型,mod并最终存储每个模型拟合的结果?

上面的代码是我想用同样的方式运行更复杂的模型的最简单的可能场景。

我知道有关循环不同变量的线性模型的答案:循环遍历所有可能的组合循环遍历回归模型项的组合,每个自变量的线性回归循环分别针对因变量,并且可能是最接近的:如何使用参考变量通过公式中的字符串?,但我仍然被困在周末无法解决这个问题。

4

1 回答 1

2

这是一种方法:

fits <- apply(permut, 1, function (p) {
    permuted.df <- df[p]
    colnames(permuted.df) <- names(p)
    sem(mod, permuted.df, se="robust")
})

fits包含 中每个 3 排列的 SEM 结果permut。要查看例如第一次拟合的估计值,您可以照常进行:

> parameterestimates(fits[[1]]) %>% filter(op != "~~")
  lhs op     rhs label         est         se          z     pvalue    ci.lower
1   M  ~       X     a -0.18393765 0.10977670 -1.6755618 0.09382406 -0.39909603
2   Y  ~       X     c  0.07314372 0.09891034  0.7394952 0.45960637 -0.12071699
3   Y  ~       M     b  0.01944518 0.08852450  0.2196587 0.82613697 -0.15405965
4 ind :=     a*b   ind -0.00357670 0.01600038 -0.2235385 0.82311644 -0.03493686
5 tot := c+(a*b)   tot  0.06956702 0.09816192  0.7086966 0.47851276 -0.12282680
    ci.upper
1 0.03122074
2 0.26700443
3 0.19295001
4 0.02778346
5 0.26196084
于 2019-02-25T10:19:23.110 回答