我正在分析重复测量数据集(连续变量“y”在 4 个时间点评估;因子“时间”(4 个水平),协变量“cov1”、“cov2”、“cov3”在基线评估,ID 作为受试者标识符) . 缺失数据 (~14%) 仅在“y”中明显。
我使用了“mice”和“miceadds”包来估算数据,这很有效。但是,我不确定我是否正确指定了预测矩阵。
插补后要检验的线性混合模型为:
lmer(y ~ time + cov1 + cov2 + cov3 + (1|ID))
.
所以我尝试建立一个预测矩阵来使用相同的预测变量进行插补。只有因变量“y”应使用所有因子和协变量进行估算。
这是由以下预测矩阵捕获的吗?
ID cov1 cov2 cov3 time y
ID 0 0 0 0 0 0
cov1 0 0 0 0 0 0
cov2 0 0 0 0 0 0
cov3 0 0 0 0 0 0
time 0 0 0 0 0 0
y -2 1 1 1 1 0
此外,我已经阅读了不同的插补方法“2l.lmer”和“2l.pan”(例如这里),但我不确定要使用其中的哪一个。结果仅略有不同。
您对预测矩阵或“2l.lmer”/“2l.pan”有什么建议吗?任何帮助表示赞赏!
非常感谢!
卡塔琳娜