0

这里我做了一些纵向数据。可变结果是来自患者的生物标志物水平。变量访问代表访问标签。可变时间是指距基线 t1 的天数。有两种响应状态,“是”和“否”。我想知道的是,响应者和非响应者之间的生物标志物水平在时间过程中是否存在任何差异。

我使用线性混合模型进行分析。

#generate data    
df = data.frame(result = rnorm(200)+2, 
            visit = rep(c('t1', 't2', 't3', 't4', 't5'), 40),
            time = rep(c(0, 8, 14, 30, 60), 40),
            response = rep(c('yes', 'no'), each=100),
            id = rep(1:40, each=5) ) 

# run lme model 
library(lme4)
library(lmerTest)
lmer(result~time*response+(1|id),data=df)
lmer(result~factor(visit)*response+(1|id), data=df)
lmer(result~factor(visit, ordered=TRUE)*response+(1|id), data=df)

我的问题是:1.在这个分析中,我应该使用时间(连续)还是访问(因子)?
2.如果我使用visit(factor),它应该是有序的还是无序的?在选择要使用的时间变量类型(因子与连续)方面是否有任何指导方针?

多谢。

4

1 回答 1

0

...我应该将访问时间视为连续变量还是因素?

一个因素,因为我认为您(正确地?)希望在同一时间段内的观察具有相同的随机效应项。visits但是,如果所有访问级别同时time下降,这将与具有随机效应相同。他们没有在你的例子中,尽管我认为它有问题,因为例如,id = 2它的第一次访问时间t = 60

> df[df$id == 2, ]
       result visit time response id
5  1.84451763    t1   60       no  2
6  1.30286252    t2    0       no  2
7  0.40109211    t3    8       no  2
8 -0.01516773    t4   14       no  2

我猜另一种情况是,(time|id)在这种情况下,每个人都有一个随机的时间斜率,或者(time|response)在这种情况下,两个响应类别中的每一个都有一个随机斜率。这在您的应用程序中可能有意义吗?

于 2017-12-02T11:59:03.677 回答