我正在尝试使用“simr”包创建用于功率模拟的多级数据结构。
数据有 5 列:学生、班级、外向、教师经验、学生性别。学生嵌套在班级中,外向性(平均居中,范围在 -4.21 和 4.78 之间)和性别是学生水平的预测因素,教师经验是班级水平的预测因素(平均中心,范围从 -12 到 11)。我希望数据框包含 600 个观察值(学生),20 个嵌套在 30 个类中。
我可以使用下面的代码创建数据框,但它在美学上被许多标准所接受。另一个问题是我希望学生外向性和教师经验可以正常分布,我的代码似乎输出的范围更小..
library(truncnorm)
set.seed(123)
pupil <- as.factor(seq(1:600))
class <- as.factor(rep(1:30,20))
extrav<-rtruncnorm(n=600,a=-4.21,b=4.78)
X <- cbind(pupil=pupil,class=class, extrav=extrav)
class<-seq(1:30)
texp<-rtruncnorm(30,-12,11)
class_texp<-cbind(class,texp)
X<-merge(X,class_texp)
sex<-rep(1:2,300)
sex<-sex-1
X<-cbind(X,sex)
View(X)