我有一个类似的数据集:
val<-c("Y","N")
test<-data.frame(age=rnorm(n=100,mean=50,sd=10),var1=sample(val,100,T),var2=sample(val,100,T),var3=sample(val,100,T),sex=sample(c("F","M"),100,T))
我想创建一个使用 Hmisc 报告每个类别的平均年龄的摘要。
library(Hmisc)
summary.formula(age~sex+var1+var2+var3,data=test)
但是,var1-var3 实际上属于同一分类变量,级别为 var1、var 和 var3,而不是 Y/N。此外,这些并不是相互排斥的。那么,是否有可能以某种方式创建一个具有这些不同级别的变量 var4,这些级别不是互斥的并且类型
summary.formula(age~sex+var4,data=test)
并有如下输出:
+-------+-+---+----+
| | |N |age |
+-------+-+---+----+
|sex |F| 44|48.0|
| |M| 56|50.8|
+-------+-+---+----+
|var4 |var1| xx|yy|
| |var2| xx|yy|
|var3| xx|yy|
+-------+-+---+----+
|Overall| |100|49.6|
+-------+-+---+----+
任何帮助将非常感激...