我最近不得不根据因素的相互作用来绘制一些数据,我发现它比我认为 R 中这种常见的东西要困难得多。我怀疑我遗漏了一些东西。假设我有一个包含 30 个数字的向量以及一对因子。
n <- runif(30, min=0, max=10)
a <- gl(2, 1, 30)
b <- gl(6, 2, 30)
我想要每种因素组合的平均值。
y <- tapply(n, a:b, mean)
现在我想使用格子xyplot来绘制这些均值,其中我为 的两个值中的每一个都有一个面板a
。手段就是y
价值,b
因素就是x
价值。股票xyplot公式将类似于
xyplot( y ~ b | a, data=mydf)
其中mydf
是一个数据框,其中包含从上面的tapply计算的列y
、b
和。但我的问题是如何解开相互作用的因素。这就是我所做的。a
factorSplit <- strsplit(names(y), ":")
a1 <- sapply(factorSplit, function(x) {x[1]})
b1 <- sapply(factorSplit, function(x) {x[2]})
mydf <- data.frame(y, b1, a1)
现在mydf
有
> mydf
y b1 a1
1:1 3.856797 1 1
1:2 3.487181 2 1
1:3 8.411425 3 1
1:4 3.757709 4 1
1:5 4.982970 5 1
1:6 6.480346 6 1
2:1 2.778864 1 2
2:2 4.390511 2 2
2:3 7.119926 3 2
2:4 4.707945 4 2
2:5 5.546894 5 2
2:6 8.984631 6 2
我可以用
xyplot(y ~ b1 | a1, mydf, layout=c(1,2))
但我觉得这个业务与strsplit和names(y)
然后sapply是矫枉过正。似乎应该有一种更直接的方法来恢复使用tapply创建的因子交互。