我正在使用箱线图和条形图基于几个分类变量(因子、x 变量)绘制连续数据(y 变量)。为此,默认绘图函数提供了一个方便的基于公式的界面,我可以在其中输入数据:响应 ~ 因子 1 + 因子 2 + ... 并获得因子 1、因子 2 等的组合作为 x 轴坐标。
但是,我正在努力找出这些原始坐标值对于我的数据是什么,因为我想在我的图中注释一些值。
例子:
data(iris)
iris[,"DummyFactor"] <- as.factor(c("First", "Second"))
boxplot(Sepal.Length ~ Species + DummyFactor, data = iris)
stripchart(Sepal.Length ~ Species + DummyFactor, data = iris, vertical=T, add=T, pch=16)
# y-axis values:
ys <- iris[,"Sepal.Length"]
# x-axis:
# How to obtain the x-axis values on my current plot?
通过实验我发现这个例子中的 x 值是:
xs <- apply(model.matrix(~ -1 + Species + DummyFactor, data = iris), MARGIN=1, FUN=function(x) sum(c(1,2,3,3)[as.logical(x)]))
# Annotate a few examples, e.g. 7th, 100th and 120th observation
points(x=xs[c(7,100,120)], y=ys[c(7,100,120)], pch=16, col="red", cex=2)
iris[c(7,100,120),]
#> iris[c(7,100,120),]
# Sepal.Length Sepal.Width Petal.Length Petal.Width Species DummyFactor
#7 4.6 3.4 1.4 0.3 setosa First
#100 5.7 2.8 4.1 1.3 versicolor Second
#120 6.0 2.2 5.0 1.5 virginica Second
...这可行,但似乎不是解决此问题的正确方法。似乎箱线图和条形图的公式实现对用户是隐藏的。
在一般情况下,是否有一种简单的方法来获取这些坐标?