我有一个看起来像这样的宽表格:
ID Test_11 LVL11 Score_X_11 Score_Y_11 Test_12 LV12 Score_X_12 Score_Y_12
1 A I 100 NA NA NA 100 100
2 A II 90 100 B II 90 85
3 NA NA NA NA B II 90 NA
4 A III 100 80 A III 75 75
5 B I NA 90 NA NA 60 50
6 B I 70 100 NA NA NA NA
7 B II 85 NA A I 60 60
还有一个用于排序的表格,看起来像这样
Test_11 A
Test_11 B
Test_12 A
Test_12 B
第二张表告诉我们的是,对于 Test_11,有两个版本,A 和 B(对于 Test_12 相同)。
我正在尝试创建一系列箱线图来绘制 Test_11 和 Test_12 的每个组合及其各自版本(A、B)的分布。因此,对于 Test_11==A,创建的箱线图将具有三组(I、II、III),然后是来自 Test_11==A 的子集的结果图形信息,然后对于 Test_11==B、Test_12==A 也是如此, 和 Test_12==B。在此示例中,总共应该创建 4 个图表。
我在 R 中拥有的是:
z <- subset(df, df$Test_11=="A")
plot(z$LVL11, z$Score_X_11, varwidth = TRUE, notch = TRUE, xlab = 'LVL',
ylab = 'score')
我想要并且无法弄清楚如何做的是编写一个 for 循环来为我做子集,以便我可以为我的实际数据集自动执行此操作,其中包含几十个这些组合。
感谢您的任何帮助和指导。