-2

我需要一些数据分析方面的帮助。
我确实有两个数据集(之前和之后),我想看看它们之间的差异有多大。

11330    STAT1
2721    STAT2
52438    STAT3
6124    SUZY

17401    STAT1
3462    STAT2
0    STAT3
72    SUZY

试图将它们与tapply(before$V1, before$V2, FUN=mean).
但是当我试图绘制它时,在 x 轴上不是得到组名而是得到数字。如何绘制这样的挖掘数据(Y 轴上的频率和 X 轴上的组名)?

还想问一下 R 中比较此类数据集的正确命令是什么,因为我愿意找到它们之间的区别?


已编辑

输入($V1 之前)
c(11330L、2721L、52438L、6124L)

dput(before$V2)
结构(1:4, .Label = c("STAT1", "STAT2", "STAT3","SUZY"),class = "factor")

4

1 回答 1

5

这里有几个想法。

这就是我认为您的数据的样子?

before <- data.frame(val=c(11330,2721,52438,6124),
                     lab=c("STAT1","STAT2","STAT3","SUZY"))
after <- data.frame(val=c(17401,3462,0,72),
                     lab=c("STAT1","STAT2","STAT3","SUZY"))

将它们组合成一个带有period变量的数据框:

combined <- rbind(data.frame(before,period="before"),
      data.frame(after,period="after"))

重新格式化为矩阵并使用 (base R) 绘制dotchart

library(reshape2)
m <- acast(combined,lab~period,value.var="val")
dotchart(m)

绘图ggplot

library(ggplot2)
qplot(lab,val,colour=period,data=combined)
于 2012-09-24T16:01:10.497 回答