8

我会提前道歉 - 我知道这可能已经在其他地方得到了回答,但我似乎无法找到我需要的答案,也无法设法使我找到的其他代码适应我的需要。

我有一个数据框:

FILE | TECHNIQUE | COUNT
------------------------
A    | ONE       | 10
A    | TWO       | 25
B    | ONE       |  5
B    | TWO       | 30
C    | ONE       | 30
C    | TWO       | 50

我想生成一个 COUNT 值在 ONE 和 TWO 之间的差异的数据框,每个文件都有一行,即

FILE | DIFFERENCE
-----------------
A    |   15
B    |   25
C    |   20

我确信我应该能够使用 base R 或 Plyr 相当容易地做到这一点,但我有点卡住了。任何人都可以提出一个好的方法来做到这一点,也许 Plyr 上的好教程可能会帮助我在未来解决类似的问题?

谢谢

4

1 回答 1

11

aggregate在基地中使用:

> aggregate(.~FILE, data= DF[, -2], FUN=diff)
  FILE COUNT
1    A    15
2    B    25
3    C    20

ddply在 plyr 中使用

> ddply(DF[,-2], .(FILE), summarize, DIFFERENCE=diff(COUNT))
  FILE DIFFERENCE
1    A         15
2    B         25
3    C         20

data.table

> # library(data.table)
> DT <- data.table(DF)
> DT[, diff(COUNT), by=FILE]
   FILE V1
1:    A 15
2:    B 25
3:    C 20

by

> with(DF, by(COUNT, FILE, diff))
FILE: A
[1] 15
----------------------------------------------------------------------------- 
FILE: B
[1] 25
----------------------------------------------------------------------------- 
FILE: C
[1] 20

tapply

> tapply(DF$COUNT, DF$FILE, diff)
 A  B  C 
15 25 20 

来自summaryBydoBy 包

> # library(doBy)
> summaryBy(COUNT~FILE, FUN=diff, data=DF)
  FILE COUNT.diff
1    A         15
2    B         25
3    C         20

更新 百分比:

> aggregate(.~FILE, data= DF[, -2], function(x) (x[1]/x[2])*100)
  FILE    COUNT
1    A 40.00000
2    B 16.66667
3    C 60.00000
于 2013-09-03T13:26:41.640 回答