5

我正在尝试找到一种将多行文本转换为数据框的方法。我不确定是否有一种方法可以read.delim() 用来读取多行文本并使用类似于rehape()?的内容创建以下数据框。

数据结构如下:

A: 1
B: 2
C: 10
A: 34
B: 20
C: 6.7
A: 2
B: 78
C: 35

我想将此数据转换为类似于以下数据框的内容:

A             B             C
1             2             10
34            20            6.7
2             78            35

如果有明显的方法可以做到这一点,我们深表歉意!

4

4 回答 4

11

怎么样 :

s<-"A: 1
B: 2
C: 10
A: 34
B: 20
C: 6.7
A: 2
B: 78
C: 35
"
d<-read.delim(textConnection(s),header=FALSE,sep=":",strip.white=TRUE)
cols<-levels(d[,'V1'])
d<-data.frame(sapply(cols,function(x) {d['V2'][d['V1']==x]}, USE.NAMES=TRUE))

产生:

   A  B    C
1  1  2 10.0
2 34 20  6.7
3  2 78 35.0
于 2010-03-06T15:22:39.773 回答
4

以下是使用 plyr 包的方法:

require("plyr")
my.data <- "A: 1
            B: 2
            C: 10
            A: 34
            B: 20
            C: 6.7
            A: 2
            B: 78
            C: 35"   
df <- read.delim(textConnection(my.data),header=FALSE,sep=":",strip.white=TRUE)

as.data.frame(dlply(df,.(V1),function(x) x[[2]]))

你得到

   A  B    C
1  1  2 10.0
2 34 20  6.7
3  2 78 35.0

你可以通过玩dlply(df,.(V1))dlply(df,.(V1),function(x) x)

于 2010-03-06T05:53:37.803 回答
2

我也在 R-help 上发布了这个问题,并得到了 Phil Spector 建议的回复unstack

这是对 Leo Alekseyev 回应的修改

my.data <- "A: 1
            B: 2
            C: 10
            A: 34
            B: 20
            C: 6.7
            A: 2
            B: 78
            C: 35"   
df <- read.delim(textConnection(my.data),header=FALSE,sep=":",strip.white=TRUE)
unstack(df, V2 ~ V1)

这导致:

   A  B    C
1  1  2 10.0
2 34 20  6.7
3  2 78 35.0

与其他深思熟虑的答案相比,这种方法的一些优点是您不需要提前指定列数。它也不需要任何额外的软件包。

于 2010-03-06T21:46:32.300 回答
0

这是使用重塑的一种解决方案

s<-"A: 1
B: 2
C: 10
A: 34
B: 20
C: 6.7
A: 2
B: 78
C: 35
"
d<-d<-read.delim(textConnection(s),header=FALSE,sep=":",strip.white=TRUE)
N<-nrow(d)%/%3
d$id<-rep(1:N,each=3)
reshape(d,dir="wide",timevar="V1",idvar="id")

哪个生产

  id V2.A V2.B V2.C
1  1    1    2 10.0
4  2   34   20  6.7
7  3    2   78 35.0
于 2010-03-06T05:29:20.697 回答