4

我整个晚上都在努力弄清楚如何在 R 中做到这一点。

基本上我有一个如下数据集:

id<-c(1,1,1,2,2,3,3,3,3)
label<-c('a', 'b', 'c', 'b', 'd', 'a', 'c', 'd', 'e')
mydata<-as.data.frame(cbind(id, label))
mydata$id<-as.integer(as.character(mydata$id))
mydata$label<-as.character(mydata$label)
mydata
  id label
1  1     a
2  1     b
3  1     c
4  2     b
5  2     d
6  3     a
7  3     c
8  3     d
9  3     e

我想将 mydata 转换为 mylist 如下所示:

mylist<-list()
mylist[[1]]<-c('a', 'b', 'c')
mylist[[2]]<-c( 'b', 'd')
mylist[[3]]<-c( 'a', 'c', 'd', 'e')
mylist
[[1]]
[1] "a" "b" "c"

[[2]]
[1] "b" "d"

[[3]]
[1] "a" "c" "d" "e"

那么,我如何从 mydata 到 mylist 呢?

注意:我的实际数据框有大约 200 万行。

[背景:我正在研究一个多标签分类问题,需要计算 F1、精度和召回率以及作为否。标签是可变的,我想我可以将它们全部放入一个大列表中并以这种方式进行比较]

4

1 回答 1

10

看看?split

split(mydata$label, mydata$id)
#$`1`
#[1] "a" "b" "c"
#
#$`2`
#[1] "b" "d"
#
#$`3`
#[1] "a" "c" "d" "e"
于 2013-09-24T21:10:42.067 回答