3

我有一个字符串数据表,我试图将其转换为列表并排序,而不对向量本身进行排序:

> DT <- data.table(x=c("A11, A12, A41",
+                      "A11, A41, B11, A6, A21",
+                      "A41, A12",
+                      "A12, A41",
+                      "A12, A6, B41, A93"));DT
                        x
1:          A11, A12, A41
2: A11, A41, B11, A6, A21
3:               A41, A12
4:               A12, A41
5:      A12, A6, B41, A93

我需要到达:

                        x
1:          A11, A12, A41
2: A11, A21, A41, A6, B11
3:               A12, A41
4:               A12, A41
5:      A12, A6, A93, B41

我尝试过使用一堆ordering、as.lists和 in data.frames,以及data.table我尝试编写的函数:

sortlists <- function(DT,col){
  for(i in 1:length(DT[,col])){
    DT[i,col]=order(DT[i,col])
  }
}

这会引发我的列位置大于 ncol(x) 的错误。无论如何,必须有更好的方法来获得我想要的结果。我对 R 很陌生,对 data.tables 也很陌生(因为我听到了好消息,所以我想进一步说明)所以任何帮助都将不胜感激!

4

1 回答 1

5

这将拆分字符向量,然后对每一行进行排序并返回一个列表

 DT[, list(y =  lapply(strsplit(x,', '), sort))]
                    y
1:        A11,A12,A41
2: A11,A21,A41,A6,B11
3:            A12,A41
4:            A12,A41
5:     A12,A6,A93,B41

和。如果您真的想要每行的单个字符串

DT[, list(y =  vapply(strsplit(x,', '), function(x) paste(sort(x), collapse = ', '), FUN.VALUE =character(1)))]
于 2012-12-06T00:02:05.007 回答