3

我需要重新格式化 R 中的表格。

我有一张这样的桌子。

ID  category   
1   a   
1   b   
2   c   
3   d   
4   a   
4   c  
5   a   

我想把它改成

ID  category1   category2  
1           a           b  
2           c        null  
3           d        null  
4           a           c  
5           a        null  

这在 R 中可行吗?

4

2 回答 2

2

这是一个非常简单的“从长到宽”类型的整形问题,但您需要一个辅助“id”(或“时间”)变量。

您可以尝试getanID从我的“splitstackshape”包中使用并用于dcast从长到宽重塑。getanID将创建一个名为“.id”的新列,用作您的“时间”变量:

library(splitstackshape)
dcast.data.table(getanID(mydf, "ID"), ID ~ .id, value.var = "category")
#    ID 1  2
# 1:  1 a  b
# 2:  2 c NA
# 3:  3 d NA
# 4:  4 a  c
# 5:  5 a NA
于 2015-09-09T18:43:27.500 回答
1

与 Ananda 相同,但使用dplyrand tidyr

library(tidyr)
library(dplyr)
mydf %>% group_by(ID) %>%
    mutate(cat_row = paste0("category", 1:n())) %>%
    spread(key = cat_row, value = category)

# Source: local data frame [5 x 3]
# 
#   ID category1  category2
# 1  1         a          b
# 2  2         c         NA
# 3  3         d         NA
# 4  4         a          c
# 5  5         a         NA
于 2015-09-09T18:45:43.797 回答