1

我想使用tidyr扩展函数将行和多列中具有多个 id 的数据框转换为具有一行的 df,其中我们有针对 id 和类别的所有组合的指示列。如果dplyr并且tidyr不是最合适的,请向其他类似传播的功能开放。

在下面的脚本中,我只能指定 1 列作为值对。我想将 cat1 和 cat2 作为值列。另外,我希望字段名称为“sentid1_cat1,sentid1_cat2”等。

test.df <- data.frame(sentid = 1:3, 
                      cat1 = c(1,0,0), 
                      cat2 = c(0,1,0))

test.df %>%
    spread(key = sentid, value = cat1, sep = '_')

编辑

期望的输出:

output.df <- data.frame(sentid1_cat1 = 1,
                        sentid1_cat2 = 0,
                        sentid2_cat1 = 0,
                        sentid2_cat2 = 1,
                        sentid3_cat1 = 0,
                        sentid3_cat2 = 0)
4

1 回答 1

3

dplyr+的解决方案tidyr

library(dplyr)
library(tidyr)

test.df %>%
  gather(variable, value, -sentid) %>%
  unite(variable, sentid, variable) %>%
  mutate(variable = paste0("sentid", variable)) %>%
  spread(variable, value) 

结果:

  sentid1_cat1 sentid1_cat2 sentid2_cat1 sentid2_cat2 sentid3_cat1 sentid3_cat2
1            1            0            0            1            0            0
于 2017-10-09T15:15:10.603 回答