我有一个令人讨厌的数据表,其中有几种不同类型的混乱,我无法弄清楚如何组合使用tidyr和splitstackshape包的其他一些答案。
subject <- c("A", "B", "C")
review <- c("Bill: [1.0]", "Bill: [2.0], Cathy: [3.0]", "Fred: [4.0], Cathy: [2.0]")
data.table(cbind(subject, review))
这使:
subject review
1: A Bill: [1.0]
2: B Bill: [2.0], Cathy: [3.0]
3: C Fred: [4.0], Cathy: [2.0]
这表现出整洁的混乱,多个变量存储在一列中,以及一些丑陋的格式。
我想要的是一张像这样的桌子:
subject Bill Fred Cathy
A 1.0 0.0 0.0
B 2.0 0.0 3.0
C 0.0 4.0 2.0