这是Count number of times combination of events occur in dataframe columns 中提出的问题的扩展,我将再次改写这个问题,所以一切都在这里:
我有一个数据框,我想计算两列中每个事件组合发生的次数(以任何顺序),如果组合没有出现,则为零。
例如说我有
df <- data.frame('x' = c('a', 'b', 'c', 'c', 'c'),
'y' = c('c', 'c', 'a', 'a', 'b'))
所以
x y
a c
b c
c a
c a
c a
c b
a
并且b
不要一起出现,a
并且c
4 次(第 2、4、5、6 行)b
和c
两次(第 3 和第 7 行)所以我想返回
x-y num
a-b 0
a-c 4
b-c 2
我希望这是有道理的?提前致谢