0

count.multiple我正在处理网络数据,并且在 R的igraph包中遇到了一个奇怪的(或者至少我没想到的)行为。

library(igraph)
library(plyr)

df <- data.frame( sender = c( "a", "a", "a", "b", "b", "c","c","d" ),
              receiver = c( "b", "b", "b", "c", "a", "d", "d", "a" ) )

我想要的是计算所有边缘并将倍数用作权重。

当我这样做时,ddply(df, .(sender, receiver), "nrow")我的结果是:

  sender receiver nrow
1      a        b    3
2      b        a    1
3      b        c    1
4      c        d    2
5      d        a    1

这是我所期望的。

但是,我无法使用 igraph's 重现这一点count.multiple,这是我期望在 igraph 中执行此操作的

df.graph <- graph.edgelist(as.matrix(df))
E(df.graph)$weight <- count.multiple(df.graph)

E(df.graph)$weight产生:

3 3 3 1 1 2 2 1

然后我使用了simplify命令:

df.graph <- simplify(df.graph)

产生

9 1 1 4 1

我明白这里发生了什么,简化只是添加权重,但我不明白为什么/何时使用它而不是ddply做什么......?

有什么想法吗?

谢谢!

4

1 回答 1

2

的默认行为simplify是添加多条边的权重。

为避免重复计算,您可以将初始权重设置为 1

g <- graph.edgelist(as.matrix(df))
E(g)$weight <- 1
g <- simplify( g )
E(g)$weight

或更改它们的聚合方式。

g <- graph.edgelist(as.matrix(df))
E(g)$weight <- count.multiple(g)
g <- simplify( g, edge.attr.comb = list(weight=max, name="concat", "ignore") )
E(g)$weight
于 2012-06-19T23:21:51.120 回答