3

我是一个非常非常平庸的程序员,但我仍然打算使用igraph python 库来确定用户在给定论坛中的中心性的影响,以预测他以后对该论坛的贡献。

我与使用NetworkX库做类似事情的其他人取得了联系,但鉴于论坛的当前规模,计算精确的中心性指数几乎是不可能的——这需要太多时间。

这是他的代码:

import networkx as netx
import sys, csv

if len(sys.argv) is not 2:
   print 'Please specify an input graph.'
   sys.exit(1)

ingraph = sys.argv[1]
graph = netx.readwrite.gpickle.read_gpickle(ingraph)

num_nodes = len(graph.nodes())
print '%s nodes found in input graph.' % num_nodes
print 'Recording data in centrality.csv'

# Calculate all of the betweenness measures
betweenness = netx.algorithms.centrality.betweenness_centrality(graph)
print 'Betweenness computations complete.'
closeness = netx.algorithms.centrality.closeness_centrality(graph)
print 'Closeness computations complete.'

outcsv = csv.writer(open('centrality.csv', 'wb'))

for node in graph.nodes():
   outcsv.writerow([node, betweenness[node], closeness[node]])

print 'Complete!'

我试图用 igraph 库编写类似的东西(它允许进行快速估计而不是精确计算),但我似乎无法将数据写入 CSV 文件。

我的代码:

import igraph
import sys, csv

from igraph import *

graph = Graph.Read_Pajek("C:\karate.net")

print igraph.summary(graph)

estimate = graph.betweenness(vertices=None, directed=True, cutoff=2)
print 'Betweenness computation complete.'

outcsv = csv.writer(open('estimate.csv', 'wb'))

for v in graph.vs():
   outcsv.writerow([v, estimate[vs]])

print 'Complete!'

我在 igraph 文档中找不到如何调用单个顶点(或 NetworkX 术语中的节点),所以这就是我收到错误消息的地方)。也许我也忘记了其他事情;我可能太糟糕的程序员没有注意到:P

我究竟做错了什么?

4

2 回答 2

2

因此,为了清楚起见,以下最终证明可以解决问题:

import igraph
import sys, csv

from igraph import *
from itertools import izip

graph = Graph.Read_GML("C:\stack.gml")

print igraph.summary(graph)

my_id_to_igraph_id = dict((v, k) for k, v in enumerate(graph.vs["id"]))

estimate = graph.betweenness(directed=True, cutoff=16)
print 'Betweenness computation complete.'

print graph.vertex_attributes()

outcsv = csv.writer(open('estimate17.csv', 'wb'))

outcsv.writerows(izip(graph.vs["id"], estimate))

print 'Complete!'
于 2011-12-15T21:01:27.560 回答
1

正如您已经注意到的,igraph 中的各个顶点是使用vs图形对象的属性访问的。vs表现得像一个列表,所以迭代它会产生图的顶点。每个顶点由Vertex类的一个实例表示,顶点的索引由其index属性给出。(请注意,igraph 对顶点和边都使用连续数字索引,这就是为什么您需要该index属性并且不能直接使用原始顶点名称的原因)。

我认为您需要的是最初存储在输入文件中的顶点的名称。名称存储在nameor idvertex 属性中(取决于您的输入格式),因此您需要的可能是:

for v in graph.vs:
    outcsv.writerow([v["name"], estimate[v.index]])

请注意,通过索引顶点对象来访问顶点属性,就像它是字典一样。另一种方法是将vs对象直接用作字典;这将为您提供一个列表,其中包含所有顶点的给定顶点属性的值。例如:

from itertools import izip

for name, est in izip(graph.vs["name"], estimate):
    outcsv.writerow([name, est])

使用生成器表达式的更快版本:

outcsv.writerows(izip(graph.vs["name"], estimate))
于 2011-11-19T20:21:40.113 回答