9

我想知道是否可以使用 networkx 从输入大图中提取所有可能的诱导子图(graphlet),在子图中具有特定数量的节点,或者是否有另一个包可以完成这项工作?例如,如果我有一个以 networkx 邻接表格式显示的大图,

图 G:

1 2 3 7
2 1 4
3 1 4 6 5
4 2 3 5
5 3 4 6
6 3 5 7
7 1 6

看起来像

在此处输入图像描述

如果我想用 3 个节点提取 graphlet,算法应该返回我

子图1:

1 2 3
2 1
3 1

[(1,2),(1,3)] 在此处输入图像描述 子图2:

1 3 7
3 1
7 1

[(1,3),(1,7)] 在此处输入图像描述 子图3:

3 4 5
4 3 5
5 3 4

[(3,4),(3,5),(4,5)] 在此处输入图像描述

子图 4、子图 5、子图 6...

以下是@Hooked 提出的问题的代码。假设n = 3

import itertools
target = nx.complete_graph(3)
for sub_nodes in itertools.combinations(g.nodes(),len(target.nodes())):
    subg = g.subgraph(sub_nodes)
    if nx.is_connected(subg):
        print subg.edges()

输出看起来像

[(1, 2), (1, 3)]
[(1, 2), (2, 4)]
[(1, 2), (1, 7)]
[(1, 3), (3, 4)]
[(1, 3), (3, 5)]
[(1, 3), (3, 6)]
[(1, 3), (1, 7)]
[(1, 7), (6, 7)]
[(2, 4), (3, 4)]
[(2, 4), (4, 5)]
[(3, 4), (3, 5), (4, 5)]
[(3, 4), (3, 6)]
[(3, 5), (3, 6), (5, 6)]
[(3, 6), (6, 7)]
[(4, 5), (5, 6)]
[(5, 6), (6, 7)]
4

2 回答 2

13

target这假设您想要必须定义的给定的所有匹配子图。本机方法是遍历所有节点组合,找到连接的节点然后检查同构。目前尚不清楚您是否想要网络主题或graphlet。在 graphlet 中,原始图中存在的所有边都必须存在 - 这会将 3-4-5 从您的目标中排除。此方法查找graphlet,要查找主题,您必须检查每个组合是否存在诱导子图(以及有多少!)。

import networkx as nx

g = nx.Graph()
g.add_edge(1,2);g.add_edge(1,3)
g.add_edge(1,7);g.add_edge(2,4)
g.add_edge(3,4);g.add_edge(3,5)
g.add_edge(3,6);g.add_edge(4,5)
g.add_edge(5,6);g.add_edge(6,7)

import itertools

target = nx.Graph()
target.add_edge(1,2)
target.add_edge(2,3)

for sub_nodes in itertools.combinations(g.nodes(),len(target.nodes())):
    subg = g.subgraph(sub_nodes)
    if nx.is_connected(subg) and nx.is_isomorphic(subg, target):
        print subg.edges()

对我来说,这给出了边缘集匹配:

[(1, 2), (1, 3)]
[(1, 2), (2, 4)]
[(1, 2), (1, 7)]
[(1, 3), (3, 4)]
[(1, 3), (3, 5)]
[(1, 3), (3, 6)]
[(1, 3), (1, 7)]
[(1, 7), (6, 7)]
[(2, 4), (3, 4)]
[(2, 4), (4, 5)]
[(3, 4), (3, 6)]
[(3, 6), (6, 7)]
[(4, 5), (5, 6)]
[(5, 6), (6, 7)]

您的示例在此处列出。

于 2014-03-04T19:20:08.577 回答
2

对于最终在这里遇到相同问题但节点过多的人,这里对@Hooked 的答案进行了一些简单的改进(尽管我确信@Hooked 在评论中提到了更好的解决方案,这只是一个快速复制-为那些因与我相同的原因而最终来到这里并遇到缩放问题的人粘贴修复)

1) igraph 比 networkx 更好地扩展

2)我们只能取一个节点的邻域来消除大部分不必要的组合

例如,如果我们正在寻找motif更大的network(两个 igraph 对象)

    motif_rank = max(max(motif.shortest_paths_dijkstra()))
    result = collections.OrderedDict.fromkeys(network.vs['label'], 0)

    for node in self.network.vs:
        # Get relevant nodes around node of interest that might create the motif of interest
        nodes_to_expand = {node}
        for rank in range(motif_rank):
            nodes_expanded = nodes_to_expand
            for node_to_expand in nodes_to_expand:
                nodes_expanded = set.union(nodes_expanded, set(node_to_expand.neighbors()))
            nodes_to_expand = nodes_expanded

        # Look at all combinations
        for sub_nodes in itertools.combinations(nodes_to_expand, motif.vcount()):
            subg = network.subgraph(sub_nodes)
            if subg.is_connected() and subg.isomorphic(motif):
                result[node['label']] = result[node['label']]+1
于 2018-06-19T11:00:43.463 回答