4

我已经开始使用 gephi 来帮助我显示数据集。数据集包含:

标签(特定图片的术语)作为节点

这些标签之间的归一化谷歌相似度距离作为具有权重的(在 0 和 1 之间)

每个标签都与其他标签相连,只要它们都属于同一张图片。因此,每张图片我都有一组节点和边缘。

我现在已将此数据集导入到 gephi,格式如下:

节点: id,标签

边缘:目标、源、权重(介于 0 和 1 之间)

像 500 个节点和 6000 个边。

我现在的问题是,在导入所有这些节点和边之后,图形看起来有点乱,没有真正的顺序。每张图片的每个集群都混合到其他图片的其他集群中。现在使用模块化作为分区算法(应该使用 Louvain 方法),图形正在着色,每种颜色代表一张图片。现在我可以使用 Force Atlas 2 布局来拆分这个烂摊子了。

我现在有一个带有 15 个集群的彩色图表(每个集群代表 1 张图片)

现在我想根据它们的归一化谷歌距离(边缘的权重)使用标签(节点)再次对这些集群进行聚类,这些标签应该是在其含义上有点相等的标签。

我希望你们明白我想要完成什么。我也可以上传一张图片来澄清一下。

非常感谢

4

2 回答 2

1

我认为您无法使用标准版本的 Gephi 做到这一点。您需要开发一个插件来实现流程的最后一步。

Gephi 非常适合可视化和浏览图形,但是(目前)在处理拓扑属性方面有更完整的工具。例如,igraph库(在 C、R 和 python 中可用)可能更适合您。请注意,您可以使用与 Gephi 和 igraph 兼容的文件格式,这样您就可以在同一数据上使用这两种工具。

于 2013-05-04T21:07:21.070 回答
0

我能够解决我的问题。我必须自己导入这 15 个集群中的每一个。通过这种方式,我可以对少数几个使用模块化方法。

于 2013-05-08T21:58:07.383 回答