我已经开始使用 gephi 来帮助我显示数据集。数据集包含:
标签(特定图片的术语)作为节点
这些标签之间的归一化谷歌相似度距离作为具有权重的边(在 0 和 1 之间)
每个标签都与其他标签相连,只要它们都属于同一张图片。因此,每张图片我都有一组节点和边缘。
我现在已将此数据集导入到 gephi,格式如下:
节点: id,标签
边缘:目标、源、权重(介于 0 和 1 之间)
像 500 个节点和 6000 个边。
我现在的问题是,在导入所有这些节点和边之后,图形看起来有点乱,没有真正的顺序。每张图片的每个集群都混合到其他图片的其他集群中。现在使用模块化作为分区算法(应该使用 Louvain 方法),图形正在着色,每种颜色代表一张图片。现在我可以使用 Force Atlas 2 布局来拆分这个烂摊子了。
我现在有一个带有 15 个集群的彩色图表(每个集群代表 1 张图片)
现在我想根据它们的归一化谷歌距离(边缘的权重)使用标签(节点)再次对这些集群进行聚类,这些标签应该是在其含义上有点相等的标签。
我希望你们明白我想要完成什么。我也可以上传一张图片来澄清一下。
非常感谢