3

几天来,我一直在一个棘手的数据集上同时使用 k-means 和 Fuzzy c 均值,它产生了不错的结果,但我想可视化和操作图形输出,我发现了一个很棒的可视化工具Gephi。如果您单击主页上的图片,它将加载您可以观看的视频。

在 gephis 支持的图形格式页面上他们有一个可能的导入格式列表:

* GEXF
* GDF
* GML
* GraphML
* Pajek NET
* GraphViz DOT
* CSV
* UCINET DL
* Tulip TPL
* Netdraw VNA
* Spreadsheet

查看 matlab,我可以输出集群数据的格式可能是 csv。在 gehpis 网站上他们解释了格式、边缘列表、混合、矩阵。

我不太确定他们的意思。在 matlab 中使用 FCM 我得到 3 个输出centerUobjFun

[centers, U, objFun] = fcm(data, clusters, options);

所以我的问题是如何从这些数据中以他们需要的格式构建 CSV 文件。

https://gephi.org/users/supported-graph-formats/spreadsheet/

http://forum.gephi.org/viewtopic.php?t=1896

我将奖励任何可以提供 100 分的人,因为这个可视化工具是我从现在开始想要使用的工具,而且到目前为止还没有任何问题可以解释如何做到这一点。所以它可能对 gephi/matlab 用户的未来和社区有用。

4

1 回答 1

3

这里的问题是您需要能够将数据表示为图表。即使您的数据不是图表,它仍然可以表示为可视化。您需要确定数据中的哪些内容可以代表节点以及哪些内容可以代表边。完成此操作后,将数据写入可由 Gephi(或其他图形/网络可视化工具)导入的文件非常简单。由于您尚未发布数据示例,因此很难建议如何做到这一点。

问自己以下有关数据的问题:

  1. 什么可以表示为节点?
  2. 什么可以表示为连接 #1 中定义的节点的边?

每个节点都必须有一个与之关联的唯一标识符(这可以是一个简单的数值或字符串)。

这是困难的部分,因为将集群数据表示为图形,如果操作不正确,可能会从可视化中提供误导性的解释。

完成此操作后,将其转换为文件格式的最简单方法是边缘列表。

于 2012-09-22T13:04:25.410 回答