4

我正在做一个聚类任务,我有一个距离矩阵。我希望将此距离矩阵可视化为二维图。请让我知道是否有任何方法可以在线或使用 R 或 python 等编程语言进行操作。我的距离矩阵如下, 在此处输入图像描述 我使用了经典的多维缩放功能(在 R 中)并获得了一个 2D 图,如下所示:在此处输入图像描述 但我正在寻找的是一个图,其中节点和加权边在它们之间运行。

4

4 回答 4

10

可能性 1

我假设您需要一个二维图,其中节点位置之间的距离与您的 table 提供的距离相同

在python中,您可以networkx用于此类应用程序。一般来说,有很多方法可以做到这一点,记住,它们都只是近似值(因为一般来说,鉴于它们的成对距离,不可能创建点的二维表示)它们是某种应力最小化(或能量-minimization) 近似,试图找到与所提供的距离相似的“合理”表示。

作为示例,您可以考虑一个四点示例(应用了正确的离散度量):

     p1 p2 p3 p4
  ---------------
  p1  0  1  1  1
  p2  1  0  1  1
  p3  1  1  0  1
  p4  1  1  1  0

通常,绘制实际的“图形”是多余的,因为您已经完全连接了一个(每对节点都已连接),因此仅绘制点就足够了。

Python 示例

import networkx as nx
import numpy as np
import string

dt = [('len', float)]
A = np.array([(0, 0.3, 0.4, 0.7),
               (0.3, 0, 0.9, 0.2),
               (0.4, 0.9, 0, 0.1),
               (0.7, 0.2, 0.1, 0)
               ])*10
A = A.view(dt)

G = nx.from_numpy_matrix(A)
G = nx.relabel_nodes(G, dict(zip(range(len(G.nodes())),string.ascii_uppercase)))    

G = nx.to_agraph(G)

G.node_attr.update(color="red", style="filled")
G.edge_attr.update(color="blue", width="2.0")

G.draw('distances.png', format='png', prog='neato')

在 R 中,您可以尝试多维缩放

# Classical MDS
# N rows (objects) x p columns (variables)
# each row identified by a unique row name

d <- dist(mydata) # euclidean distances between the rows
fit <- cmdscale(d,eig=TRUE, k=2) # k is the number of dim
fit # view results

# plot solution 
x <- fit$points[,1]
y <- fit$points[,2]
plot(x, y, xlab="Coordinate 1", ylab="Coordinate 2", 
  main="Metric  MDS",    type="n")
text(x, y, labels = row.names(mydata), cex=.7)

可能性 2

您只想绘制带有标记边缘的图形

再次,networkx可以帮助:

import networkx as nx   

# Create a graph
G = nx.Graph()

# distances
D = [ [0, 1], [1, 0] ]

labels = {}
for n in range(len(D)):
    for m in range(len(D)-(n+1)):
        G.add_edge(n,n+m+1)
        labels[ (n,n+m+1) ] = str(D[n][n+m+1])

pos=nx.spring_layout(G)

nx.draw(G, pos)
nx.draw_networkx_edge_labels(G,pos,edge_labels=labels,font_size=30)

import pylab as plt
plt.show()
于 2013-09-20T09:20:05.033 回答
2

您没有提到是否需要二维图。我想你想在二维上构建一个图表,因为你需要它来进行可视化。考虑到您必须意识到,对于大多数图表来说,这根本是不可能的。

可以做的是以某种方式近似距离矩阵中的值,例如具有相对较小边缘的小值和具有相对大长度的大值。

考虑到所有先前的考虑,一个选项是graphviz。请参阅neato 函数。一般来说,您感兴趣的是力导向绘图。请参阅维基百科以获取更多参考。

于 2013-09-20T09:27:28.143 回答
2

多维缩放(MDS) 正是您想要的。有关更多信息,请参见此处此处

于 2013-09-22T15:21:56.633 回答
0

您可以使用 d3js Force Directed Graph 并配置节点之间的距离。d3js 强制布局具有一些集群能力,可以将具有相似距离的节点分开。这是一个将值作为节点之间距离的示例:

http://vida.io/documents/SyT7DRedQmGSpsBkK

另一种可视化方法是在节点之间使用相同的距离,但线的粗细不同。在这种情况下,您需要根据值计算笔划宽度:

.style("stroke-width", function(d) { return Math.sqrt(d.value / 50); });
于 2013-09-21T07:11:19.597 回答