3

我有一个关于使用距离矩阵进行聚类的问题,但很稀疏。

是否存在不扩展矩阵并且可以与稀疏表示一起使用的稀疏距离对象格式?

目前我正在做以下事情

# read sparse matrix
sparse <- readMM('sparse-matrix')
distance <- as.dist(sparse)

sparse-matrix 已经是正确的距离矩阵,它对于未连接的条目具有 NA。

>sparse
[1,] . . .
[2,] 1 . .
[3,] 1 . .

> as.dist(sparse)
1 2
2 1  
3 1 0

但是用 as.dist 转换它失败了

asMethod(object) 中的错误:不允许负长度向量

大概是因为它将矩阵扩展为完整的形式。矩阵 (NxN) 大小为 N = 49281 这种格式是需要的(dist 对象),例如 hclust 方法

R帮助列表上没有任何答案的类似问题

4

1 回答 1

-5

距离矩阵如何稀疏?每两个物体之间都有一个距离,所以它实际上是一个非常密集的矩阵。然而,三角矩阵足以描述相互距离(如D = D ')。这实际上是由 生成的对象的情况dist

如果距离矩阵是稀疏的,因为很多对象都是相同的,那么您可能只想计算唯一对象的距离矩阵。

于 2013-04-09T19:55:34.157 回答