7

给定矩阵,

df <- read.table(text="
 X1 X2 X3 X4 X5
  1  2  3  2  1
  2  3  4  4  3
  3  4  4  6  2
  4  5  5  5  4
  2  3  3  3  6
  5  6  2  8  4", header=T)

我想创建一个距离矩阵,其中包含每列每行之间的绝对平均差。例如,和之间的距离X1应该X3是= 1.67,因为:

abs(1 - 3) + abs(2-4) + abs(3-4) + abs(4-5) + abs(2-3) + abs(5-2) = 10 / 6 = 1.67

我尝试过以这种方式使用designdist()vegan 包中的函数:

designdist(t(df), method = "abs(A-B)/6", terms = "minimum")

第 1 列和第 3 列的结果距离为 0.666。这个函数的问题是它把每一列中的所有值相加,然后减去它们。但是我需要将每行之间的绝对差异(单独,绝对)相加,然后将其除以 N。

4

1 回答 1

5

这是一个单行解决方案。它利用dist()'smethod参数来计算data.frame 中每对列之间的L1 范数,也就是城市街区距离,也就是曼哈顿距离。

as.matrix(dist(df, "manhattan", diag=TRUE, upper=TRUE)/nrow(df))

为了使其可重现:

df <- read.table(text="
 X1 X2 X3 X4 X5
  1  2  3  2  1
  2  3  4  4  3
  3  4  4  6  2
  4  5  5  5  4
  2  3  3  3  6
  5  6  2  8  4", header=T)

dmat <- as.matrix(dist(df, "manhattan", diag=TRUE, upper=TRUE)/nrow(df))
print(dmat, digits=3)
#      1     2     3    4     5    6
# 1 0.00 1.167 1.667 2.33 1.333 3.00
# 2 1.17 0.000 0.833 1.17 0.833 2.17
# 3 1.67 0.833 0.000 1.00 1.667 1.67
# 4 2.33 1.167 1.000 0.00 1.667 1.33
# 5 1.33 0.833 1.667 1.67 0.000 2.33
# 6 3.00 2.167 1.667 1.33 2.333 0.00
于 2012-05-22T17:52:42.983 回答