我有一个距离的数据框
df<-data.frame(site.x=c("A","A","A","B","B","C"),
site.y=c("B","C","D","C","D","D"),Distance=c(67,57,64,60,67,60))
我需要将其转换为“dist”类的对象,但我不需要计算距离,因此我可以使用 dist() 函数。有什么建议吗?
没有什么能阻止您自己创建 dist 对象。它只是一个距离向量,具有设置标签、大小等的属性。
使用你的df
,这是如何
dij2 <- with(df, Distance)
nams <- with(df, unique(c(as.character(site.x), as.character(site.y))))
attributes(dij2) <- with(df, list(Size = length(nams),
Labels = nams,
Diag = FALSE,
Upper = FALSE,
method = "user"))
class(dij2) <- "dist"
或者您可以structure()
直接通过以下方式执行此操作:
dij3 <- with(df, structure(Distance,
Size = length(nams),
Labels = nams,
Diag = FALSE,
Upper = FALSE,
method = "user",
class = "dist"))
这些给出:
> df
site.x site.y Distance
1 A B 67
2 A C 57
3 A D 64
4 B C 60
5 B D 67
6 C D 60
> dij2
A B C
B 67
C 57 60
D 64 67 60
> dij3
A B C
B 67
C 57 60
D 64 67 60
注意:上面没有检查数据是否按正确的顺序。确保df
按照示例中的正确顺序输入数据;即在你运行我展示的代码之前进行site.x
排序。site.y
不久前我遇到了类似的问题并像这样解决了它:
n <- max(table(df$site.x)) + 1 # +1, so we have diagonal of
res <- lapply(with(df, split(Distance, df$site.x)), function(x) c(rep(NA, n - length(x)), x))
res <- do.call("rbind", res)
res <- rbind(res, rep(NA, n))
res <- as.dist(t(res))
?as.dist()
应该对您有所帮助,尽管它需要一个矩阵作为输入。
对于从谷歌进来的人...... reshape2 库中的 acast 函数对于这类东西来说更容易。
library(reshape2)
acast(df, site.x ~ site.y, value.var='Distance', fun.aggregate = sum, margins=FALSE)