7

我创建了一个包含 6 列的 data.table。我的 data.table 有一列比较两个位置:位置 1 和位置 2。我正在尝试使用 distm 函数计算每行位置之间的距离,创建第 7 列。geosphere 包中的 distm 包需要两个不同的向量来计算每个纬度/经度组合。我下面的代码不起作用,所以我试图弄清楚如何为函数提供向量。

LOC_1_ID LOC1_LAT_CORD LOC1_LONG_CORD LOC_2_ID LOC2_LAT_CORD LOC2_LONG_CORD
 1       35.68440        -80.48090        70624    34.86752   -82.46632
 6       35.49770        -80.62870        70624    34.86752   -82.46632
10       35.66042        -80.50053        70624    34.86752   -82.46632

假设 res 保存 data.table 下面的代码不起作用。

 res[,DISTANCE := distm(c(LOC1_LAT_CORD, LOC1_LONG_CORD),c(LOC2_LAT_CORD, LOC2_LONG_CORD), fun=distHaversine)*0.000621371]

如果我要拉出每个向量,则该函数可以正常工作。

loc1 <- res[LOC1_ID == 1,.(LOC1_LAT_CORD, LOC1_LONG_CORD)]
loc2 <- res[LOC2_ID==70624,.(LOC2_LAT_CORD, LOC2_LONG_CORD)]
distm(loc1, loc2, fun=distHaversine)

真的,我的问题是当该函数需要向量作为参数时,如何应用函数来选择 data.table 中的列。

4

1 回答 1

10

distm函数生成一组点的距离矩阵。如果您只是比较每一行上的点并添加一列,您确定这是您想要的功能吗?

听起来你实际上想要distHaversine要么distGeo

library(data.table)
library(geosphere)

dt <- read.table(text = "LOC_1_ID LOC1_LAT_CORD LOC1_LONG_CORD LOC_2_ID LOC2_LAT_CORD LOC2_LONG_CORD
1       35.68440        -80.48090        70624    34.86752   -82.46632
6       35.49770        -80.62870        70624    34.86752   -82.46632
10       35.66042        -80.50053        70624    34.86752   -82.46632", header = T)

setDT(dt)
dt[, distance_hav := distHaversine(matrix(c(LOC1_LONG_CORD, LOC1_LAT_CORD), ncol = 2),
                                   matrix(c(LOC2_LONG_CORD, LOC2_LAT_CORD), ncol = 2))]

#     LOC_1_ID LOC1_LAT_CORD LOC1_LONG_CORD LOC_2_ID LOC2_LAT_CORD LOC2_LONG_CORD distance_hav
# 1:        1      35.68440      -80.48090    70624      34.86752      -82.46632     202046.3
# 2:        6      35.49770      -80.62870    70624      34.86752      -82.46632     181310.0
# 3:       10      35.66042      -80.50053    70624      34.86752      -82.46632     199282.1

更新:这个答案给出了一个更有效的版本,distHaversine用于data.table

于 2016-04-27T23:29:23.720 回答