3

我必须计算训练数据和测试数据之间的欧几里得距离。train数据的总长度为1389,测试数据为364。基本上是美国邮政信封上手写邮政编码的数据,从“Elements of Statistical learning”网站下载。

我是初学者,只是阅读 R 包中的数据。我无法开始计算火车和测试数据之间的距离。谁能帮我告诉我如何为这些数据生成一个循环?

我会很感激的。

4

1 回答 1

6

对于欧几里得距离,我喜欢rdistfields包中使用。dist该软件包的一个优点stats是它可以将两个矩阵作为输入:

train.data <- matrix(runif(1389*2), ncol = 2)
test.data  <- matrix(runif(364*2),  ncol = 2)

library(fields)
distances <- rdist(train.data, test.data)
dim(distances)
# [1] 1389  364
于 2012-04-19T02:31:46.377 回答