我有一个关于在列表的每个元素上应用函数的问题。
这是我的问题:
我有一个 DF 列表(我按天划分了一个更大的 DF):
mydf <- data.frame(x=c(1:5), y=c(21:25),z=rnorm(1:5))
mylist <- rep(list(mydf),5)
names(mylist) <-c("2006-01-01","2006-01-02","2006-01-03","2006-01-04","2006-01-05")
如果它相同,请不要关心这个假数据),它只是为了示例。对于列表的每个 DF,我在列“z”中的结果,以及代表一些空间坐标的其他 2 列“x”和“y”。
我还有另一个包含“x”和“y”列表的独立 DF,代表一些特定区域(想象 10 个区域):
region <- data.frame(x=c(1:10),y=c(21:30),region=c(1:10))
最终目标是每 10 个区域都有一个值“z”(我的结果),距离我列表中每个 DF 的最近点(根据坐标)。这意味着对于一个区域:来自我列表的 DF1 的 10 个结果“z”,然后来自 DF2 的 10 个其他结果“z”,......如果可能的话,我的最终 DF 应该看起来像这样(对于结构):
final1 <- data.frame("2006-01-01"=rnorm(1:10),"2006-02-01"=rnorm(1:10),
"2006-03-01"=rnorm(1:10),"2006-04-01"=rnorm(1:10),"2006-05-01"=rnorm(1:10))
一天一列(因此列表的一个 DF)和每行一个值(例如对于 2006-01-01:距第一个区域最近的点的值“z”)。
我已经有一个小函数来寻找最接近的值:
min.dist <- function(p, coord){
which.min( colSums((t(coord) - p)^2) )
}
然后,我试图制作一个循环来获得我想要的东西,但我对列表有困难。我需要将 2 个变量放入循环中,但它不起作用。
如果我只取列表中的 1 个 DF,这大约可以工作:
for (j in 1:nrow(region)){
imin <- min.dist(c(region[j,1],region[j,2]),mylist[[1]][,1:2])
imin[j] <- min.dist(c(region[j,1],region[j,2]),mylist[[1]][,1:2])
final <- mylist[[1]][imin[j], "z"]
final[j] <- mylist[[1]][imin[j], "z"]
final <- as.data.frame(final)
}
但是,如果我选择我的整个列表(为了在对象“final”中为列表的每个 DF 提供一列结果),我就会出错。
我认为第一个问题是“区域”的长度与我的列表长度不同,第二个问题可能是为我的列表长度添加第二个变量。我对循环不是很熟悉,所以对 2 变量循环也不是很熟悉。
你能帮我在循环中改变什么应该改变以获得我正在寻找的东西吗?
非常感谢你!