r - 使用过多内存从 {raster} 包中提取

Question

我一直在使用包中的extract函数来raster使用 shapefile 定义的区域从光栅文件中提取数据。但是，我遇到了这个过程现在需要的内存量问题。我确实有大量的 shapefile（~1000）。光栅文件很大（~1.6gb）

我的流程是：

shp <- mclapply(list.files(pattern="*.shp",full.names=TRUE), readShapePoly,mc.cores=6)
ndvi <- raster("NDVI.dat")
mc<- function(y) {
temp <- gUnionCascaded(y)
extract <- extract(ndvi,temp)
mean <- range(extract, na.rm=T )[1:2]
leng <- length(output)
}
output <- lapply(shp, mc)

我可以进行任何更改以减少内存负载吗？我尝试加载更少的 shapefile，这些文件在内存再次飙升之前工作了大约 5 分钟。它是一台 2.4GHz 的四核计算机，带有 8GB 内存

score 4 · Accepted Answer

我会这样做（未经测试）：

## Clearly we need these packages, and their dependencies
library(raster)
library(rgeos)
shpfiles <- list.files(pattern="*.shp",full.names=TRUE)
ndvi <- raster("NDVI.dat")
## initialize an object to store the results for each shpfile
res <- vector("list", length(shpfiles))
names(res) <- shpfiles
## loop over files
for (i in seq_along(shpfiles)) {
  ## do the union
  temp <- gUnionCascaded(shpfiles[i])
  ## extract for this shape data (and don't call it "extract")
  extracted <- extract(ndvi,temp)
  ## further processing, save result
  mean <- range(extracted, na.rm = TRUE )[1:2]
  res[[i]] <- mean  ## plus whatever else you need
}

完全不清楚上面 mc() 的返回值是什么意思，所以我忽略它。这将比您最初尝试的内存效率和速度要快得多。我怀疑这里是否值得使用并行的东西。

r - 使用过多内存从 {raster} 包中提取

1 回答 1

Related

Reference