0

我有以下英国的边界数据集,其中显示了所有县:

library(raster)
library(sp)
library(ggplot)

# Download the data
GB <- getData('GADM', country="gbr", level=2)

使用该subset功能可以很容易地通过数据中的属性过滤 shapefile 多边形。例如,如果我想排除北爱尔兰:

GB_sub <- subset(UK, NAME_1 != "Northern Ireland")

但是,有很多小岛会扭曲比例数据范围,如下图所示:

在此处输入图像描述

关于如何以最小尺寸优雅地对数据集进行子集化有什么想法吗?具有与子集参数一致的格式将是理想的。例如:

GB_sub <- subset(UK, Area > 20) # specify minimum area in km^2
4

2 回答 2

1

这是另一个潜在的解决方案。因为你的数据是经纬投影,直接根据经纬度计算面积会产生偏差,最好根据geosphere包中的函数计算面积。

install.packages("geosphere")
library(geosphere)

# Calculate the area
GB$poly_area <- areaPolygon(GB) / 10^6

# Filter GB based on area > 20 km2
GB_filter <- subset(GB, poly_area > 20)

poly_area包含所有多边形的面积(以 km2 为单位)。我们可以按阈值过滤多边形,例如20在您的示例中。GB_filter是最终的输出。

于 2017-11-02T15:37:21.993 回答
1

这是一种潜在的解决方案:

GB_sub = GB[sapply(GB@polygons, function(x) x@area>0.04),] # select min size
map.df <- fortify(GB_sub)
ggplot(map.df, aes(x=long, y=lat, group=group)) + geom_polygon()

查看此链接以了解有关 km2 大小的实际解释的详细信息:Getting a slot's value of S4 objects?

我也比较了两者,但它们似乎没有什么不同:

out1 = sapply(GB@polygons, function(x) x@area)
out2 = rgeos::gArea(GB, byid=TRUE)
于 2017-11-02T15:31:59.360 回答