3

我正在尝试解析Well Known Binary地理信息系统 (GIS) 中使用的几何对象的二进制编码。我正在使用ESRI 的这个规范这里的结果与 esri相同)。我从Osmosis输入数据,这是一个解析 OpenStreetMap 数据的工具,特别是pgsimp-dump 格式,它给出了二进制的十六进制表示。

ESRI 文档说 a 应该只有 21 个Point字节,字节顺序应该只有 1 个字节,typeid 应该只有 4 个字节,typeid 应该只有 8 个字节,double x 应该有 8 个字节,double y 应该只有 8 个字节。

osmosis 的一个例子是这个(十六进制)例子:0101000020E6100000DB81DF2B5F7822C0DFBB7262B4744A40,它有 25 个字节长。

Shapely一个解析 WKB(等)的 Python 程序,它基于流行的 C 库GEOS 能够解析这个字符串:

>>> import shapely.wkb
>>> shapely.wkb.loads("0101000020E6100000DB81DF2B5F7822C0DFBB7262B4744A40", hex=True)
<shapely.geometry.point.Point object at 0x7f221f2581d0>

当我要求 Shapely 解析然后转换为 WKB 时,我得到 21 个字节。

>>> shapely.wkb.loads("0101000020E6100000DB81DF2B5F7822C0DFBB7262B4744A40", hex=True).wkb.encode("hex").upper()
'0101000000DB81DF2B5F7822C0DFBB7262B4744A40'

不同的是中间的 4 个字节,对于 typeif=d 出现 3 个字节进入 uint32

01010000**20E61000**00DB81DF2B5F7822C0DFBB7262B4744A40

当 WKB 无效时,为什么 shapely/geos 可以解析这个 WKB?这些字节是什么意思?

4

1 回答 1

5

GEOS / Shapely 使用称为 EWKT / EWKB 的 WKT/WKB 的扩展变体,由 PostGIS记录。如果您有权访问 PostGIS,您可以看到这里发生了什么:

SELECT ST_AsEWKT('0101000020E6100000DB81DF2B5F7822C0DFBB7262B4744A40'::geometry);

返回 EWKT SRID=4326;POINT(-9.2351011 52.9117549)。所以额外的数据是空间参考标识符,或 SRID。特别是 WGS 84 的EPSG:4326

Shapely不支持 SRID,但是有一些技巧,例如:

from shapely import geos
geos.WKBWriter.defaults['include_srid'] = True

现在应该制作wkbwkb_hex输出 EWKB,其中包括 SRID。默认值为False,它将输出 2D 几何的 ISO WKB(但不用于 3D)。

因此,您的目标似乎是将 EWKB 转换为 ISO WKB,您可以使用 GEOS / Shapely 仅对 2D 几何进行此操作。如果您有 3D(Z 或 M)或 4D(ZM)几何图形,则只有 PostGIS 能够进行此转换。

于 2015-04-09T20:33:56.010 回答