3

我正在将一些 geojson 文件(大约 4000 ~ 5000 个多面特征)索引到 Elasticsearch 中。

这是映射

"mappings": {
       "properties": {
      "type": {
        "type": "keyword"
      },
      "properties": {
        "type": "object"
      },
      "geometry": {
        "type": "geo_shape"
      }
       }
    }

我的索引代码如下所示:

helpers.bulk(es, k, chunk_size=500, request_timeout=1000)

索引操作(在块中)被此错误消息停止:

{'type': 'mapper_parsing_exception', 'reason': 'failed to parse field [geometry] of type [geo_shape]', 'caused_by': {'type': 'illegal_argument_exception', 'reason': 'Unable to Tessellate shape

这个错误的原因是什么?
索引 geojson 文件时可以忽略此错误吗?

4

3 回答 3

4

我查看了这个问题,多边形是有效的,并发现了 Lucene tessellator 中的一个错误。我开了一个问题:

https://issues.apache.org/jira/browse/LUCENE-9417

修复在这里:

https://github.com/apache/lucene-solr/pull/1614

于 2020-06-30T09:02:08.927 回答
1

您的 geojson 在语法上是正确且有效的。现在您只需要确保正确索引您的多面体:

PUT demo_l08_bs
{
  "mappings": {
    "properties": {
      "geometry": {
        "type": "geo_shape"
      }
    }
  }
}

索引geojson而不改变任何东西:

POST demo_l08_bs/_doc
{
  "properties": {
    ...
  },
  "geometry": {
    "type": "MultiPolygon",
    "coordinates": [...]
  }
}

验证一个点位于其中:

GET demo_l08_bs/_search
{
  "query": {
    "geo_shape": {
      "geometry": {
        "shape": {
          "type": "point",
          "coordinates": [
            151.14646911621094,
            -33.68463933764522
          ]
        },
        "relation": "intersects"
      }
    }
  }
}

在此处输入图像描述

于 2020-06-08T10:26:33.500 回答
1

我不确定这个错误是否是由输入文件中的一些复杂的多边形引起的。

但是,在将多多边形转换为受以下帖子启发的单个多边形后,我设法摄取所有形状而没有任何错误:)

https://gist.github.com/mhweber/cf36bb4e09df9deee5eb54dc6be74d26

于 2020-07-30T05:35:40.863 回答