0

我是地理空间领域的新手,我已经设法添加geomesa-spark-jst到项目中,使我能够使用地理空间功能。

我需要通过数百万个地理编码事件 ( eventRdd) 并根据自定义标准查看它们是否在距离路段线串 ( roadSegmentRdd) 一定距离内。

目前,对于每个事件,我都需要检查整个事件roadSegmentRdd,看看是否满足标准,这根本不是最优的。

如何使用 geomesa 和索引来加快查询速度?最少需要的依赖项是什么?

4

1 回答 1

1

通常,您希望至少将您的点数据提取到 GeoMesa 数据存储中,然后您可以根据空间谓词进行查询,以有效地过滤到您感兴趣的那些。

GeoMesa 有几个不同的数据存储选项可供您使用,从像 HBase 这样的完全分布式数据库到基于文件系统的轻量级解决方案。最好的将取决于您的性能要求和可用的基础架构。这里有关于不同数据存储的更多信息,这里有 Spark 的具体细节。

摄取数据后,您可以尝试此处此处列出的连接方法之一,具体取决于您的路段 RDD 的大小。

于 2018-05-21T14:06:23.337 回答