为了创建索引,Geomesa 在 HBase 中创建了多个表。我有几个问题:
- Geomesa 做了什么来确保这些表同步?
- 如果索引表不同步,对 Geomesa 查询有何影响?
- 如果 Geomesa 无法写入其中一个索引表,会发生什么(使用 write 调用)?
- 表之间的同步是最好的努力还是 Geomesa 确保数据的可用性具有最终的一致性?
我计划使用 Geomesa 和 Hbase(由 S3 支持)组合来存储我的地理空间数据;数据大小可以增长到 TB 到 PB。
我正在调查 Geomesa 在主表和索引表之间的同步方面有多可靠?
HBase 表:
catalog1
catalog1_node_id_v4(主表)
catalog1_node_z2_geom_v5(索引表)
catalog1_node_z3_geom_lastUpdateTime_v6(索引表)
catalog1_node_attr_identifier_geom_lastUpdateTime_v8(索引表)
Geomesa 模式
geomesa-hbase describe-schema -c catalog1 -f 节点
信息描述特征“节点”的属性
关键 | 字符串
命名空间 | 字符串
标识符 | 字符串(属性索引)
versionId | 字符串
节点 ID | 字符串
纬度 | 整数经度 | 整数上次更新时间 | 日期(时空索引)
标签 | 地图
几何 | 点(时空索引)(空间索引)
用户数据:geomesa.index.dtg | lastUpdateTime
geomesa.indices | z3:6:3:geom:lastUpdateTime,z2:5:3:geom,id:4:3:,attr:8:3:identifier:geom:lastUpdateTime