我正在实现 Lambda 架构,分别对批处理层和速度层使用 spark 和 spark 流。到目前为止,我将批处理视图和实时视图都存储在 HBase 中,但存储在不同的表中。
我被困在如何合并批处理视图生成的批处理视图和速度层生成的实时视图,以便进行查询。怎么做才对?我是否应该将它们转储到同一个 HBase 表中,然后客户端直接查询 HBase?
我正在实现 Lambda 架构,分别对批处理层和速度层使用 spark 和 spark 流。到目前为止,我将批处理视图和实时视图都存储在 HBase 中,但存储在不同的表中。
我被困在如何合并批处理视图生成的批处理视图和速度层生成的实时视图,以便进行查询。怎么做才对?我是否应该将它们转储到同一个 HBase 表中,然后客户端直接查询 HBase?