我必须每月在 HBase 表中存储有关实体的信息。我想处理迄今为止使用 mapreduce 逻辑的实体可用的所有月份详细信息。我很困惑是否为 HBase 表选择高窄或平宽设计。
使用平面宽方法,实体 ID 将保留为行键,月份 id 作为列限定符,详细信息作为限定符值。在 HBase-mapreduce 中,我可以获取地图和进程中实体的所有详细信息。
Tall-narrow 方法将存储行键作为实体 id 和月份的组合。此外,详细信息将存储在单独的列中。在 HBase -mapreduce 中,我必须在 map 中获取实体的详细信息,并在 reducer 中汇总所有月份的详细信息。
哪种方法更好并产生更好的性能?提前致谢。