我需要根据特定列的值中的子字符串对 HBase 数据库中的行进行分组。
该列中的值的格式如下:
[text1]_[text2]_[text3]
例子:
row1: abc_aaa_ababab
row2: abc_aaa_cdcdcd
row3: abc_bbb_fgfgfg
row4: def_ccc_ababab
row5: hij_ccc_jkjkjk
如何列出 [text2] 的所有可能值(例如 aaa、bbb 和 ccc)?
我没有必要一次性检索每一行的所有列。向用户呈现各种 [text2] 并且当他选择“bbb”时,仅检索具有“bbb”的行。我在想我可以使用 FuzzyRowFilter 来做后面的部分。
但我不确定如何列出 [text2] 的值。可以通过使用现有过滤器、自定义过滤器或其他方法来完成吗?
注意:数据库模式是由客户创建的 - 可以更改,但过程繁琐。因此,与使用概述的架构相比,重新设计架构的建议很有价值,但次要。