0

我需要根据特定列的值中的子字符串对 HBase 数据库中的行进行分组。

该列中的值的格式如下:

[text1]_[text2]_[text3]

例子:

row1: abc_aaa_ababab
row2: abc_aaa_cdcdcd  
row3: abc_bbb_fgfgfg  
row4: def_ccc_ababab  
row5: hij_ccc_jkjkjk

如何列出 [text2] 的所有可能值(例如 aaa、bbb 和 ccc)?

我没有必要一次性检索每一行的所有列。向用户呈现各种 [text2] 并且当他选择“bbb”时,仅检索具有“bbb”的行。我在想我可以使用 FuzzyRowFilter 来做后面的部分。

但我不确定如何列出 [text2] 的值。可以通过使用现有过滤器、自定义过滤器或其他方法来完成吗?

注意:数据库模式是由客户创建的 - 可以更改,但过程繁琐。因此,与使用概述的架构相比,重新设计架构的建议很有价值,但次要。

4

1 回答 1

0

使用此模式将非常低效,因为您需要对每次搜索进行全表扫描。

我会添加一个表,其中包含所有可能的子字符串到行 ID 的映射

于 2013-04-07T19:16:52.733 回答