1

我正在使用 Happybase/python 从 hbase 获取数据,并且我已经使用了一些过滤,但现在由于某种原因它不起作用。

我的扫描代码过滤器是这样的:

f = "SingleColumnValueFilter ('input', '', =,'substring:{}')".format(keywork)
res = pTable.scan(reverse=True,limit=1000, filter= f.encode('utf-8'))

顺便说一句,现在这个input专栏有这样的记录:

"{'institution_id': '023', 'application_id': '01', 'channel_id...}"

问题是,如果我设置keyword为让我们说:

keywork = "instition_id"

它有效,但显然这不是我需要的,所以当将它与我正在寻找的值连接时:

keywork = "instition_id': '"+ my_value

我明白了thriftpy.transport.TTransportException: TTransportException(type=4, message='TSocket read 0 bytes')

经过新的测试,我得出结论认为问题出在单引号上,但我不知道为什么或如何解决它。我试过了keywork = "instition_id\': \'"keywork = 'instition_id\': \''都没有用。这可能是一些愚蠢的事情,但它让我发疯。

而且我正在考虑正则表达式,也许我会给它类似institution_id?: ?my_value的东西?告诉它任何角色都可以,但我对正则表达式一无所知,所以......

4

1 回答 1

1

你想到了正则表达式的好处,我不知道为什么即使转义引号它也不起作用(我希望知道的人会向我们解释),但这里有一些东西可以让你继续前进:

f = "SingleColumnValueFilter ('input', '', =,'regexstring:.*institution_id.: ." + your_value + ".*')"

表示.任何字符,因此这次引号不会触发错误。我也是正则表达式的初学者,所以我希望任何人都能改进、编辑该行。

于 2019-07-12T14:31:29.620 回答