3

相当于 %like% 的 python 的 data.table 是什么?

简短的例子:

dt_foo_bar = dt.Frame({"n": [1, 3], "s": ["foo", "bar"]})  
dt_foo_bar[re.match("foo",f.s),:] #works to filter by "foo"

我曾期望这样的事情会起作用:

dt_foo_bar[re.match("fo",f.s),:] 

但它返回“预期的字符串或类似字节的对象”。我很想开始在 Python 中使用新的 data.tables 包,就像在 R 中使用它一样,但我更多地使用文本数据而不是数字数据。

提前致谢。

4

1 回答 1

5

从 0.9.0 版开始,数据表包含.re_match()执行正则表达式过滤的函数。例如:

>>> import datatable as dt
>>> dt_foo_bar = dt.Frame(N=[1, 3, 5], S=["foo", "bar", "fox"])
>>> dt_foo_bar[dt.f.S.re_match("fo."), :]
     N  S  
--  --  ---
 0   1  foo
 1   5  fox

[2 rows x 2 columns]

通常,.re_match()应用于列表达式并生成一个新的布尔列,指示每个值是否与给定的正则表达式匹配。

于 2019-03-06T20:13:56.543 回答