假设我有一个像
term cnt
apple 10
apples 5
a apple on 3
blue pears 3
pears 1
我如何过滤此列中的所有部分找到的字符串,例如得到结果
term cnt
apple 10
pears 1
没有指出我要过滤哪些术语(苹果|梨),而是通过自引用方式(即,它确实针对整个列检查每个术语并删除部分匹配的术语)。令牌的数量没有限制,字符串的一致性也没有限制(即“mapples”将与“apple”匹配)。这将导致一个倒置的基于 dplyr 的版本
d[grep("^apple$|^pears$", d$term), ]
此外,有趣的是使用这种分离来获得累积总和,例如
term cnt
apple 18
pears 4
我无法让它与 contains() 或 grep() 一起使用。
谢谢