我在表格中有一列标题,并且想删除单独表格/向量中列出的所有单词。
例如,标题表:
“Lorem ipsum dolor”
“sit amet, consectetur adipiscing”
“elit, sed do eiusmod tempor”
“incidudunt ut labore”
“et dolore magna aliqua”。
待删除:c("Lorem", "dolore", "elit")
输出:
“ipsum dolor”
“sit amet, consectetur adipiscing”
“, sed do eiusmod tempor”
“incidudunt ut labore”
“et magna aliqua”。
列入黑名单的单词可能会出现多次。
tm 包具有此功能,但在应用于 wordcloud 时。我需要的是保持列完好无损,而不是将所有行连接成一个字符串。当给定一组值作为模式时,正则表达式函数 (gsub()) 似乎不起作用。Oracle SQL 解决方案也很有趣。